A16z ha appena definito le linee guida su come devono operare gli agenti di dati. Ecco perché Jean-Paul di SnapLogic le stava già applicando prima ancora che l'inchiostro si fosse asciugato.
Il team di Andreessen Horowitz (a16z) ha recentemente pubblicato un articolo molto interessante intitolato«Your Data Agents Need Context».Se sei responsabile di iniziative relative ai dati, all'analisi o all'intelligenza artificiale nella tua organizzazione e non l'hai ancora letto, fermati qui e fallo. Si tratta di una delle spiegazioni più chiare del perché la prima ondata di agenti di dati aziendali abbia in gran parte fallito e di come si configuri una seconda ondata, più avanzata.
In breve: collegare un modello linguistico di grandi dimensioni a un data warehouse non è sufficiente. Ciò che distingue un agente di dati che inventa cifre di fatturato da uno in grado di rispondere in modo affidabile a una domanda del tipo: «Perché la pipeline EMEA è scesa del 12% nell’ultimo trimestre?», è il contesto. La logica aziendale accumulata, il know-how aziendale e i metadati dinamici rendono i dati significativi per gli esseri umani, ma non sono mai stati codificati in modo sistematico per le macchine.
Ci siamo ritrovati ad annuire con convinzione a ogni paragrafo. Non perché fosse una novità per SnapLogic, ma perché descriveva con precisione le scelte architetturali che avevamo adottato nella progettazione di Jean-Paul, il nostro agente di integrazione e analisi nativo per l'IA. Due settimane fa, in occasione del nostro evento pubblico Agent Fest, abbiamo presentato Jean-Paul al mondo. L'articolo di a16z è stato pubblicato poco dopo. La tempistica non ci è sembrata una coincidenza, ma piuttosto una conferma.
«La maggior parte degli agenti di dati fallisce a causa di flussi di lavoro poco flessibili, della mancanza di apprendimento contestuale e di un disallineamento con le operazioni quotidiane.»
Andreessen Horowitz (a16z),«I tuoi agenti dei dati hanno bisogno di contesto»(2026)
A questa analisi aggiungeremmo una sola parola: «in modo permanente». La maggior parte degli agenti ha fallito e continuerà a fallire finché il problema di contesto non verrà risolto a livello di piattaforma, e non come un ripensamento aggiunto a posteriori dopo l'implementazione.
Il piano in cinque fasi e il ruolo che Jean-Paul vi ricopre
A16z ha delineato un'architettura in cinque fasi per un livello contestuale moderno abbinato a un sistema di dati agentico. Proviamo a confrontarla in modo onesto e specifico con ciò che fa oggi Jean-Paul.
1. Accedere ai dati giusti
A16z definisce tutto questo un "requisito minimo": rendere accessibili tutti i dati rilevanti, comprese le fonti esterne al data warehouse, come Google Drive, Slack, i sistemi interni e gli archivi di conoscenze aziendali.
Jean-Paul si integra nativamente con la piattaforma di integrazione di SnapLogic, che riunisce già centinaia di fonti di dati. Quando un responsabile dei dati pone una domanda, JP non si limita a interrogare un unico punto. Esplora l'intero patrimonio di dati collegati dell'organizzazione, comprese le fonti non strutturate, attraverso un unico ciclo di agenti.
Jean-Paul: accesso nativo a più fonti
2. Costruzione automatica del contesto
È possibile estrarre automaticamente il contesto ad alto segnale:
- La cronologia delle query mostra le tabelle consultate più di frequente
- I modelli DBT e LookML forniscono definizioni delle metriche
- I metadati dello schema chiariscono i join
Jean-Paul fa proprio questo: la nostra competenza analitica su BigQuery acquisisce la documentazione dello schema, i modelli di query precedenti e le descrizioni dei set di dati prima di eseguire qualsiasi query. Non lasciamo che il modello di linguaggio di grandi dimensioni (LLM) debba tirare a indovinare. Abbiamo integrato nell'architettura dell'agente una disciplina obbligatoria basata sullo schema.
Jean-Paul: approccio "schema-first", query basate sui dati
3. Raffinamento umano
Il contesto automatizzato non può cogliere ogni aspetto. La logica aziendale più cruciale è condizionale, dipende dal contesto storico e risiede esclusivamente nella mente delle persone. Ad esempio: «utilizzare Salesforce per i lead globali prima del 2025, ma Affinity per le trattative USCAN a partire dal 2025».
A16z paragona questa situazione agli sviluppatori che gestiscono i file .cursorrules. Jean-Paul mette a disposizione questo tipo di livello di configurazione, consentendo ai professionisti dei dati e agli amministratori di definire regole, avvertenze ed eccezioni che determinano ogni successiva interazione dell'agente. Il contesto non è statico. È curato.
Jean-Paul: livello delle regole configurabili
4. Connessione dell'agente tramite API o MCP
Il livello di contesto funziona solo se è accessibile agli agenti in tempo reale. A16z identifica le API e l'MCP (Model Context Protocol) come i due modelli standard di esposizione. Jean-Paul si basa su entrambi.
Rende disponibili tutte le funzionalità di integrazione e analisi di SnapLogic in qualità di server MCP, il che significa che qualsiasi client IA compatibile con MCP (tra cui Claude, Cursor e agenti di terze parti) può utilizzare gli strumenti arricchiti dal contesto di Jean-Paul senza dover ricreare da zero il livello contestuale. Una piattaforma, tanti client agenti.
Jean-Paul: server nativo MCP
5. Flussi contestuali ad aggiornamento automatico
Questo è l'aspetto che ci entusiasma di più, perché lo stiamo completando proprio in questo momento. I sistemi di dati non sono mai statici. Gli schemi cambiano. Le regole aziendali si evolvono. Gli agenti commettono errori che devono essere corretti a livello del contesto.
A16z lo descrive come un «corpus vivo e in continua evoluzione». Il flusso contestuale ad aggiornamento automatico di Jean-Paul è nelle fasi finali di sviluppo ed è stato progettato specificamente per gestire le modifiche apportate al data warehouse a monte, compresi i nostri recenti aggiornamenti strutturali al DWH. Quando il data warehouse cambia, il livello contestuale si adegua di conseguenza. Non è richiesto alcun intervento manuale.
Jean-Paul: contesto autorigenerante (in fase di sviluppo)
Perché questo è importante proprio ora per i responsabili della gestione dei dati
A16z suddivide il mercato emergente in tre categorie:
- Piattaforme di "data gravity" (Snowflake, Databricks) che stanno integrando funzionalità di contestualizzazione nelle infrastrutture esistenti
- Strumenti avanzati di analisi dei dati basati sull'intelligenza artificiale che integrano il contesto a posteriori
- Una nuova categoria di specialisti dedicati al livello contestuale che sviluppano soluzioni partendo da zero
A nostro avviso esiste una quarta posizione, forse la più sostenibile: la piattaforma di integrazione che funge già da collante tra i sistemi.
SnapLogic non ha bisogno di sviluppare nuovi connettori per accedere al vostro ERP, CRM, data lake e ai database operativi. Li abbiamo già. Il livello contestuale non è un elemento che stiamo aggiungendo. È la naturale estensione di ciò che una piattaforma di integrazione aziendale fa quando diventa nativa per l'IA.
L'intuizione che i responsabili dei dati devono interiorizzare: il contesto non si può acquistare già pronto. Non è possibile ottenerlo semplicemente manipolando i prompt. Il contesto è una risorsa organizzativa che deve essere costruita, curata e costantemente mantenuta dai team che conoscono il business. Jean-Paul fornisce l'infrastruttura necessaria per farlo in modo sistematico.
3 consigli pratici per la tua strategia in materia di dati e intelligenza artificiale
1. Smettete di valutare gli agenti di dati sulla base di query di prova
È facile rispondere correttamente alla domanda “Fatturato dell’ultimo trimestre” in un ambiente controllato. La vera sfida consiste nel gestire, in condizioni reali, richieste ambigue, trasversali ai sistemi e cruciali per l’azienda: “Quali segmenti di clientela stanno registrando risultati inferiori alle previsioni e quali sono le cause?” Ciò richiede un contesto adeguato in ogni fase. Valutate gli operatori su questa base.
2. Considerare il contesto come un'infrastruttura, non come un prompt
I team che ottengono risultati positivi con gli agenti di dati non sono quelli che scrivono i prompt di sistema più ingegnosi. Sono invece quelli che investono nell'integrazione della logica di business in un livello contestuale solido e aggiornabile, in grado di sopravvivere a qualsiasi versione specifica di un modello LLM. Si tratta di un problema di ingegneria dei dati, non di intelligenza artificiale.
3. Prevedere eventuali cambiamenti di contesto fin dal primo giorno
A16z ha ragione quando afferma che un contesto in grado di aggiornarsi autonomamente non è un optional, ma un requisito fondamentale per la sopravvivenza. Un livello contestuale statico rappresenta un ostacolo. Gli schemi dei dati cambiano ogni trimestre. Le definizioni aziendali evolvono. Si verificano fusioni. Le organizzazioni che instaurano fin da ora una disciplina di manutenzione del contesto godranno di vantaggi crescenti man mano che i loro agenti accumuleranno conoscenza istituzionale nel corso del tempo.
In programma: Gartner D&A, 11-13 maggio
Questo maggio, i leader del settore dei dati e dell'analisi provenienti da tutto il mondo si riuniranno a Londra in occasione del Gartner Data & Analytics Summit. Se l'articolo di a16z va nella direzione giusta, e noi crediamo che sia così, le discussioni durante l'evento verteranno sempre più sul problema del contesto. Quali fornitori lo hanno risolto? Come si presenta un livello di contesto pronto per la produzione? In che modo un'organizzazione può passare da esperimenti di IA ad hoc ad agenti di dati ripetibili e affidabili?
Queste sono le domande a cui Jean-Paul è stato progettato per rispondere. Se sarete a Londra in occasione del Gartner Data & Analytics Summit, saremo lieti di fare due chiacchiere con voi. Passate a trovarci allo stand SnapLogic (n. 212) per salutarci!
- 5 livelli architetturali: JP affronta tutti e cinque i livelli architetturali individuati da a16z
- MCP: Jean-Paul è nativamente compatibile con MCP e rende il contesto accessibile a qualsiasi client AI
- Aggiornamento automatico: il contesto si evolve di pari passo con l'evoluzione dei dati e dell'attività aziendale






