L'intelligence de votre agent de données dépend entièrement du contexte dans lequel il évolue

A16z vient de définir les grandes lignes du mode de fonctionnement des agents de données. Voici pourquoi Jean-Paul, de SnapLogic, l'utilisait déjà avant même que l'encre ne soit sèche.

L'équipe d'Andreessen Horowitz (a16z) a récemment publié un article percutant intitulé «Your Data Agents Need Context ».Si vous êtes en charge des initiatives liées aux données, à l'analyse ou à l'IA au sein de votre organisation et que vous ne l'avez pas encore lu, arrêtez-vous ici et lisez-le. C'est l'une des explications les plus claires sur les raisons pour lesquelles la première vague d'agents de données d'entreprise a largement échoué, et sur ce à quoi ressemble une deuxième vague, plus avancée.

En bref : il ne suffit pas de connecter un grand modèle linguistique à un entrepôt de données. Ce qui distingue un agent de données qui invente des chiffres d'affaires de toutes pièces de celui qui répond de manière fiable à une question telle que « Pourquoi le pipeline de la région EMEA a-t-il baissé de 12 % au dernier trimestre ? », c'est le contexte. La logique métier accumulée, le savoir tacite et les métadonnées évolutives donnent du sens aux données pour les humains, mais n'ont jamais été systématiquement codés pour les machines.

Nous nous sommes surpris à approuver vigoureusement chaque paragraphe. Non pas parce que cela constituait une nouveauté pour SnapLogic, mais parce que cela décrivait avec précision les choix architecturaux que nous avions faits lors de la conception de Jean-Paul, notre agent d’intégration et d’analyse natif de l’IA. Il y a deux semaines, lors de notre événement public Agent Fest, nous avons présenté Jean-Paul au monde entier. L’article d’a16z a été publié peu après. Ce timing nous a semblé moins être une coïncidence qu’une confirmation.

« La plupart des agents de données échouent en raison les workflows peu les workflows, d'un manque d'apprentissage contextuel et d'un décalage par rapport aux opérations quotidiennes. »
Andreessen Horowitz (a16z), «Vos agents de données ont besoin de contexte »(2026)

Nous ajouterions un mot à ce constat : « de manière permanente ». La plupart des agents ont échoué, et ils continueront d'échouer, tant que le problème de contexte ne sera pas résolu au plateforme de plateforme , et non pas comme une solution rajoutée après coup, une fois le déploiement effectué.

Le plan en cinq étapes, et la place qu'y occupe Jean-Paul

A16z a présenté une architecture en cinq étapes pour une couche contextuelle moderne associée à un système de données agentique. Comparons-la de manière honnête et précise à ce que fait Jean-Paul aujourd’hui.

1. Accéder aux bonnes données

A16z appelle cela « la base »: rendre accessibles toutes les données pertinentes, y compris celles provenant de sources extérieures à l'entrepôt de données, telles que Google Drive, Slack, les systèmes internes et les référentiels de connaissances organisationnelles.

Jean-Paul s'intègre de manière native à la plateforme d'intégration de SnapLogic, qui fédère déjà des centaines de sources de données. Lorsqu'un responsable des données pose une question, JP ne se contente pas d'interroger un seul endroit. Il explore l'ensemble du parc de données connectées de l'organisation, y compris les sources non structurées, en un seul cycle d'agent.

Jean-Paul : accès natif à plusieurs sources

2. Construction automatisée du contexte

Le contexte à signal fort peut être extrait automatiquement :

L'historique des requêtes met en évidence les tables les plus consultées
Les modèles DBT et LookML fournissent des définitions de métriques
Les métadonnées du schéma clarifient les jointures

C'est exactement ce que fait Jean-Paul : notre module d'analyse BigQuery intègre la documentation du schéma, les modèles de requêtes antérieurs et les descriptions des ensembles de données avant d'exécuter la moindre requête. Nous ne laissons pas le modèle de langage grand format (LLM) deviner. Nous avons intégré une approche « schéma d'abord » obligatoire dans l'architecture de l'agent.

Jean-Paul : approche « schéma d'abord », requêtes ancrées

Le contexte automatisé ne peut pas tout prendre en compte. La logique métier la plus cruciale est conditionnelle, dépend de l'historique et n'existe que dans l'esprit des gens. Par exemple : « Utiliser Salesforce pour les prospects internationaux avant 2025, mais Affinity pour les contrats USCAN à partir de 2025. »

A16z compare cela à la gestion par les développeurs des fichiers .cursorrules. Jean-Paul met en avant ce type de couche de configuration, qui permet aux professionnels des données et aux administrateurs de définir des règles, des mises en garde et des exceptions qui déterminent chaque interaction ultérieure de l'agent. Le contexte n'est pas statique. Il est organisé.

Jean-Paul : couche de règles configurables

4. Connexion de l'agent via l'API ou MCP

La couche contextuelle ne fonctionne que si elle est accessible aux agents en temps réel. A16z identifie l'API et le MCP (Model Context Protocol) comme les deux modèles d'exposition standard. Jean-Paul s'appuie sur ces deux protocoles.

Elle met à disposition l'ensemble des capacités d'intégration et d'analyse de SnapLogic en tant que serveur MCP, ce qui signifie que tout client IA compatible MCP (notamment Claude, Cursor et les agents tiers) peut exploiter les outils enrichis de contexte de Jean-Paul sans avoir à reconstruire la couche contextuelle à partir de zéro. Une seule plateforme, de nombreux clients agents.

Jean-Paul : Serveur natif MCP

5. Flux contextuels à mise à jour automatique

C'est celui qui nous enthousiasme le plus, car nous sommes en train de le finaliser. Les systèmes de données ne sont jamais statiques. Les schémas changent. Les règles métier évoluent. Les agents commettent des erreurs qui doivent être corrigées au niveau de la couche contextuelle.

A16z parle d’un « corpus vivant et en constante évolution ». Le flux contextuel à mise à jour automatique de Jean-Paul en est aux dernières étapes de son développement ; il a été spécialement conçu pour gérer les modifications apportées en amont à l’entrepôt de données, y compris nos récentes mises à jour structurelles de l’entrepôt. Lorsque l’entrepôt change, la couche contextuelle s’adapte automatiquement. Aucune intervention manuelle n’est nécessaire.

Jean-Paul : contexte auto-réparateur (en cours de développement)

Pourquoi cela est-il important pour les responsables des données à l'heure actuelle ?

A16z classe le marché émergent en trois catégories :

Les plateformes de « data gravity » (Snowflake, Databricks) qui enrichissent les infrastructures existantes de fonctionnalités contextuelles
Des outils avancés d'analyse de données basés sur l'IA intégrant le contexte a posteriori
Une nouvelle catégorie de spécialistes dédiés à la couche contextuelle, qui développent des solutions entièrement sur mesure

Nous dirions qu'il existe une quatrième option, peut-être la plus défendable : la plateforme d'intégration plateforme assure déjà la liaison entre les systèmes.

SnapLogic n'a pas besoin de développer de nouveaux connecteurs pour accéder à votre ERP, votre CRM, votre lac de données et vos bases de données opérationnelles. Nous les avons déjà. La couche contextuelle n'est pas un élément que nous ajoutons. Il s'agit du prolongement naturel de ce que plateforme une plateforme d'intégration d'entreprise lorsqu'elle devient native en matière d'IA.

Ce que les responsables des données doivent bien comprendre : on ne peut pas acheter de contexte tout fait. On ne peut pas non plus y parvenir en manipulant des requêtes. Le contexte est un atout organisationnel qui doit être construit, organisé et entretenu en permanence par les équipes qui maîtrisent l'activité. Jean-Paul fournit l'infrastructure nécessaire pour y parvenir de manière systématique.

3 conseils pratiques pour votre stratégie en matière de données et d'IA

1. Cessez d'évaluer les agents de données sur la base de requêtes de démonstration

« Le chiffre d'affaires du dernier trimestre » est une question à laquelle il est facile de répondre correctement dans un environnement contrôlé. Le véritable défi réside dans les requêtes ambiguës, inter-systèmes et stratégiques pour l'entreprise, formulées dans des conditions réelles : « Quels segments de clientèle affichent des résultats inférieurs aux prévisions et quelles en sont les causes ? » Cela nécessite de replacer chaque étape dans son contexte. Évaluez les agents sur cette base.

2. Considérez le contexte comme une infrastructure, et non comme une invite

Les équipes qui réussissent avec les agents de données ne sont pas celles qui rédigent les invites système les plus ingénieuses. Ce sont celles qui s'attachent à intégrer la logique métier dans une couche contextuelle robuste et évolutive, capable de perdurer au-delà de n'importe quelle version d'un modèle LLM. Il s'agit là d'un problème d'ingénierie des données, et non d'un problème d'IA.

3. Prévoyez dès le départ les changements de contexte

A16z a raison de dire qu’un contexte capable de se mettre à jour automatiquement n’est pas une option, mais une condition indispensable à la survie. Une couche contextuelle statique constitue un handicap. Les schémas de données évoluent tous les trimestres. Les définitions métier changent. Des fusions ont lieu. Les organisations qui mettent dès maintenant en place une discipline de gestion du contexte bénéficieront d’avantages croissants à mesure que leurs agents accumuleront du savoir institutionnel au fil du temps.

À venir : Gartner D&A, du 11 au 13 mai

En mai prochain, les leaders du secteur des données et de l'analyse se réuniront à Londres à l'occasion du Gartner Data & Analytics Summit. Si l'analyse d'a16z va dans le bon sens, et nous pensons que c'est le cas, les discussions lors de cet événement porteront de plus en plus sur le problème du contexte. Quels fournisseurs l'ont résolu ? À quoi ressemble une couche contextuelle prête pour la production ? Comment une organisation passe-t-elle d'expériences d'IA ponctuelles à des agents de données fiables et reproductibles ?

C'est précisément pour répondre à ces questions que Jean-Paul a été conçu. Si vous êtes à Londres à l'occasion du Gartner Data & Analytics Summit, nous serions ravis d'échanger avec vous. Passez nous voir au stand SnapLogic (n° 212) pour nous dire bonjour !

Découvrez Jean-Paul

5 couches architecturales : JP couvre les cinq couches architecturales identifiées par a16z
MCP : Jean-Paul est nativement compatible avec MCP, permettant ainsi à n'importe quel client IA d'accéder au contexte
Mise à jour automatique : le contexte évolue au fur et à mesure que vos données et votre activité évoluent

Jocelyn Arcega

Responsable de l'ingénierie des solutions, EMEA chez SnapLogic

Catégorie : Produit AI

La qualité d'un agent de données dépend entièrement du contexte dans lequel il évolue (c'est pourquoi nous en avons conçu un qui fonctionne parfaitement)