A16z hat gerade die Blaupause dafür vorgelegt, wie Datenagenten funktionieren müssen. Hier ist der Grund, warum Jean-Paul von SnapLogic sie bereits nutzte, noch bevor die Tinte getrocknet war.
Das Team von Andreessen Horowitz (a16z) hat kürzlich einen treffenden Artikel mitdemTitel„Your Data Agents Need Context“veröffentlicht.Wenn Sie in Ihrem Unternehmen für Daten-, Analyse- oder KI-Initiativen verantwortlich sind und diesen Artikel noch nicht gelesen haben, sollten Sie hier innehalten und dies nachholen. Er erklärt so klar wie kaum ein anderer, warum die erste Welle von Datenagenten in Unternehmen weitgehend gescheitert ist und wie eine zweite, weiterentwickelte Welle aussehen könnte.
Kurz gesagt: Es reicht nicht aus, ein großes Sprachmodell mit einem Data Warehouse zu verbinden. Was einen Datenagenten, der Umsatzzahlen erfindet, von einem unterscheidet, der zuverlässig eine Frage wie „Warum ist die EMEA-Pipeline im letzten Quartal um 12 % gesunken?“ beantwortet, ist der Kontext. Die gesammelte Geschäftslogik, das implizite Wissen und die dynamischen Metadaten machen Daten für Menschen aussagekräftig, wurden jedoch nie systematisch für Maschinen kodiert.
Wir mussten bei jedem Absatz heftig nicken. Nicht, weil das für SnapLogic etwas Neues war, sondern weil darin genau die architektonischen Entscheidungen beschrieben wurden, die wir bei der Entwicklung von Jean-Paul, unserem KI-basierten Integrations- und Analyse-Agenten, getroffen hatten. Vor zwei Wochen haben wir Jean-Paul auf unserer öffentlichen Veranstaltung „Agent Fest“ der Welt vorgestellt. Der Artikel von a16z erschien kurz darauf. Das Timing kam uns weniger wie ein Zufall vor, sondern eher wie eine Bestätigung.
„Die meisten Datenagenten scheitern aufgrund unflexibler Arbeitsabläufe, mangelnden kontextbezogenen Lernens und einer mangelnden Abstimmung mit den täglichen Abläufen.“
Andreessen Horowitz (a16z),„Ihre Datenagenten brauchen Kontext“(2026)
Wir würden dieser Diagnose noch ein Wort hinzufügen: dauerhaft. Die meisten Agenten sind gescheitert und werden auch weiterhin scheitern, bis das Kontextproblem auf Plattformebene gelöst ist – und nicht erst als nachträglicher Einfall, der nach der Bereitstellung angehängt wird.
Der Fünf-Stufen-Plan und wo Jean-Paul darin steht
A16z hat eine fünfstufige Architektur für eine moderne Kontext-Ebene in Verbindung mit einem agentenbasierten Datensystem skizziert. Lassen Sie uns diese ehrlich und konkret mit dem vergleichen, was Jean-Paul heute tut.
1. Zugriff auf die richtigen Daten
A16z bezeichnet dies als „Table Stakes“: alle relevanten Daten zugänglich zu machen, einschließlich Quellen außerhalb des Data Warehouse wie Google Drive, Slack, interne Systeme und Wissensspeicher der einzelnen Teams.
Jean-Paul lässt sich nahtlos in die Integrationsplattform von SnapLogic einbinden, die bereits Hunderte von Datenquellen miteinander verknüpft. Wenn ein Datenverantwortlicher eine Frage stellt, fragt JP nicht nur an einer Stelle ab. Es greift in einem einzigen Agentenzyklus auf die gesamte vernetzte Datenlandschaft des Unternehmens zu, einschließlich unstrukturierter Quellen.
Jean-Paul: nativer Zugriff auf mehrere Quellen
2. Automatisierte Kontextermittlung
Kontexte mit hohem Signalanteil können automatisch extrahiert werden:
- Der Abfrageverlauf zeigt häufig verwendete Tabellen an
- DBT-Modelle und LookML stellen Metrikdefinitionen bereit
- Schema-Metadaten verdeutlichen Verknüpfungen
Genau das tut Jean-Paul: Unsere BigQuery-Analysesuite nimmt vor der Ausführung einer Abfrage Schemadokumentationen, bisherige Abfragemuster und Datensatzbeschreibungen auf. Wir lassen das LLM nicht raten. Wir haben eine verbindliche „Schema-First“-Vorgabe fest in die Architektur des Agenten integriert.
Jean-Paul: Schema-First, fundierte Abfragen
3. Menschliche Verfeinerung
Automatisierte Kontextinformationen können nicht alles erfassen. Die entscheidendste Geschäftslogik ist bedingungsabhängig, historisch bedingt und existiert nur in den Köpfen der Menschen. Zum Beispiel: „Verwende Salesforce für globale Leads vor 2025, aber Affinity für USCAN-Geschäfte ab 2025.“
A16z vergleicht dies mit der Pflege von „.cursorrules“-Dateien durch Entwickler. Jean-Paul stellt eine solche Konfigurationsebene bereit, die es Datenfachleuten und Administratoren ermöglicht, Regeln, Vorbehalte und Ausnahmen festzulegen, die jede nachfolgende Interaktion des Agenten prägen. Der Kontext ist nicht statisch. Er wird kuratiert.
Jean-Paul: Konfigurierbare Regelebene
4. Agent-Verbindung über API oder MCP
Die Kontextschicht funktioniert nur, wenn sie für Agenten in Echtzeit zugänglich ist. A16z nennt API und MCP (Model Context Protocol) als die beiden Standard-Schnittstellenmodelle. Jean-Paul basiert auf beiden.
Es stellt die gesamten Integrations- und Analysefunktionen von SnapLogic als MCP-Server bereit, was bedeutet, dass jeder MCP-kompatible KI-Client (einschließlich Claude, Cursor und Agenten von Drittanbietern) die kontextangereicherten Tools von Jean-Paul nutzen kann, ohne die Kontextschicht von Grund auf neu aufbauen zu müssen. Eine Plattform, viele Agent-Clients.
Jean-Paul: MCP-eigener Server
5. Sich selbst aktualisierende Kontextabläufe
Das ist der Punkt, der uns am meisten begeistert, denn wir sind gerade dabei, ihn abzuschließen. Datensysteme sind niemals statisch. Schemata ändern sich. Geschäftsregeln entwickeln sich weiter. Agenten machen Fehler, die in der Kontextschicht korrigiert werden müssen.
A16z beschreibt einen „lebendigen und sich ständig weiterentwickelnden Korpus“. Jean-Pauls sich selbst aktualisierender Kontextfluss befindet sich in der Endphase der Entwicklung und wurde speziell dafür konzipiert, Änderungen im vorgelagerten Data Warehouse zu verarbeiten, einschließlich unserer eigenen jüngsten strukturellen Aktualisierungen des DWH. Wenn sich das Data Warehouse ändert, ändert sich die Kontextschicht entsprechend. Ein manueller Eingriff ist nicht erforderlich.
Jean-Paul: Selbstheilungskontext (in aktiver Entwicklung)
Warum dies für Datenverantwortliche gerade jetzt von Bedeutung ist
A16z unterteilt den aufstrebenden Markt in drei Kategorien:
- Data-Gravity-Plattformen (Snowflake, Databricks), die bestehende Infrastrukturen um Kontextfunktionen erweitern
- Fortschrittliche KI-Tools für Datenanalysten, die nachträglich Kontextinformationen einbinden
- Eine neue Kategorie von Spezialisten für die Kontext-Ebene, die Lösungen von Grund auf entwickeln
Wir würden argumentieren, dass es eine vierte Position gibt, die vielleicht am besten zu rechtfertigen ist: die Integrationsplattform, die bereits das Bindeglied zwischen den Systemen bildet.
SnapLogic muss keine neuen Konnektoren entwickeln, um auf Ihr ERP-System, Ihr CRM, Ihren Data Lake und Ihre operativen Datenbanken zuzugreifen. Diese sind bereits vorhanden. Die Kontext-Ebene ist keine neue Funktion, die wir hinzufügen. Sie ist die natürliche Erweiterung dessen, was eine Unternehmensintegrationsplattform leistet, wenn sie KI-fähig wird.
Die Erkenntnis, die Datenverantwortliche verinnerlichen müssen: Kontext lässt sich nicht einfach von der Stange kaufen. Man kann ihn auch nicht durch das Erstellen von Prompts erzwingen. Kontext ist ein organisatorisches Kapital, das von den Teams, die das Geschäft verstehen, aufgebaut, gepflegt und kontinuierlich gewartet werden muss. Jean-Paul bietet die Infrastruktur, um dies systematisch zu bewerkstelligen.
3 praktische Tipps für Ihre Daten- und KI-Strategie
1. Hören Sie auf, Datenagenten anhand von Demo-Abfragen zu bewerten
Die Frage nach dem „Umsatz des letzten Quartals“ lässt sich in einer kontrollierten Umgebung leicht richtig beantworten. Die eigentliche Herausforderung sind jedoch mehrdeutige, systemübergreifende und geschäftskritische Anfragen unter realen Bedingungen: „Welche Kundensegmente bleiben hinter den Prognosen zurück und woran liegt das?“ Dies erfordert bei jedem Schritt den richtigen Kontext. Bewerten Sie die Mitarbeiter auf dieser Grundlage.
2. Betrachten Sie den Kontext als Infrastruktur und nicht als Eingabeaufforderung
Die Teams, die mit Datenagenten erfolgreich sind, sind nicht diejenigen, die die cleversten Systemaufforderungen verfassen. Es sind diejenigen, die in die Kodierung von Geschäftslogik in eine robuste, versionierbare Kontextschicht investieren – eine Schicht, die jede einzelne Version eines LLM-Modells überdauert. Dies ist ein Problem des Data Engineering, kein KI-Problem.
3. Planen Sie von Anfang an für Kontextverschiebungen
A16z hat Recht: Ein sich selbst aktualisierender Kontext ist kein Luxus, sondern eine Überlebensvoraussetzung. Eine statische Kontextschicht ist ein Risiko. Datenschemata ändern sich vierteljährlich. Geschäftsdefinitionen verschieben sich. Fusionen finden statt. Die Organisationen, die jetzt eine Disziplin zur Kontextpflege aufbauen, werden im Laufe der Zeit immer größere Vorteile daraus ziehen, da ihre Mitarbeiter institutionelles Wissen ansammeln.
Ausblick: Gartner D&A, 11.–13. Mai
Im Mai dieses Jahres werden sich führende Experten für Daten und Analytik aus der gesamten Branche in London zum Gartner Data & Analytics Summit versammeln. Wenn der Beitrag von a16z in die richtige Richtung weist – und davon gehen wir aus –, werden sich die Diskussionen auf dieser Veranstaltung zunehmend um das Kontextproblem drehen. Welche Anbieter haben dieses Problem gelöst? Wie sieht eine produktionsreife Kontextschicht aus? Wie schafft ein Unternehmen den Übergang von Ad-hoc-KI-Experimenten zu wiederholbaren, vertrauenswürdigen Datenagenten?
Genau diese Fragen soll Jean-Paul beantworten. Wenn Sie beim Gartner Data & Analytics Summit in London sind, würden wir uns über ein Gespräch freuen. Schauen Sie am SnapLogic-Stand (Nr. 212) vorbei und sagen Sie Hallo!
- 5 Architektur-Ebenen: JP deckt alle fünf von a16z identifizierten Architektur-Ebenen ab
- MCP: Jean-Paul ist von Haus aus MCP-kompatibel und stellt jedem KI-Client den Kontext zur Verfügung
- Selbstaktualisierend: Der Kontext passt sich an, wenn sich Ihre Daten und Ihr Geschäft weiterentwickeln






