Data Fabric - Definition und Überblick

Was ist ein Datengewebe?

Data Fabric ist eine Variante eines verteilten, dezentralisierten Datenanalyse- und -verwaltungs-Frameworks oder eines Entwurfsmusters für die Datenintegrationsschicht, das von den Analysten bei Gartner befürwortet wird. Data Fabric wird weitgehend als konkurrierendes Framework zu Data Mesh gesehen, das von Branchenvordenker Zhamak Dehghani befürwortet wird. Das Data-Fabric-Konzept ist laut Gartner ein aufstrebendes Architektur- und Datenmanagement-Designmuster zur Erreichung flexibler, wiederverwendbarer und erweiterter Datenintegrationspipelines, die einen schnelleren und in einigen Fällen automatisierten Datenzugriff und -austausch ermöglichen. Ein Schlüsselattribut des Data-Fabric-Designmusters sind aktive Metadaten, die der Automatisierung von Datenverwaltungsaufgaben dienen.

Nach der Definition von Gartner unterstützt eine Data Fabric sowohl operative als auch analytische Anwendungsfälle, die über mehrere Bereitstellungs- und Orchestrierungsplattformen und -prozesse bereitgestellt werden. Data Fabrics unterstützen eine Kombination aus verschiedenen Datenintegrationsstilen und nutzen aktive Metadaten, Wissensgraphen, Semantik und ML, um das Design und die Bereitstellung der Datenintegration zu verbessern.

Es ist wichtig zu verstehen, dass Data Fabric (und das Gleiche gilt für Data Mesh) ein Entwurfsmuster ist, das aus mehreren Datenplattformkomponenten besteht und nicht über eine einzelne SKU gekauft wird.

Wie funktioniert die Datenstruktur?

Data Fabric ist eine verteilte Datenarchitektur, die es ermöglicht, Daten über verschiedene Standorte und Plattformen hinweg zu speichern, zu verarbeiten und zu vereinheitlichen. Sie ermöglicht Datenintegration, Virtualisierung, Orchestrierung, Metadatenverwaltung, Governance, Sicherheit und Datenschutz.

Eine Data Fabric nutzt kontinuierliche Analysen über vorhandene, auffindbare Datenbestände, die durch aktive Metadaten und KI/ML-Techniken ermöglicht werden, um die Entwicklung, Bereitstellung und Nutzung integrierter und wiederverwendbarer Daten in allen Umgebungen, einschließlich hybrider und Multi-Cloud-Plattformen, zu unterstützen.

Data Fabric bietet auch einen Datenkatalog (ein zentrales Repository mit Metadaten und Informationen über verfügbare Assets) und Datenzugriffs-APIs, um Benutzern und Anwendungen die nahtlose Interaktion mit Daten zu erleichtern. Es handelt sich um eine verteilte Datenarchitektur, die die Speicherung und Verarbeitung von Daten über verschiedene Standorte und Plattformen hinweg ermöglicht.

Welche Technologien werden zur Unterstützung von Data Fabric eingesetzt?

Die Aktivierung einer Data Fabric beinhaltet die Verwendung einer Kombination von Tools und Technologien zur nahtlosen Integration, Verwaltung und Analyse von Daten in einem Unternehmen. Eine Data-Fabric-Architektur ermöglicht eine einheitliche und konsistente Sicht auf Daten über verschiedene Quellen und Umgebungen hinweg. Hier finden Sie Tools, die bei der Implementierung und Aktivierung einer Data Fabric nützlich sind:

  • Datenintegration / iPaaS
  • Speicherung und Verwaltung von Daten
  • Virtualisierung von Daten
  • Datenkatalog
  • Datenverwaltung
  • Verwaltung von Metadaten
  • Analytik und Business Intelligence
  • Datensicherheit und Compliance
  • Maschinelles Lernen und KI
  • Workflow-Orchestrierung

Denken Sie daran, dass die Wahl der spezifischen Tools von den Anforderungen Ihres Unternehmens, der vorhandenen Infrastruktur und der Art der Daten abhängt, mit denen Sie arbeiten. Außerdem kann die Bereitstellung eine Kombination aus lokalen und Cloud-basierten Lösungen umfassen, je nach Strategie Ihres Unternehmens.

Was sind die Vorteile von Data Fabric?

Die Vorteile von Data Fabric sind vielschichtig:

  • Technologieträger wie IT-Direktoren, Datenplattform-Manager und Dateningenieure können durch die automatisierte Erstellung von Integrationen und den automatisierten Zugriff auf Daten einen Produktivitätsschub erfahren, der sie von der ständig wachsenden Arbeitslast entlastet.
  • Bürger, die an der Integration beteiligt sind, wie z. B. Geschäftsanwender und Führungskräfte, profitieren ebenfalls vom automatisierten Datenzugriff sowie von der Benutzerfreundlichkeit, die es ihnen erleichtert, ihre Arbeit mit den Daten schneller zu erledigen.
  • Das Unternehmen profitiert von einer schnelleren Wertschöpfung aus Daten im gesamten Unternehmen. Das Unternehmen ist agiler und reaktionsschneller, und darüber hinaus wird das Unternehmen zu einer stärker datengesteuerten und datenkompetenten Kultur.    

Was sind die Herausforderungen bei Data Fabric?

Da eine moderne Data Fabric aufgebaut und zusammengestellt und nicht über eine einzelne SKU gekauft wird, ergeben sich Herausforderungen, wenn die erforderlichen Komponenten der Data Fabric noch nicht verfügbar oder ausgereift genug sind, um die Vision einer automatisierten Data-Fabric-Umgebung zu verwirklichen. Beispiele hierfür sind:

  • Mangel an Metadaten, die die Kategorisierung und Auffindung von Datenbeständen ermöglichen.
  • Schwierigkeiten bei der Erstellung von Integrationen und Automatisierungen aufgrund von schwer zu bedienenden Schnittstellen.
  • Unentwickelte oder unausgereifte KI/ML, die zu ungenauen Ergebnissen führen kann
  • Langsame Leistung, was traditionell der Kompromiss ist, wenn man eine Abfrage über verteilte Datensysteme föderiert
  • Fehlen einer nahtlosen, bereichsübergreifenden Datenintegrationsstruktur, was bedeutet, dass Datensilos nicht beseitigt werden