Data Mesh vs. Data Fabric - Erläuterung und Überblick

Was ist der Unterschied zwischen Data Mesh und Data Fabric?

Data Mesh und Data Fabric sind Rahmenwerke für die Datenanalyse und -verwaltung, die sich weitgehend ähneln und überschneiden, sich aber in einigen Bereichen unterscheiden.

Das Data-Mesh-Framework wurde von Zhamak Dehghani (ehemals bei der Unternehmensberatung Thoughtorks) gegründet und wird von ihr als dezentraler soziotechnischer Ansatz für die gemeinsame Nutzung, den Zugriff und die Verwaltung von Analysedaten in komplexen und großen Umgebungen definiert - innerhalb von und zwischen Umgebungen.

Das Data-Fabric-Framework wurde von Gartner entwickelt und wird von Gartner als ein Designkonzept definiert, das als integrierte Schicht (Fabric) von Daten und Verbindungsprozessen dient. Eine Data Fabric nutzt kontinuierliche Analysen über vorhandene, auffindbare und referenzierte Metadatenbestände, um die Entwicklung, Bereitstellung und Nutzung integrierter und wiederverwendbarer Daten in allen Umgebungen zu unterstützen. Dies schließt hybride und Multi-Cloud-Plattformen ein.

"Ein Datengeflecht ist eine technologiegestützte Implementierung, die zu vielen Ergebnissen fähig ist, von denen nur eines ein Datenprodukt ist. Ein Datengeflecht ist eine Lösungsarchitektur mit dem spezifischen Ziel, geschäftsorientierte Datenprodukte zu erstellen."

Gartner

Wie nutzen Unternehmen Datengeflechte oder Datenstrukturen? 

Sowohl bei Data Mesh als auch bei Data Fabric liegt der Schwerpunkt auf dezentralem Dateneigentum und -management. Dezentralisierung bedeutet in diesem Zusammenhang, dass Geschäftsgruppen und Dateneigentümer ihre eigenen Daten verwalten oder gemeinsam mit der IT-Abteilung des Unternehmens Eigentümer der Daten sind, anstatt dass die Daten zentralisiert sind und der IT-Abteilung gehören.

Data Mesh zeichnet sich insbesondere durch vier Prinzipien aus: Dezentralisierung, Selbstbedienungszugriff auf Daten, Domäneneigentum an Daten und föderierte Computerverwaltung. 

Data Fabric zeichnet sich durch umfassende aktive Metadaten, einfachen Zugriff auf Daten, kontinuierliches Lernen aus Metadaten und automatisierte Bereitstellung aus.

Was die Unterscheidungsbereiche betrifft, so legen Data Mesh und die Anhänger dieses Rahmens tendenziell mehr Wert auf bereichseigene, nicht durch die IT zentralisierte Datenprodukte als primären Mechanismus zur Erzielung von Skalierung und schnellerer Wertschöpfung aus Datenanalysen. Data Fabric und Gartner hingegen betonen die Bedeutung globaler, aktiver Metadaten als Schlüssel zu dezentralisierten, verteilten Datenumgebungen, die skalierbar und einfach zu betreiben sind.

Welches Framework sollte ich verwenden? Data Mesh oder Data Fabric?

Beide Frameworks sollen Geschäftsanwendern helfen, Datenprodukte schneller zu erstellen. Beide Frameworks sind geeignet. 

Unternehmen können sich mit jedem Rahmenwerk befassen und dasjenige auswählen, das ihren Anforderungen am besten entspricht. Sie können auch einzelne Elemente auswählen und ein auf ihr Unternehmen zugeschnittenes Daten-Framework erstellen.

Data Mesh und Data Fabric sind Rahmenwerke, an denen sich die Strategie orientieren kann - beides kann nicht gekauft werden. 

Unternehmen können keine Data Mesh-Produkte oder -Plattformen kaufen oder einsetzen, aber sie können sich dafür entscheiden, ein Data Mesh-Framework auf die Art und Weise anzuwenden, wie sie Daten in großem Umfang verwalten. Die Umstellung auf Data Mesh oder Data Fabric ist Teil der digitalen Transformation - und muss von oben nach unten mit einer unternehmensweiten Implementierung erfolgen.

Unabhängig davon, für welche Methode der Datendezentralisierung sich ein Unternehmen entscheidet, besteht das ultimative Ziel darin, schneller Datenprodukte zu erstellen, die die Geschäftsergebnisse verbessern. Um dies zu erreichen, müssen Unternehmen Daten in großem Umfang integrieren.