Data Mesh vs. Data Fabric - Explication et vue d'ensemble

Quelle est la différence entre data mesh et data fabric ?

Le maillage et le tissu de données sont des cadres d'analyse et de gestion des données qui sont largement similaires et se chevauchent, mais avec quelques domaines de distinction.

Le cadre de maillage des données a été fondé par Zhamak Dehghani (anciennement du cabinet de conseil Thoughtorks) et est défini par elle comme une approche sociotechnique décentralisée permettant de partager, d'accéder et de gérer des données analytiques dans des environnements complexes et de grande taille - au sein d'un même environnement et d'un environnement à l'autre.

Le cadre du tissu de données a été développé par Gartner et est défini comme un concept de conception qui sert de couche intégrée (tissu) de données et de processus de connexion. Un tissu de données utilise l'analyse continue des métadonnées existantes, repérables et référencées pour soutenir la conception, le déploiement et l'utilisation de données intégrées et réutilisables dans tous les environnements. Cela inclut les plateformes hybrides et multicloud .

"Un tissu de données est une mise en œuvre technologique capable de produire de nombreux résultats, dont un seul est un produit de données. Un maillage de données est une architecture de solution dont l'objectif spécifique est de créer des produits de données axés sur l'entreprise".

Gartner

Comment les entreprises utilisent-elles le maillage de données ou le tissu de données ? 

Les cadres de maillage de données et de tissu de données mettent tous deux l'accent sur la décentralisation de la propriété et de la gestion des données. Dans ce contexte, la décentralisation signifie que les groupes d'entreprises et les propriétaires de données gèrent leurs propres données ou partagent la propriété des données avec le service informatique de l'entreprise, plutôt que de centraliser les données et d'en confier la propriété au service informatique.

Le maillage de données se caractérise spécifiquement par quatre principes : la décentralisation, l'accès aux données en libre-service, la propriété des données par domaine et la gouvernance informatique fédérée. 

Le tissu de données se caractérise par de vastes métadonnées actives, un accès facile aux données, un apprentissage continu à partir des métadonnées et un déploiement automatisé.

En ce qui concerne les domaines de distinction, data mesh et les adeptes de ce cadre ont tendance à mettre davantage l'accent sur les produits de données appartenant au domaine, non centralisés par l'informatique, en tant que mécanisme principal pour atteindre l'échelle et accélérer la rentabilité de l'analyse des données. En revanche, data fabric et Gartner ont tendance à mettre davantage l'accent sur l'importance des métadonnées globales et actives, qui sont essentielles pour permettre aux environnements de données décentralisés et distribués de fonctionner à l'échelle et avec facilité.

Quel cadre dois-je utiliser ? Data mesh ou data fabric ?

Les deux cadres ont pour but d'aider les utilisateurs professionnels à créer des produits de données plus rapidement. L'un ou l'autre de ces cadres fonctionnera. 

Les entreprises peuvent se plonger dans chaque cadre et choisir celui qui répond le mieux à leurs besoins. Elles peuvent aussi choisir des éléments et créer un cadre de données adapté à leur organisation.

Le maillage des données et le tissu de données sont des cadres qui guident la stratégie - aucun ne s'achète. 

Les entreprises ne peuvent pas acheter ou déployer un produit de maillage de données ou plateforme, mais elles peuvent choisir d'appliquer un cadre de maillage de données à la manière dont elles gèrent les données à l'échelle. Le passage au maillage de données ou à la fabrication de données fait partie de la transformation numérique - et doit être mené de haut en bas avec une mise en œuvre à l'échelle de l'entreprise.

Quelle que soit la méthode de décentralisation des données choisie par les entreprises, l'objectif ultime est de créer plus rapidement des produits de données qui génèrent des résultats commerciaux. Pour ce faire, les entreprises doivent intégrer les données à grande échelle.


Autres contenus susceptibles de vous intéresser