Data Mart - Définition et vue d'ensemble

Qu'est-ce qu'un data mart ?

Un datamart est un sous-ensemble spécifique de données contenues dans un entrepôt de données. Les entrepôts de données pouvant contenir d'énormes quantités de données, les datamarts peuvent permettre à certains services d'une organisation de trouver plus facilement les données dont ils ont besoin. Les data marts sont généralement divisés en fonction du sujet des données qu'ils contiennent. 

L'entreposage de données présente l'avantage de permettre le stockage, le traitement et l'analyse de grandes quantités de données. Ces données peuvent provenir d'une entreprise, d'une institution académique ou d'un service gouvernemental. En tirant le meilleur parti de ces avantages de l'entrepôt de données, l'utilisateur peut obtenir des informations importantes sur ses activités. Un data mart permet d'atteindre les mêmes objectifs, mais il contient une plus petite quantité de données. Il peut être issu d'un entrepôt de données, être mis en place de manière indépendante ou être une intégration d'un nouveau data mart et de big data préexistantes provenant d'un entrepôt de données.

Dans les data marts, pour des raisons de coût et de taille, les données sont souvent affinées et soigneusement sélectionnées avant d'être analysées et intégrées. Cependant, les utilisateurs d'entrepôts et de lacs de données téléchargent souvent des données en double ou non connectées. Un autre problème pour les grands utilisateurs est d'éliminer les données stagnantes, c'est-à-dire les données qui sont devenues obsolètes. Pour les utilisateurs de data mart, l'observation attentive de l'espace et des données contenues signifie qu'ils donnent la priorité à l'efficacité et à la précision.

Les très grandes entreprises ou celles qui disposent d'un grand nombre de données peuvent être en mesure de conserver toutes leurs données dans des services d'entrepôt de données. Pour de nombreuses entreprises, cependant, ce n'est pas possible. Des obstacles tels que le coût et les ressources analytiques disponibles font qu'il est plus judicieux d'utiliser un datamart.

L'utilisation de data marts permet aux organisations de fournir un accès spécifique aux données, de maximiser l'utilisation de leurs ressources et de minimiser les coûts. Elle peut également simplifier l'utilisation des données pour les utilisateurs inexpérimentés. La mise en place d'un datamart peut se faire de différentes manières. L'une des plus populaires consiste à faire appel à un service de stockage cloud, tel que Box, OneDrive et Azure