Produits Data Lake - Explication et vue d'ensemble

Quels sont les produits de lac de données ?

Un lac de données est un système de stockage qui peut accueillir des données de toute taille, de tout type ou de toute forme - structurées, semi-structurées ou non structurées. Son architecture plate unique permet d'extraire rapidement et à la demande des données à des fins de traitement, d'analyse et d'affinage.

Plusieurs produits informatiques puissants tirent parti de la capacité et de la vitesse des lacs de données :

Le système de fichiers distribués Apache Hadoop (HDFS) est un cadre open-source qui permet le stockage et le traitement de grands ensembles de données en divisant les fichiers en grands blocs et en les répartissant sur les nœuds d'une grappe.

Apache Hive est un logiciel qui lit et écrit des données volumineuses (big data) stockées[MOU1] dans des bases de données et des systèmes de fichiers distribués. Son interface et son langage de type SQL, HiveQL, facilitent la synthèse, l'interrogation et l'analyse des données. Il s'agit d'une infrastructure open-source construite au-dessus de Hadoop.

Google BigQuery est un service web RESTful utilisé pour l'analyse des grandes données sur cloud. Il prend en charge la gestion des données, l'interrogation et le contrôle d'accès de très grands ensembles de données. Comme Apache Hive, il utilise une syntaxe de type SQL. Il fait partie de la plateforme Google Cloud .

Amazon DynamoDB est un service de base de données NoSQL basé sur cloud qui prend en charge les modèles de documents et de stockage de valeurs clés. Il prend en charge les applications qui nécessitent une latence cohérente de l'ordre de la milliseconde.

L'architecture Snaplex de SnapLogic connecte cloud, sur site et les points d'extrémité big data à travers les applications, les bases de données, l'IoT et les API avec SL eXtreme.

SnapLogic est la seule intégration unifiée de données et d'applications plateforme en tant que service(iPaaS) qui peut connecter toutes vos applications logicielles et sources de données cloud, sur site et hybrides.


Autres contenus susceptibles de vous intéresser