Comparaison des prix des entrepôts de données Cloud - Partie 1

Photo de Michael Nixon
5 minutes de lecture

SnapLogic est un service d'intégration agnostique cloud plateforme as a service(iPaaS) qui relie et orchestre les flux de données entre les applications et les données sur site, les applications SaaS cloud et une variété d'entrepôts de données cloud . C'est pourquoi on nous demande souvent notre avis sur l'entrepôt de données cloud qui est "le meilleur". 

Tarification Amazon Redshift vs. Google BigQuery vs. Snowflake

La réponse est, comme on peut s'y attendre, cela dépend. Il existe de nombreux facteurs.Par exemple, j'ai déjà publié un article sur les facteurs importants à prendre en compte pour déterminer si Snowflake, récemment introduite en bourse,est une bonne solution pour votre environnement

Grâce à l'intégration de SnapLogic en dehors de votre entrepôt plateforme, vous n'avez pas à vous enfermer dans un seul choix d'entrepôt de données cloud . Notre interface utilisateur graphique à code bas vous permet de modifier ou de mélanger facilement les entrepôts de données cloud afin de les adapter aux différents besoins de votre organisation. Par conséquent, lors de la comparaison des entrepôts de données cloud , un domaine sur lequel beaucoup de nos clients veulent se concentrer est le prix. 

Ainsi, dans le but de fournir un outil de référence pour la comparaison des prix et un plan d'orientation pour vos besoins spécifiques, ce blog est le premier d'une série qui compare les approches tarifaires pour trois options populaires d'entrepôt de données cloud (voir le tableau 1) : Amazon Redshift, Google BigQuery et Snowflake. 

Bien qu'ils soient tous les trois d'excellents choix, avec des avantages uniques, chaque fournisseur d'entrepôt de données cloud aborde la question des prix de manière très différente. Cela peut prêter à confusion.

Si vous connaissez déjà les structures tarifaires de l'entreposage de données sur cloud , mais que vous avez besoin d'un outil de référence à partager avec d'autres ou à inclure dans des appels d'offres, ces informations sont utiles à connaître :

Comme vous pouvez le constater, les approches tarifaires varient considérablement. Même si vous effectuez vos propres tests de référence en fonction de vos propres besoins en matière de données et de requêtes, vous voudrez toujours savoir comment la tarification diffère d'un site à l'autre ( plateforme ) lorsque les requêtes et les données changent ou augmentent.

Difficultés rencontrées lors de la comparaison des prix basés sur les vCPU et les nœuds

De nombreux services informatiques tentent d'effectuer des comparaisons sur la base d'une configuration spécifique, telle que le nombre de vCPU, la mémoire, etc. Cependant, du point de vue du prix, il ne s'agit pas de comparer des pommes avec des pommes, car vCPU a une signification différente pour chaque entrepôt de données cloud . De plus, cloud les fournisseurs d'entrepôts de données produisent une performance de différentes manières (par exemple, en utilisant l'élagage des données de requête, la séparation des calculs, etc. 

Par exemple, selon la documentation de Google Big Query, un "slot" est défini comme une unité centrale virtuelle. En l'absence d'autres informations, il est difficile de connaître les détails exacts d'un slot BigQuery, si ce n'est qu'il représente une unité de calcul au sein de son énorme infrastructure de serveurs. Sur la base de notre expérience, nous conseillons de ne pas s'attendre à ce qu'un service BigQuery "500 vCPU" (c'est-à-dire 500 emplacements) soit aussi performant que, par exemple, un environnement Redshift de 500 vCPU (dc2.8xlarge, ra3.16xlarge,...). La différence de prix est également spectaculaire.

Enfin, les informations sur les vCPU peuvent ne pas être accessibles au public, comme c'est le cas avec Snowflake, qui choisit de dissimuler ce détail derrière son service d'entrepôt de données cloud . 

Comparer les prix sur la base du nombre de nœuds est similaire à comparer les vCPU - il faut prendre soin de déterminer comment le nombre de nœuds est significatif. Google BigQuery n'utilise pas le concept de nœuds et Snowflake ne divulgue pas directement au public les spécificités du nombre de nœuds. Toutefois, la documentation de Snowflake indique que la taille "X-Small" correspond à un seul "serveur", et que le nombre de serveurs est doublé jusqu'à un maximum de 128 serveurs, ce qui correspond à un Snowflake 4X-Large. 

Cela dit, un serveur Snowflake ne doit pas être assimilé directement à un nœud Redshift, car les types de nœuds sous-jacents peuvent être différents et les méthodologies de calcul varient. 

Illustration des différences de prix

Comme nous l'avons mentionné, il peut être difficile de comparer directement les prix. L'idéal, bien sûr, est d'effectuer vos propres tests sur les différents entrepôts de données cloud pour vous faire une idée des prix. Néanmoins, pour éviter les surprises en matière de facturation, il est utile de savoir comment chaque entrepôt de données fonctionne et génère des frais de calcul et de stockage. D'autant plus que les fonctions de pause et de reprise, la facturation à la seconde et les dépendances connexes sont de plus en plus populaires.   

Dans le prochain blog de cette série, nous examinerons des scénarios hypothétiques qui serviront de guide pour la fixation des prix.

Photo de Michael Nixon
Vice-président de Cloud Data Marketing chez SnapLogic

Nous recrutons !

Découvrez votre prochaine grande opportunité de carrière.