SnapLogic Roadshow - Il Data Warehouse è morto?

Risposta breve a questa domanda provocatoria: no, sta solo cambiando. Il nostro road show sull'integrazione dei dati ha toccato quattro città statunitensi nelle ultime due settimane. La presentazione principale è stata tenuta da James Markarian, CTO di SnapLogic. Ha condiviso il suo punto di vista sulla gestione moderna dei dati, sul ruolo del data warehouse in un ambiente ibrido cloud e sulle considerazioni importanti per una strategia di data lake aziendale.

James Markarian presenta al roadshow SnapLogic di luglio 2016.
James Markarian presenta al roadshow SnapLogic di luglio 2016.

 

A noi si è unito anche il nostro partner, Amazon Web Services, che ha messo in evidenza la sua piattaforma di gestione dei dati cloud , con particolare attenzione ad Amazon Redshift. Insieme abbiamo evidenziato alcuni dei successi congiunti di SnapLogic/AWS relativi all'integrazione dei dati ibridi cloud , tra cui GameStop, Box, CapitalOne ed eero.

La maggior parte del keynote di James si è concentrata sui cambiamenti del panorama dei dati che stanno influenzando il ruolo e la struttura del data warehouse. Ha descritto il "data warehousing 1.0" degli anni '80, che ha introdotto un luogo unico e conveniente per l'archiviazione di tutti i dati, ma che era costoso e dipendeva dallo scripting per integrare le fonti. Ha fatto una contrapposizione con il "data warehousing 2.0" degli anni '90, che ha visto l'ascesa dei processi ETL e dei data mart, ma che era ancora rigido e tipicamente on-premise. Da quell'epoca, tuttavia, il data warehousing è rimasto generalmente statico. Ora, con l'aumento vertiginoso dei dati non strutturati e polistrutturati e la cloudificazione delle fonti di dati, il data warehousing 2.0 è rimasto un po' indietro. Ecco che entra in scena il data lake. James ha invitato il pubblico a non pensare a un data lake come a una discarica amorfa e senza regole per i dati non strutturati. Ha invece identificato diverse "zone" all'interno del data lake, ognuna delle quali ha determinati requisiti, regole e utilizzi.

Infine, James ha illustrato come i data mart lakeshore e i data warehouse basati su cloud, collegati con SnapLogic, risolvono alcuni dei rischi e degli elevati costi di manodopera che possono essere associati ai data lake incentrati su Hadoop.

I partecipanti - alcuni dei quali erano già molto avanti nel loro percorso di adozione dei data lake e altri ancora in un ambiente di "data warehouse 2.0" - hanno sicuramente lasciato spunti di riflessione. Tenete d'occhio questo spazio per la prossima volta che SnapLogic verrà in una città vicina a voi.

Nel frattempo, non dimenticate di abbonarvi alla nostra serie di podcast sulla gestione dei dati chiamata SnapTalk.

Stiamo assumendo!

Scoprite la vostra prossima grande opportunità di carriera.