Startseite ❯ Blog ❯ SnapReduce 2.0 macht Big Data elastisch

SnapReduce 2.0 macht Big Data elastisch

SnapLogic hat heute SnapReduce 2.0 angekündigt, das Big Data elastisch machen soll.

Wie wir hierher gekommen sind:

Obwohl Hadoop einen enormen Wert in Form von Einblicken in zuvor nicht genutzte Geschäftsdaten verspricht, konnten nicht alle Unternehmen das gelobte Land erreichen, denn:

Die meisten Kunden sind nicht in der Lage, auf alle Daten, die sie für umfassende analytische Erkenntnisse benötigen, zuzugreifen und sie zu integrieren. Dank der massiv parallelen Verarbeitungsfunktionen von Hadoop werden Ihre Algorithmen umso intelligenter, je mehr Daten Sie einbeziehen und je besser Ihre Erkenntnisse sind. Entwickler-Tools wie Sqoop sind schwer zu bedienen und können sehr schwerfällig werden, da sie kaum wiederverwendet werden. Außerdem sind diese Tools gut geeignet, um Daten aus lokalen Systemen zu verarbeiten, aber sie erhalten auch Daten aus Cloud-Anwendungen und -Quellen wie Salesforce und Workday sowie aus benutzerdefinierten Anwendungen, die in öffentlichen Clouds wie Amazon Web Services (AWS) und Microsoft Azure laufen.
MapReduce, die wichtigste Datenverarbeitungsmaschine in Hadoop, ist ebenfalls ein sehr entwicklungsorientiertes Tool. Um Analysen durchführen zu können, müssen Datenwissenschaftler MapReduce-Aufträge schreiben. Von ihnen wird nun erwartet, dass sie nicht nur ihre Daten und Statistiken kennen, sondern auch erstklassige Programmierer sind. Das Hinzufügen einer Entwicklerressource zur Verfügung des Datenwissenschaftlers verlangsamt diesen nur, da jede kleine Änderung zu einer Änderungsanforderung wird.

Die Hadoop-Community hat diese Lücken erkannt und Hadoop durch die Einführung von Yet Another Resource Negotiator (YARN) erweiterbar gemacht. YARN, auch bekannt als MapReduce 2.0, ermöglicht es Hadoop-Benutzern, beliebige Aufgaben im Hadoop-Framework auszuführen.

SnapReduce 2.0

Mit SnapReduce 2.0 stellt SnapLogic seine gesamte Elastic Integration Platform für Hadoop-Anwender zur Verfügung. Durch die YARN-Verwaltung können Benutzer jetzt ihre Big Data elastisch machen. Und so geht's:

Elastische Skala: Benutzer können ihre elastischen Integrationen im Hadoop-Maßstab ausführen, indem sie SnapLogic-Integrationen nativ auf Hadoop als YARN-verwaltete Ressourcen ausführen. Dies ist möglich aufgrund der SnapLogic Software-definierte Integration Architektur, bei der die Datenebenen lediglich Ausführer von Anweisungen sind, die von der Steuerebene. Diese Datenebenen, die so genannten Snaplexes, können auf jeder Plattform ausgeführt werden, die Java unterstützt, wozu auch Hadoop gehört.
Reichhaltigere Daten in Hadoop: Neben der grundlegenden Datenintegration können Datenwissenschaftler auch Daten aus über 160 Datenquellen, sowohl vor Ort als auch in der Cloud, ohne jegliche Kodierung einbinden. Die umfangreiche Drag-and-Drop-Benutzeroberfläche von SnapLogic erfordert keine speziellen Integrationskenntnisse für Datenwissenschaftler. Darüber hinaus sind die schemalosen Integrationspipelines von SnapLogic (weakly-typed vs. strongly-typed) in der Welt von Big Data äußerst widerstandsfähig und wiederverwendbar.
Datenaufbereitung: Mit SnapReduce und SnapLogic können Datenwissenschaftler Daten grafisch transformieren und anreichern, ohne sie zu programmieren. Gängige, aber mühsame Aufgaben wie Union und Joins werden zu einer Frage von Drag, Drop und Konfiguration.
Elastische Bereitstellung: SnapReduce 2.0 ermöglicht es ihnen auch, ihre Analyseergebnisse elastisch über mehrere Kanäle bereitzustellen - Dateien, APIs oder Visualisierungstechniken wie Tableau. Datenwissenschaftler können Pipelines erstellen, die ihre Ergebnissätze aus Hadoop lesen und sie an Geschäftsanalysten als CSV-Dateien, Tableau-fähige Datenformatdateien oder an herkömmliche Data Warehouses und BI-Tools im relationalen Format für eine hochgradig optimierte Analyseerfahrung liefern.

Mit der Konsolidierung von Speicherung, Datenverarbeitung und jetzt auch der Integration von Big Data in die Hadoop-Plattform wird diese für die Kunden zu einer einzigen Datenmanagement-Plattform. Dies hilft ihnen, ihren Datenmanagement-Stack auf Hadoop zu rationalisieren und ihre Big-Data-Investitionen zu rationalisieren. Bestehende SnapLogic-Kunden verlassen sich darauf, dass wir sie bei ihren Big-Data-Initiativen unterstützen. In der Regel handelt es sich dabei um Kunden, die bereits auf die SnapLogic Elastic Integration Platform für ihre Anwendungs-, API- oder klassischen ETL/ELT-Integrationsanforderungen vertrauen und die Fähigkeiten von SnapLogic auf Big Data und Analytics ausdehnen möchten, um auf einer einzigen Plattform für alle ihre Unternehmensintegrationsanforderungen zu standardisieren.

Hier ist, was unser Partner Cloudera zu der heutigen Ankündigung zu sagen hatte:

Unsere Kunden erkennen den Wert des Aufbaus eines unternehmensweiten Datendrehkreuzes, und moderne Technologien zur Datenerfassung und -umwandlung sind für die Erzielung maximaler betrieblicher und analytischer Vorteile unerlässlich. Wir freuen uns, mit SnapLogic bei der Markteinführung von SnapReduce 2.0 zusammenzuarbeiten, damit Kunden die massiv-parallelen Verarbeitungsfunktionen von Cloudera Enterprise für ihre Big-Data-Integrationsinitiativen nutzen können. Initiativen nutzen können.

Nächste Schritte:

Melden Sie sich für das SnapReduce 2.0 Frühzugangsprogramm an
Sehen Sie sich eines unserer Videos auf SnapTV an
Kontaktieren Sie uns für weitere Informationen

Kategorie: Produkt

Themen: API-Freigabe SnapReduce

SnapReduce 2.0 macht Big Data elastisch

Verwandte Blogs

Data Warehouses, Data Lakes und Data Lakehouses: Alles, was Sie wissen müssen

Was ist Datenintegration? Der ultimative Leitfaden

Acht Datenmanagement-Anforderungen für den Enterprise Data Lake