SnapLogic Roadshow - Ist das Data Warehouse tot?

Kurze Antwort auf diese provokante Frage: Nein - es ändert sich gerade. Unsere Datenintegrations-Roadshow hat in den letzten zwei Wochen vier Städte in den USA besucht. Die Keynote-Präsentation wurde von James Markarian, dem CTO von SnapLogic, gehalten. Er teilte seine Sichtweise über modernes Datenmanagement, die Rolle des Data Warehouse in einer hybriden Cloud-Umgebung und wichtige Überlegungen für eine Data Lake-Strategie im Unternehmen.

James Markarian präsentiert auf der SnapLogic-Roadshow im Juli 2016.
James Markarian präsentiert auf der SnapLogic-Roadshow im Juli 2016.

 

Unser Partner, Amazon Web Services, stellte seine Cloud-Datenmanagement-Plattform vor, wobei der Schwerpunkt auf Amazon Redshift lag. Gemeinsam stellten wir einige der gemeinsamen Erfolgsgeschichten von SnapLogic und AWS rund um die Integration von Hybrid-Cloud-Daten vor, darunter GameStop, Box, CapitalOne und eero.

Der Hauptteil von James' Keynote konzentrierte sich auf die Veränderungen in der Datenlandschaft, die sich auf die Rolle und Struktur des Data Warehouse auswirken. Er beschrieb das "Data Warehousing 1.0" aus den 1980er Jahren, mit dem ein bequemer, zentraler Ort für die Speicherung aller Daten eingeführt wurde, der aber teuer war und auf Skripte zur Integration der Quellen angewiesen war. Er stellte dem das Data Warehousing 2.0" der 1990er Jahre gegenüber, das den Aufstieg von ETL-Prozessen und Data Marts mit sich brachte, aber immer noch starr und typischerweise vor Ort angesiedelt war. Seit dieser Ära ist das Data Warehousing jedoch im Allgemeinen statisch geblieben. Jetzt, mit der dramatischen Zunahme unstrukturierter/polystrukturierter Daten und der Cloudifizierung von Datenquellen, ist Data Warehousing 2.0 ein wenig ins Hintertreffen geraten. Jetzt kommt der Datensee. James warnte die Zuhörer davor, einen Data Lake als eine amorphe, regellose Müllhalde für unstrukturierte Daten zu betrachten. Stattdessen identifizierte er mehrere "Zonen" innerhalb des Data Lake, von denen jede bestimmte Anforderungen, Regeln und Verwendungszwecke hat.

Abschließend erläuterte James, wie Lakeshore Data Marts und Cloud-basierte Data Warehouses - verbunden mit SnapLogic - einige der Risiken und hohen Arbeitskosten, die mit Hadoop-zentrierten Data Lakes verbunden sein können, beseitigen.

Die Teilnehmer - von denen einige bereits weit in ihrer Data-Lake-Einführung fortgeschritten waren und andere sich noch in einer Data Warehouse 2.0"-Umgebung befanden - haben sicherlich einige Denkanstöße erhalten. Achten Sie an dieser Stelle auf das nächste Mal, wenn SnapLogic in eine Stadt in Ihrer Nähe kommt.

Vergessen Sie in der Zwischenzeit nicht, unsere Datenmanagement-Podcast-Serie SnapTalk zu abonnieren.

Wir stellen ein!

Entdecken Sie Ihre nächste große Karrierechance.