Als Teil unserer laufenden WebinarreiheVor kurzem war der Branchenanalyst Mark Madsen, Präsident und Gründer von Third Nature, bei uns zu Gast. Mark schreibt und spricht in der ganzen Welt über Datenstrategie, Analytik und BI. Das Thema: Unternehmensdatenseen. Insbesondere die Dinge, die man beachten sollte, bevor man kopfüber in den See springt. Mark beschrieb, dass die einfache Installation von Hadoop noch keinen Data Lake ausmacht. Außerdem schlug er ein Architekturmodell vor, das einen Rahmen für die Datenerfassung, das Datenmanagement und den Datenzugriff in einem Data Lake bietet. Das aufgezeichnete Webinar kann hier eingesehen.
Mark hat ein begleitendes Whitepaper mit dem Titel "Building an Enterprise Data Lake" verfasst: Important Considerations" (Wichtige Überlegungen), in dem die Komponenten einer Data Lake-Architektur und die Arten von Aktivitäten, die ein Enterprise Data Lake unterstützen sollte, erörtert werden. Mein Lieblingszitat:
"Durch die Installation von Hadoop erhält man keinen Data Lake, genauso wenig wie man durch die Installation einer Datenbank ein Data Warehouse erhält.
Das Papier ist erhältlich für Download von der SnapLogic-Website. Hier finden Sie die Folien des Webinars: