Data Lake Produkte - Erläuterung & Überblick

Was sind einige Data Lake-Produkte?

Ein Data Lake ist ein Speichersystem, das Daten jeder Größe, Art und Form aufnehmen kann - strukturiert, halbstrukturiert und unstrukturiert. Seine einzigartige flache Architektur ermöglicht den schnellen Abruf von Daten bei Bedarf zur Verarbeitung, Analyse und Verfeinerung.

Mehrere leistungsstarke Computing-Produkte nutzen die Kapazität und Geschwindigkeit von Data Lake:

Apache Hadoop Distributed File System (HDFS) ist ein Open-Source-Framework, das die Speicherung und Verarbeitung großer Datensätze ermöglicht, indem Dateien in große Blöcke aufgeteilt und auf die Knoten eines Clusters verteilt werden.

Apache Hive ist eine Software zum Lesen und Schreiben von Big Data, die in verteilten Datenbanken und Dateisystemen gespeichert sind[MOU1]. Seine SQL-ähnliche Schnittstelle und Sprache, HiveQL, erleichtert die Zusammenfassung, Abfrage und Analyse von Daten. Es handelt sich um eine Open-Source-Infrastruktur, die auf Hadoop aufbaut.

Google BigQuery ist ein RESTful-Webdienst, der für Cloud-basierte Big-Data-Analysen verwendet wird. Er unterstützt die Datenverwaltung, Abfrage und Zugriffskontrolle von sehr großen Datensätzen. Wie Apache Hive verwendet es eine SQL-ähnliche Syntax. Es ist ein Teil der Google Cloud Platform.

Amazon DynamoDB ist ein Cloud-basierter NoSQL-Datenbankdienst, der sowohl Dokument- als auch Key-Value-Store-Modelle unterstützt. Er unterstützt Anwendungen, die konsistente Latenzzeiten im einstelligen Millisekundenbereich benötigen.

Die Snaplex-Architektur von SnapLogic verbindet Cloud-, On-Premises- und Big-Data-Endpunkte über Anwendungen, Datenbanken, IoT und APIs mit SL eXtreme.

SnapLogic ist die einzige einheitliche Daten- und Anwendungsintegrationsplattform als Service(iPaaS), die alle Ihre Cloud-, lokalen und hybriden Softwareanwendungen und Datenquellen miteinander verbinden kann.


Weitere Inhalte, die Sie interessieren könnten