Prodotti Data Lake - Spiegazione e descrizione

Quali sono i prodotti di data lake?

Un data lake è un sistema di archiviazione che può ospitare dati di qualsiasi dimensione, tipo o forma, strutturati, semi-strutturati e non strutturati. La sua esclusiva architettura piatta consente di recuperare rapidamente i dati su richiesta per elaborarli, analizzarli e perfezionarli.

Diversi prodotti informatici potenti sfruttano la capacità e la velocità dei data lake:

Apache Hadoop Distributed File System (HDFS) è un framework open-source che consente l'archiviazione e l'elaborazione di grandi insiemi di dati suddividendo i file in grandi blocchi e distribuendoli tra i nodi di un cluster.

Apache Hive è un software che legge e scrive big data memorizzati[MOU1] in database e file system distribuiti. La sua interfaccia e il suo linguaggio simile a SQL, HiveQL, facilitano la sintesi, l'interrogazione e l'analisi dei dati. È un'infrastruttura open-source costruita sulla base di Hadoop.

Google BigQuery è un servizio web RESTful utilizzato per l'analisi dei big data basata su cloud. Supporta la gestione dei dati, l'interrogazione e il controllo dell'accesso a insiemi di dati molto grandi. Come Apache Hive, utilizza una sintassi simile a quella di SQL. Fa parte della piattaforma Google Cloud .

Amazon DynamoDB è un servizio di database NoSQL basato su cloud che supporta sia modelli di documenti che di archivi di valori-chiave. Supporta le applicazioni che necessitano di una latenza costante a una cifra al millisecondo.

L'architettura Snaplex di SnapLogic collega cloud, on-premises e gli endpoint dei big data attraverso app, database, IoT e API con SL eXtreme.

SnapLogic è l'unica piattaforma di integrazione unificata di dati e applicazioni come servizio(iPaaS) in grado di collegare tutte le applicazioni software e le fonti di dati cloud, on-premises e ibride.