Come parte della nostra continua serie di webinardi recente ci ha raggiunto l'analista di settore Mark Madsen, presidente e fondatore di Third Nature. Mark scrive e parla in tutto il mondo di strategia dei dati, analisi e BI. L'argomento: i data lake aziendali. In particolare, le cose da considerare prima di buttarsi a capofitto nel lago. Mark ha descritto come la semplice installazione di Hadoop non costituisca un data lake. Ha inoltre suggerito un modello architettonico che fornisce un quadro per l'acquisizione, la gestione e l'accesso ai dati in un data lake. Il webinar registrato può essere visualizzati qui.
Mark ha redatto un whitepaper di accompagnamento, anch'esso intitolato "Building an Enterprise Data Lake: Important Considerations", che illustra i componenti dell'architettura di un data lake e i tipi di attività che un data lake aziendale dovrebbe supportare. La mia citazione preferita:
"L'installazione di Hadoop non dà origine a un data lake, così come l'installazione di un database non dà origine a un data warehouse".
Il documento è disponibile per scaricare dal sito web di SnapLogic. Ecco le diapositive del webinar: