Data Mesh vs. Data Fabric - Spiegazione e panoramica

Qual è la differenza tra data mesh e data fabric?

Data mesh e data fabric sono strutture di analisi e gestione dei dati in gran parte simili e sovrapponibili, ma con alcune aree di distinzione.

Il framework Data Mesh è stato fondato da Zhamak Dehghani (ex consulente di Thoughtorks) e da lei definito come un approccio sociotecnico decentralizzato per la condivisione, l'accesso e la gestione di dati analitici in ambienti complessi e di grandi dimensioni, all'interno e tra gli ambienti.

Il framework data fabric è stato sviluppato da Gartner e viene definito da quest'ultima come un concetto di design che funge da strato integrato (fabric) di dati e processi di connessione. Un data fabric utilizza analisi continue su risorse di metadati esistenti, individuabili e inferenziati per supportare la progettazione, la distribuzione e l'utilizzo di dati integrati e riutilizzabili in tutti gli ambienti. Questo include piattaforme ibride e multicloud .

"Un data fabric è un'implementazione abilitata dalla tecnologia in grado di produrre molti output, di cui solo uno è costituito da prodotti di dati. Una rete di dati è un'architettura di soluzioni con l'obiettivo specifico di creare prodotti di dati incentrati sul business".

Gartner

In che modo le aziende utilizzano il data mesh o data fabric? 

Entrambi i framework data mesh e data fabric si concentrano sulla proprietà e sulla gestione decentralizzata dei dati. In questo contesto, decentralizzazione significa che i gruppi aziendali e i proprietari dei dati gestiscono i propri dati o hanno una proprietà condivisa con il reparto IT aziendale, piuttosto che i dati sono centralizzati e di proprietà dell'IT.

La rete di dati è caratterizzata da quattro principi specifici: decentralizzazione, accesso self-service ai dati, proprietà del dominio dei dati e governance computazionale federata. 

Il Data Fabric è caratterizzato da ampi metadati attivi, facilità di accesso ai dati, apprendimento continuo dai metadati e distribuzione automatizzata.

In termini di aree di distinzione, data mesh e i seguaci di questo framework tendono a porre un'enfasi maggiore sui prodotti di dati di proprietà del dominio, non centralizzati attraverso l'IT, come meccanismo principale per raggiungere la scala e un time-to-value più rapido dall'analisi dei dati. Mentre data fabric e Gartner tendono a porre un'enfasi maggiore sull'importanza dei metadati globali e attivi come chiave per consentire agli ambienti di dati decentralizzati e distribuiti di operare su scala e con facilità.

Quale framework devo utilizzare? Data mesh o data fabric?

Entrambi i framework hanno lo scopo di aiutare gli utenti aziendali a creare prodotti di dati più velocemente. Entrambi i framework funzionano. 

Le aziende possono approfondire ogni framework e scegliere quello più adatto alle loro esigenze. Oppure scegliere gli elementi e creare un framework di dati personalizzato per la propria organizzazione.

La rete di dati e il tessuto di dati sono quadri di riferimento per guidare la strategia - nessuno dei due può essere acquistato. 

Le aziende non possono acquistare o distribuire un prodotto o una piattaforma data mesh, ma possono scegliere di applicare un framework data mesh al modo in cui gestiscono i dati su scala. Il passaggio al data mesh o data fabric fa parte della trasformazione digitale e deve essere guidato dall'alto verso il basso con un'implementazione a livello aziendale.

Qualunque sia il metodo di decentramento dei dati che le aziende scelgono di utilizzare, l'obiettivo finale è quello di creare più rapidamente prodotti di dati che portino a risultati di business. Per farlo, le aziende devono integrare i dati su scala.