Data Mesh vs. Data Fabric: La confusione continua

Negli ultimi mesi Gartner ha dato il via alla serie di Data and Analytics Summit 2022, prima a Londra e più recentemente a Orlando, in Florida. Uno dei risultati di questi eventi è che c'è stato un notevole aumento di messaggi da parte dei fornitori e di discussioni da parte di Gartner relative al framework Gartner Data Fabric.

A meno che non siate membri della comunità della gestione dei dati, dell'analisi e dell'IT o non abbiate nascosto la testa nella proverbiale sabbia, il data fabric di Gartner è considerato in gran parte come un framework di decentralizzazione concorrente al framework di decentralizzazione della rete di dati fondato e avanzato da Zhamak Dehghani (ora ex ThoughtWorks).

Punti di forza

Non c'è nulla di strano nei cambiamenti di messaggistica, è prevedibile e accade di continuo. Più interessante è stato il livello di confusione che continua a crescere nel tentativo di comprendere le differenze tra gli approcci data mesh e data fabric. Quando ho affrontato l'argomento con gli analisti di Gartner durante gli eventi del Gartner Data and Analytics Summit, è stato riconosciuto il gran numero di discussioni che circondano il data fabric e il data mesh. Secondo i rappresentanti di Gartner, "stanno rispondendo a un numero maggiore di domande sul data mesh rispetto al data fabric rispetto al passato". Allo stesso tempo, è stato affermato che "data mesh e data fabric possono coesistere, non si escludono a vicenda".

Tuttavia, Gartner ha un'opinione contrastante sul data mesh, come si evince dal suo ultimo Hype Cycle per la gestione dei dati (2022), in cui ha definito il data mesh "obsoleto prima del plateau" [nota a margine: siete perdonati se trovate questa azione di Gartner auto-assolutoria]. Dalle discussioni con gli analisti ho dedotto che Gartner ha definito il data mesh "obsoleto" non perché lo ritenga in via di estinzione, ma perché vede il data mesh assorbito in un framework di data fabric, dato che sostiene che il data fabric sia l'approccio di data governance e master data management più completo e aggregato. A mio avviso, questa affermazione deve essere analizzata, dato che il libro di oltre 340 pagine di Dehghani, Data Mesh, Delivering Data-Driven Value at Scale (che spiega il data mesh) dedica un intero capitolo a Principle of Federated Computational Governance. Nel libro, la governance viene effettivamente presa in considerazione con il Data Mesh, ma non sotto forma di modello centralizzato.

Tuttavia, con il documento Data Mesh e Data Fabric, uguali o diversi? (giugno 2022, G00769853), Gartner tenta di rispondere alla crescente confusione che sembra essere stata generata dagli architetti aziendali e dai leader del settore dati e analisi. Gartner esprime una posizione (vedi Figura 1) secondo cui entrambi gli approcci, data mesh e data fabric, condividono lo stesso obiettivo di un facile accesso ai dati, ma il data fabric offre "apprendimento e valutazione continui grazie ai metadati", mentre con il data mesh "la curiosità e la completezza del PMI determinano il successo o il fallimento". Gartner indica inoltre nel documento che "a partire dalla prima metà del 2022, meno dell'1,5% del mercato IT mondiale ha esperienza diretta con entrambi gli approcci. Nei prossimi 3-5 anni si prevede un'ampia variazione in termini di pratica e di fornitura".

Figura 1. Immagine estratta da Data Mesh e Data Fabric di Gartner: uguali o diversi?

Quindi, dobbiamo credere che tutti parlano di data mesh e data fabric, ma nessuno lo fa?
Tutto ciò è sufficiente a far esplodere la testa.

La ragione più probabile del basso livello di esperienza dell'1,5% è che, indipendentemente dal framework che si desidera seguire, data mesh o data fabric, è difficile da implementare e certamente non è un prodotto pronto all'uso che può essere acquistato, come la maggior parte dei sostenitori (e dei distrattori) del data mesh sa.

Integrazione federata: La chiave per ottenere una rete di dati o un tessuto di dati

Un'altra osservazione emersa dal recente Gartner Data and Analytics Summit di Orlando è che c'è stato un posizionamento relativamente maggiore di tecnologie rivolte sia ai gruppi IT che a quelli aziendali, piuttosto che solo a quelli IT. È ragionevole supporre che anche il fermento per la rete di dati abbia qualcosa a che fare con questo fenomeno. La proprietà del dominio dei dati da parte dei gruppi aziendali è uno dei quattro principi principali del concetto di data mesh (gli altri tre principi sono: dati come prodotto, self-service e governance computazionale federata).

Questi principi sono facili da dire, ma difficili da realizzare interamente attraverso un singolo prodotto.

Per questo motivo, in SnapLogic abbiamo abbracciato un modello federato progettando esperienze specifiche per l'IT, gli utenti aziendali e i professionisti dei dati, consentendo al contempo la separazione logica dei domini quando lo si desidera. Ad esempio, con ogni istanza della piattaforma SnapLogic, è possibile creare spazi di lavoro, che chiamiamo Org. Ogni Org ha una separazione logica: i team aziendali possono avere la propria Org, l'IT può avere un'Org, ecc. Tutte le Org, anche se distribuite, possono essere monitorate e gestite a livello globale.

Utilizziamo un approccio visivo e grafico all'SQL dichiarativo. A ciò si aggiunge l'integrazione assistita dall'intelligenza artificiale, che esegue raccomandazioni per i passi successivi durante la creazione di un flusso di dati o di una pipeline di processi aziendali. Insieme, queste funzionalità semplificano notevolmente le integrazioni per tutti. Anche i nostri utenti più esperti dichiarano di aver risparmiato dal 50 al 60% del tempo nella creazione di pipeline utilizzando il nostro assistente di integrazione Iris AI rispetto a chi non lo utilizza.

Gli utenti di SnapLogic risparmiano ancora più tempo rispetto alla codifica manuale. Questo rende possibile il self-service su scala. Le nostre installazioni più grandi hanno centinaia, se non migliaia, di persone che eseguono le proprie integrazioni.

Combiniamo anche l'integrazione dei dati, l'integrazione app-to-app e lo sviluppo/gestione delle API (APIM) in un'unica piattaforma.

Volete separare completamente i team e raggiungere la piena decentralizzazione? Volete condividere i prodotti di dati?

Le API saranno fondamentali per raggiungere questo obiettivo e l'offerta di APIM come parte dell'esperienza di integrazione di SnapLogic vi renderà la vita più facile.

Preferiamo guardare attraverso la confusione e non discutere un approccio rispetto all'altro, ma piuttosto portarvi un passo più vicino a un framework di data mesh e data fabric, se questa è la direzione in cui siete diretti. A nostro avviso, volete l'agilità e l'accelerazione del business, su scala, ma potete fare a meno dell'assurda complessità che caratterizza i moderni approcci alle piattaforme di dati.

Secondo le parole del nostro visionario CEO, Gauarv Dhillon, "le moderne piattaforme di dati si costruiscono, non si comprano".

Scoprite di persona la piattaforma di integrazione self-service leader del settore richiedendo una demo personalizzata.