Pubblicato originariamente su InsideBigData.
I big data sono un grande affare e una grande opportunità. La sfida è che la maggior parte dei progressi dei big data è stata limitata alle grandi aziende con grandi team di ingegneria e scienza dei dati. I sistemi possono essere complessi, immaturi e difficili da gestire. Questo può andare bene se siete uno sviluppatore ben addestrato nella Silicon Valley, ma non va bene se siete un dirigente IT di una banca di Atlanta o un leader aziendale in movimento ad Amsterdam. Come si fa a sfruttare i big data se non si dispone di un esercito di ingegneri sempre aggiornati sulle ultime novità tecnologiche?
Fortunatamente, un aiuto è in arrivo grazie a diverse tendenze che spostano la tecnologia dal primo piano allo sfondo.
Innanzitutto, i big data si stanno spostando sul sito cloud. Amazon, Microsoft e Google offrono ora Hadoop e Spark "come servizio", eliminando la necessità di creare un cluster, ricercare nuovi prodotti software o preoccuparsi della gestione delle versioni. Le aziende stanno spostando sempre più spesso i loro carichi di lavoro sui big data all'interno di cloud, nascondendo la complessità agli utenti e affidandosi ai migliori professionisti dei data center del mondo per gestire la tecnologia. Vogliono accedere all'infrastruttura quando e come vogliono, con tutto ciò che serve, ma anche di più.
Il prossimo passo è l'emergere dell'informatica "serverless". Questo si basa sulla tendenza di cloud , ma elimina ancora di più le dipendenze tecnologiche. Basta caricare i dati e iniziare l'elaborazione. Dite al vostro fornitore di cloud cosa volete fare, quanti dati volete elaborare e dove volete eseguirli: l'infrastruttura verrà attivata quando ne avrete bisogno e disattivata quando non ne avrete bisogno. Questo è incredibile per i rivenditori e le aziende CPG, ad esempio, che possono avere attività stagionali e quindi esigenze di dati fluttuanti durante l'anno. Possono eseguire analisi dei dati critici in base alle esigenze, senza dover pagare per un'infrastruttura robusta durante i periodi non di punta.
La terza grande tendenza è il passaggio al self-service, alimentato da nuovi strumenti e piattaforme che democratizzano sia l'integrazione che il consumo dei dati. L'"integrazione self-service" consente di collegare i sistemi, creare pipeline di dati e automatizzare i processi in modo semplice e veloce, senza dover ricorrere a un'intensa attività di codifica. Allo stesso modo, la "self-service analytics" consente agli analisti e agli utenti aziendali di manipolare i dati senza l'intervento dell'IT. Su entrambi i fronti, il self-service abbassa i requisiti di competenza tecnologica, aprendo la porta dei dati a milioni di nuovi utenti.
Infine, ma non certo per importanza, l'apprendimento automatico e l'intelligenza artificiale, che vengono utilizzati per incorporare sempre più intelligenza nelle applicazioni. I sistemi imparano semplicemente dai dati che scorrono e forniscono intuizioni predittive o consigliano azioni di conseguenza. Ad esempio, oggi possiamo offrire un'integrazione "a guida autonoma" che apprende da milioni di elementi di metadati e miliardi di flussi di dati per fornire agli utenti indicazioni esperte passo dopo passo nella creazione delle loro pipeline di dati. Questo riduce la curva di apprendimento per gli utenti aziendali e gli analisti, liberando al contempo i team tecnici per l'innovazione e la governance a più alto valore.
Tutte e quattro queste tendenze si avvalgono di tecnologie molto avanzate, ma ciò che è notevole è quanto "nascondano" la tecnologia per concentrarsi maggiormente sui dati e sull'azienda , esattamente dove dovrebbe essere l'obiettivo. È molto simile a quello che stiamo vedendo con i software incredibilmente intuitivi per i consumatori, che funzionano senza bisogno di formazione o di interventi manuali. Come i consumatori, anche le aziende vogliono fare più cose in fretta, con comodità e accesso rapido. Vogliono funzionalità all'avanguardia, ma non vogliono avere a che fare con bug, integrazioni non funzionanti e versioni in rapida evoluzione.
In fin dei conti, la maggior parte delle aziende vuole solo dati migliori e risposte più rapide, senza i grattacapi della tecnologia. "Dovrei essere in grado di scrivere la domanda e ricevere una risposta". Grazie a cloud, al serverless computing, alle piattaforme self-service e alle tecnologie di autoapprendimento, ci stiamo avvicinando a questo obiettivo. Anche se i big data non sono ancora al livello di semplicità della ricerca di Google o dell'abilità di Alexa, tutti noi dovremmo aspirare a portarli lì.