L'evoluzione della gestione dei dati IOT con Joseph A di Paolantonio

Il post di oggi è di Joseph A. di Paolantonio, un esperto del settore che lavora alla convergenza dell'IoT con la gestione e l'analisi dei dati presso DataArchon.com e il Boulder BI Brain Trust. Sfruttando una carriera iniziata con la ricerca sulle energie rinnovabili nella scuola di specializzazione e nell'industria, sviluppando modelli e algoritmi di valutazione del rischio per i sistemi aerospaziali e gestendo team per il data warehousing aziendale, la BI e la scienza dei dati, Joseph sta definendo ecosistemi di analisi dei sensori per ottenere valore dall'IoT.

Che cos'è l'IOT

È da molto tempo che ci chiediamo cosa sia l'IoT. Da quando Kevin Ashton ha coniato l'espressione per la prima volta nel 1999, e forse anche da quando Nikola Tesla ha giocato per la prima volta con una barca telecomandata nel 1898. Per molti, il semplice atto di collegare un dispositivo, non un computer o un router, a Internet è sufficiente. Ma anche se tutto ciò che ci circonda, al lavoro, a casa, per lavoro, per gioco, fosse connesso... È questo l'Internet delle cose? Questo soddisfa gran parte del clamore o delle storie che circondano l'IoT? Niente affatto.

evodatamgmt_webinar_g

Se guardiamo al modo in cui si sta sviluppando l'IoT, vediamo in realtà un'Internet di poche cose, o molte Intranet di cose simili. Vediamo nascere molti verticali, come l'Industrial Internet of Things, con la creazione di silos a grana ancora più fine all'interno di ciascun verticale industriale. Sottoinsiemi dell'IoT vengono creati in verticali tradizionali, come la sanità, i trasporti pubblici, le auto a guida autonoma, l'agricoltura e l'industria mineraria. E vecchi mercati, come la domotica, l'infrastruttura di misurazione avanzata e la pianificazione urbana, vengono rivitalizzati dall'IoT come case intelligenti, reti intelligenti e città intelligenti. Ma se si risale agli esperimenti di Tesla con l'RC, o ai primi computer incorporati degli anni '80, o ancora ai chip RFID (identificazione a radiofrequenza) nei prodotti di largo consumo (CPG) che hanno portato Ashton a coniare il termine, è ancora presto per l'IoT. Non fraintendetemi, l'IoT è qui, ma a diversi livelli di maturità, mentre avanziamo lungo un modello di connessione, comunicazione, collaborazione, contestualizzazione e cognizione. Il filo conduttore di tutte queste diverse implementazioni dei concetti dell'IoT è l'uso della gestione e dell'analisi dei dati (DMA) in continua evoluzione. Questa evoluzione è stata accelerata dai concetti di big data e, più recentemente, di fast data. Un altro filo conduttore è che l'uso di DMA avanzato, abbinato a tecnologie e processi IoT, fa sì che tutti vedano proposte di valore simili:

  1. Comprensione e fidelizzazione dei clienti
  2. Miglioramenti alla linea di fondo
  3. Efficienza dei processi
  4. Predittivi per la manutenzione, le raccomandazioni, il churn e gli acquisti

Tutti questi aspetti, e altri ancora, saranno potenziati man mano che i silos dell'IoT inizieranno a supportare spazi di soluzione serviti in modo esclusivo attraverso i processi e le tecnologie dell'IoT DMA, e ancora di più man mano che questi si evolveranno in ecosistemi di analisi dei sensori (SAE).

Gestione dei dati IoT e analisi dei sensori

Il valore da ricavare dall'IoT, sia che si parli di tutti gli IoT verticali, sia che si parli di un vasto IoT globale, deriva dai dati. Il punto principale è che questo valore può essere trovato nel sito Cloud, in altri punti centrali come il "back office" o un centro di comando, nell'Edge, dove vivono i sensori e gli attuatori, e in ogni punto intermedio. Prendiamo ad esempio il settore dei trasporti. Ogni sensore e attuatore di un veicolo, connesso a Internet, deve comunicare con altri pacchetti di sensori all'interno del veicolo e nelle aree di parcheggio, ci può essere collaborazione tra i veicoli su una strada o un'area comune, e il veicolo ha bisogno di un contesto da altri dati presi da hub e gateway in giro per la città e poi da cloud - per evitare i pericoli del traffico o l'irregolarità del conducente o la disponibilità di parcheggio, e stiamo già vedendo esempi di cognizione nei veicoli autonomi e nei robot di consegna. Ciò che è iniziato con i concetti di big data sta accelerando verso un intreccio incredibilmente complesso di numerosi flussi di dati, sia in tempo reale che storici, che aggiornano al volo gli algoritmi, le conoscenze pregresse e gli insiemi di addestramento, man mano che ogni piccolo insieme di dati provenienti da ogni coppia sensore-attuatore si costruisce su collezioni di oggetti e nel tempo. Naturalmente, tutti questi set di dati potrebbero non essere compatibili. Abbiamo avuto a che fare con queste incompatibilità di dati fin dal primo data warehouse. Ma si può immaginare di provare a gestire gli scenari IoT con un progetto di data warehouse degli anni '90? Niente affatto. Forse gli standard possono aiutare.

Gli standard sono fantastici... ce ne sono così tanti

Seguiamo oltre trenta organismi di standardizzazione, molti dei quali con centinaia di standard sovrapposti e in conflitto tra loro per l'IoT in generale, o in specifici settori verticali, che riguardano il trasporto dei dati IoT, i pacchetti di dati dei sensori, i protocolli semantici e i protocolli di comunicazione IoT. Tutti questi standard possono creare molta confusione. Cercare di determinare come questi standard si adattino al flusso di dati e ai processi aziendali può essere scoraggiante. Ma soprattutto, analizzeremo come le interfacce di programmazione delle applicazioni e i metadati possono aiutarvi ad adottare i concetti IoT nella vostra organizzazione. Così come non possiamo pensare di risolvere la gestione dei dati IoT come avremmo fatto con un data warehouse negli anni '90, dobbiamo cercare nuove soluzioni per gestire l'unione dei dati IoT. Ad esempio, un sensore o una piattaforma IoT può confezionare i propri dati in JSON e un'altra in XML. Se si sostituisce un sensore che utilizza JSON con un altro che utilizza XML, oltre alla necessità di analizzare questi dati diversi, è necessario riconoscere che i nuovi dati rappresentano una continuazione di quelli vecchi e che l'analisi dei sensori da questa posizione deve continuare senza problemi. Potrebbe essere richiesto di ingerire i dati da MQTT, o da CoAP, o dallo streaming SQL in Apache Calcite. Forse vorremo analizzare i dati in tempo reale da modelli di apprendimento automatico, mentre li raccogliamo. I dati delle serie temporali, i dati di localizzazione e tutti i vari metadati su sensori, attuatori, pacchetti, dispositivi, algoritmi e usi specifici devono essere gestiti con una tracciabilità bidirezionale che fornisca un percorso continuo dei dati. Gli strumenti e l'architettura per la gestione dei dati IoT e per la creazione di SAE sono molto diversi dalle operazioni e dalle esigenze aziendali di un decennio fa.

Architettura

L'architettura dei dati non può più basarsi sul semplice flusso di dati dai sistemi transazionali interni ai data warehouse per il reporting e l'elaborazione analitica on-line (OLAP). Per un'eccellente rassegna di una moderna architettura dei dati, con l'implementazione attraverso il concetto di data lake, date un'occhiata al white paper e al webinar di Mark Madsen di Third Nature. Un'architettura dei dati che incorpora i dati IoT deve considerare diversi fattori che non sono standard.

  • analisi dello streaming
  • interazioni tra i punti di raccolta, aggregazione e analisi, dal pacchetto di sensori al bordo della rete, ai gateway, ai centri regionali, a cloud e viceversa.
  • aggiornamenti delle conoscenze pregresse, degli insiemi di allenamento e delle distribuzioni di test, e dei modelli
  • algoritmi evolutivi
  • dati aperti
  • cambiare le fonti di terze parti
  • derivare il contesto dall'edge per i sistemi OT e IT centrali, cloud, on-premises o ibridi.
  • portare il contesto ai margini da ogni altra parte

Punti di forza

Nel corso del webinar, discuteremo cinque modi in cui i partecipanti al webinar possono prepararsi all'IoT nelle loro organizzazioni.

  1. Identificare i prodotti e i servizi strumentati
  2. Definire i potenziali miglioramenti dai dati IoT
  3. Quali dati raccogliete attualmente? Quali sono i dati disponibili che non raccogliete? Di quali dati avete bisogno per soddisfare i miglioramenti?
  4. Come gestirete e integrerete i nuovi set di dati in tutti i punti di raccolta, archiviazione e utilizzo, dall'Edge al Cloud?
  5. Quale infrastruttura DMA è disponibile o necessaria per l'ingresso dei dati in tempo reale e per la combinazione di dati storici e in tempo reale?

I dettagli sono sempre la parte interessante, quindi spero che vi iscriverete e vi unirete alla conversazione il 27 ottobre 2016 alle ore 10:00 PDT.

Categoria: IoT

Stiamo assumendo!

Scoprite la vostra prossima grande opportunità di carriera.