Oggi abbiamo annunciato il lancio di SnapLogic Data Science, una soluzione visiva self-service per l'intero ciclo di vita del machine learning (ML). SnapLogic Data Science, insieme alla pluripremiata piattaforma di integrazione di SnapLogic, Enterprise Integration Cloud, supporta l'approvvigionamento dei dati, la preparazione dei dati e l'ingegnerizzazione delle funzionalità, nonché l'addestramento, la convalida e l'implementazione di modelli di apprendimento automatico in un'unica piattaforma. È la prima nel suo genere.
Perché abbiamo costruito la nostra soluzione di data science
I progetti di machine learning coinvolgono di solito diverse persone: data engineer, data scientist, DevOps e altri. Convenzionalmente, in ogni fase del ciclo di vita del ML, la maggior parte, se non tutte, queste persone finiscono per fare un eccesso di codifica personalizzata, lavoro ridondante e tentativi ed errori manuali.
In assenza di automazione, un data engineer potrebbe passare giorni ad arrancare attraverso attività di integrazione come la raccolta, la pulizia e la trasformazione dei dati, il tutto utilizzando il codice. O peggio, il data scientist rimarrà bloccato a svolgere questo lavoro. Alla fine del ciclo di vita del ML, un team di sviluppo software deve tradurre il modello finale in un linguaggio di programmazione diverso per metterlo in produzione. Tutte queste sfide mettono a rischio il successo del progetto di ML.
Noi di SnapLogic conosciamo fin troppo bene molte di queste sfide. Le abbiamo sperimentate in prima persona quando abbiamo costruito l'Iris AI Integration Assistant, un motore di raccomandazione basato sul ML che offre suggerimenti contestuali a Snap durante la creazione di integrazioni. Abbiamo lasciato quell'esperienza con una grande consapevolezza: l'apprendimento automatico non dovrebbe comportare un lavoro ridondante e pesante dal punto di vista del codice; in realtà, ha bisogno del tipo di funzionalità self-service per cui SnapLogic è ben noto. Ecco perché abbiamo costruito SnapLogic Data Science.
Quali sono i vantaggi di SnapLogic Data Science?
SnapLogic Data Science offre la nostra comprovata produttività self-service all'intero ciclo di vita dell'apprendimento automatico, riducendo il time-to-value delle vostre iniziative di ML. Semplifica le attività di pulizia dei dati, aumenta la produttività durante il processo di sviluppo del modello e consente di distribuire il modello non appena è pronto.
SnapLogic Data Science accelera e semplifica le quattro fasi chiave del ciclo di vita dell'apprendimento automatico:
- Acquisizione dei dati
- Esplorazione e preparazione dei dati
- Formazione e validazione del modello
- Modello di distribuzione
1) Acquisizione dei dati
SnapLogic Data Science semplifica il recupero dei dati grezzi per i dataset di formazione. Invece di scrivere codice o di chiedere all'IT di ottenere una volta sola i dump dei dati, i data engineer possono consumare tutti i tipi di dati con un semplice trascinamento. SnapLogic Data Science consente di integrare facilmente una varietà di endpoint - database, sia relazionali che NoSQL, applicazioni cloud , data lake, file JSON, ecc. - quando si sviluppa un modello di ML.
2) Esplorazione e preparazione dei dati
SnapLogic Data Science consente ai data engineer e ai data scientist di filtrare facilmente le informazioni sensibili, trasformare i dati, mappare i campi ed eseguire altre attività di preparazione dei dati in un ambiente produttivo a codice ridotto. Inoltre, SnapLogic Data Science offre nuovi snap e pipeline di dati precostituiti per operazioni specifiche di machine learning. Ad esempio, lo snap da categorico a numerico del pacchetto Snap per la preparazione dei dati ML consente di convertire i dati categorici (ad esempio, piccoli, medi, grandi) in dati numerici utilizzando la codifica intera o a un punto con pochi clic.
3) Formazione e validazione del modello
SnapLogic Data Science non solo accelera la creazione dei dataset di formazione. Accelera anche la formazione e la convalida dei modelli. Questa funzionalità consente ai data scientist di configurare i modelli utilizzando gli snap, riducendo ulteriormente lo scripting. Ad esempio, gli snap per i modelli di regressione (ad esempio, Predictor - Regression Snap) implementano diversi algoritmi all'avanguardia (ad esempio, la regressione lineare) basati su librerie open source mature che i data scientist possono utilizzare durante la creazione di un modello.
Ma se preferite costruire un modello da zero, avere la flessibilità di Python e usare Jupyter Notebook, SnapLogic Data Science supporta anche questo. È sufficiente scrivere il Python nativo in Jupyter e pubblicarlo direttamente nella pipeline di SnapLogic per renderlo operativo.
SnapLogic Data Science consente inoltre di convalidare il modello con gli snap di convalida incrociata, un processo semplice e veloce.
4) Distribuzione del modello (produzione)
La distribuzione di un modello è spesso un processo lento e macchinoso. In molti casi, per far funzionare un modello nel mondo reale, gli sviluppatori devono tradurre il modello di produzione in un altro linguaggio di programmazione. SnapLogic Data Science elimina la fase di traduzione e consente di distribuire il modello come API appena terminato. Inoltre, SnapLogic Data Science automatizza molte delle fasi di addestramento continuo del modello, assicurando così che il modello migliori costantemente la sua precisione di previsione nel tempo.
Conclusione
SnapLogic Data Science rende per la prima volta accessibile alle aziende di tutte le dimensioni l'apprendimento automatico end-to-end. Consente di creare, addestrare, convalidare e distribuire modelli ad alte prestazioni più velocemente che mai. Ora le aziende possono intraprendere iniziative di apprendimento automatico con fiducia, sapendo che, con SnapLogic Data Science, le probabilità di vedere un grande ritorno sugli investimenti nell'IA sono notevolmente aumentate.
- Scoprite tutti i vantaggi e le caratteristiche di SnapLogic Data Science.
- Scaricate la scheda tecnica di SnapLogic Data Science.
- Una rapida panoramica di SnapLogic Data Science in questo breve video dimostrativo.
- Guardate il nostro ultimo webinar incentrato sul ML: "Carenza di data scientist? Nessun problema. L'apprendimento automatico self-service reso possibile da SnapLogic".