Nous avons annoncé aujourd‘hui le lancement de SnapLogic Data Science, une solution visuelle en libre-service pour l‘ensemble du cycle de vie de l‘apprentissage machine (ML). SnapLogic Data Science, associé à l‘intégration primée de SnapLogic plateforme, l‘Enterprise Integration Cloud, prend en charge l‘approvisionnement en données, la préparation des données et l‘ingénierie des fonctionnalités, ainsi que l‘entraînement, la validation et le déploiement des modèles d‘apprentissage automatique, le tout en un seul endroit : plateforme. Il s‘agit de la première solution de ce type.
Pourquoi nous avons développé notre solution de science des données
Les projets d‘apprentissage automatique impliquent généralement plusieurs personnes - ingénieurs de données, scientifiques de données, DevOps et autres. Conventionnellement, à chaque étape du cycle de vie de l‘apprentissage automatique, la plupart de ces personnes, si ce n‘est toutes, finissent par faire un excès de codage personnalisé, de travail redondant et d‘essais et d‘erreurs manuels.
En l‘absence d‘automatisation, un ingénieur des données peut passer des jours à effectuer des activités d‘intégration telles que la collecte, le nettoyage et la transformation des données, le tout en utilisant du code. Pire encore, le data scientist se retrouvera coincé à faire ce travail. À la fin du cycle de vie du ML, une équipe de développement logiciel doit traduire le modèle final dans un autre langage de programmation pour le mettre en production. Tous ces défis compromettent la réussite de votre projet de ML.
Chez SnapLogic, nous ne connaissons que trop bien ces défis. Nous en avons fait l‘expérience lorsque nous avons créé l‘assistant d‘intégration Iris AI, un moteur de recommandation basé sur l‘apprentissage automatique qui propose des suggestions Snap contextuelles lors de la création d‘intégrations. Nous sommes repartis de cette expérience avec une grande leçon à retenir : l‘apprentissage automatique ne devrait pas impliquer autant de code lourd et de travail redondant ; en fait, il a besoin du type de capacités en libre-service pour lesquelles SnapLogic est bien connu. C‘est pourquoi nous avons créé SnapLogic Data Science.
Quels sont les avantages de SnapLogic Data Science ?
SnapLogic Data Science apporte notre productivité éprouvée en libre-service à l‘ensemble du cycle de vie de l‘apprentissage automatique, réduisant ainsi le délai de rentabilité de vos initiatives d‘apprentissage automatique. Il simplifie les tâches de nettoyage des données, stimule votre productivité pendant le processus de développement du modèle et vous permet de déployer votre modèle dès qu‘il est prêt.
SnapLogic Data Science accélère et simplifie les quatre étapes clés du cycle de vie de l‘apprentissage automatique :
- Acquisition de données
- Exploration et préparation des données
- Entraînement et validation du modèle
- Déploiement du modèle
1) Acquisition de données
SnapLogic Data Science facilite la récupération des données brutes pour vos ensembles de données de formation. Au lieu d‘écrire du code ou de demander au service informatique des vidages de données ponctuels, les ingénieurs de données peuvent consommer toutes sortes de données par simple glisser-déposer. SnapLogic Data Science vous permet d‘intégrer facilement une variété de points d‘extrémité - bases de données relationnelles et NoSQL, applications cloud , lacs de données, fichiers JSON, etc. - lors du développement d‘un modèle de ML.
2) Exploration et préparation des données
SnapLogic Data Science permet aux ingénieurs et aux scientifiques des données de filtrer facilement les informations sensibles, de transformer les données, de mapper les champs et d‘effectuer d‘autres tâches de préparation des données dans un environnement productif à code bas. De plus, SnapLogic Data Science propose de nouveaux snaps et des pipelines de données préconstruits pour les opérations spécifiques à l‘apprentissage automatique. Par exemple, le Snap Categorical-to-Numeric du ML Data Preparation Snap Pack vous permet de convertir des données catégorielles (par exemple, petites, moyennes, grandes) en données numériques à l‘aide d‘un encodage entier ou d‘un encodage à un point en quelques clics.
3) Entraînement et validation du modèle
SnapLogic Data Science ne se contente pas d‘accélérer la création des ensembles de données d‘entraînement. Il accélère la formation et la validation des modèles. Cette capacité permet aux scientifiques des données de configurer les modèles à l‘aide de Snaps, ce qui réduit encore les scripts. Par exemple, les Snaps pour les modèles de régression (par exemple, le Predictor - Regression Snap) mettent en œuvre plusieurs algorithmes de pointe (par exemple, la régression linéaire) basés sur des bibliothèques open source matures que les scientifiques des données peuvent utiliser lors de la construction d‘un modèle.
Mais si vous préférez construire un modèle à partir de zéro, bénéficier de la flexibilité de Python et utiliser les blocs-notes Jupyter, SnapLogic Data Science le prend également en charge. Il suffit d‘écrire le Python natif dans Jupyter et de le publier directement dans le pipeline SnapLogic pour l‘opérationnaliser.
SnapLogic Data Science vous permet également de valider votre modèle à l‘aide de Snaps de validation croisée - un processus simple et rapide.
4) Déploiement du modèle (production)
Le déploiement d‘un modèle est souvent un processus lent et lourd. Dans de nombreux cas, pour qu‘un modèle fonctionne dans le monde réel, les développeurs doivent traduire le modèle de production dans un autre langage de programmation. SnapLogic Data Science supprime la phase de traduction et vous permet de déployer votre modèle en tant qu‘API dès qu‘il est terminé. De plus, SnapLogic Data Science automatise de nombreuses étapes de l‘entraînement continu de votre modèle, ce qui garantit une amélioration constante de sa précision de prédiction au fil du temps.
Conclusion
SnapLogic Data Science rend l‘apprentissage automatique de bout en bout accessible pour la première fois aux entreprises de toutes tailles. Il vous permet de construire, d‘entraîner, de valider et de déployer des modèles très performants plus rapidement que jamais. Désormais, les entreprises peuvent poursuivre leurs initiatives d‘apprentissage automatique en toute confiance, sachant qu‘avec SnapLogic Data Science, leurs chances d‘obtenir un retour sur investissement important en matière d‘IA ont considérablement augmenté.
- En savoir plus sur les avantages et les fonctionnalités de SnapLogic Data Science.
- Télécharger la fiche technique SnapLogic Data Science.
- Obtenez un aperçu rapide de SnapLogic Data Science dans cette courte vidéo de démonstration.
- Regardez notre dernier site webinar axé sur la ML: "Pénurie de scientifiques des données ? Pas de problème. L‘apprentissage automatique en libre-service rendu possible par SnapLogic"