SnapLogic Data Science bringt Self-Service zum maschinellen Lernen

4 Minuten lesen

Heute haben wir die Einführung von SnapLogic Data Science angekündigt, einer visuellen Self-Service-Lösung für den gesamten Lebenszyklus des maschinellen Lernens (ML). Zusammen mit der preisgekrönten Integrationsplattform von SnapLogic, der Enterprise Integration Cloud, unterstützt SnapLogic Data Science die Datenbeschaffung, die Datenaufbereitung und das Feature-Engineering sowie das Training, die Validierung und den Einsatz von Machine-Learning-Modellen auf einer einzigen Plattform. Es ist die erste ihrer Art.

Warum wir unsere Data Science-Lösung entwickelt haben

An Projekten zum maschinellen Lernen sind in der Regel mehrere Personen beteiligt - Dateningenieure, Datenwissenschaftler, DevOps und andere. In jeder Phase des Lebenszyklus von maschinellem Lernen müssen die meisten, wenn nicht sogar alle dieser Personen ein Übermaß an benutzerdefinierter Codierung, redundanter Arbeit und manuellem Ausprobieren leisten.

Ohne Automatisierung könnte ein Dateningenieur Tage damit verbringen, sich durch Integrationsaktivitäten wie das Sammeln, Bereinigen und Umwandeln von Daten zu quälen, und das alles mit Code. Oder schlimmer noch, der Datenwissenschaftler bleibt bei dieser Arbeit stecken. Am Ende des ML-Lebenszyklus muss ein Softwareentwicklungsteam das endgültige Modell in eine andere Programmiersprache übersetzen, um es in Produktion zu bringen. All diese Herausforderungen gefährden den Erfolg Ihres ML-Projekts.

Bei SnapLogic kennen wir viele dieser Herausforderungen nur zu gut. Wir haben sie am eigenen Leib erfahren, als wir den Iris AI Integration Assistant entwickelt haben, eine ML-gesteuerte Empfehlungsmaschine, die kontextbezogene Snap-Vorschläge bei der Erstellung von Integrationen anbietet. Dabei haben wir eine wichtige Erkenntnis mitgenommen: Maschinelles Lernen sollte nicht so viel code-lastige, redundante Arbeit erfordern; es braucht vielmehr die Art von Selbstbedienungsfunktionen, für die SnapLogic bekannt ist. Aus diesem Grund haben wir SnapLogic Data Science entwickelt.

Was sind die Vorteile von SnapLogic Data Science?

SnapLogic Data Science bringt unsere bewährte Self-Service-Produktivität in den gesamten Lebenszyklus des maschinellen Lernens ein und verkürzt die Time-to-Value Ihrer ML-Initiativen. SnapLogic Data Science vereinfacht Datenbereinigungsaufgaben, steigert Ihre Produktivität während des Modellentwicklungsprozesses und ermöglicht es Ihnen, Ihr Modell bereitzustellen, sobald es fertig ist.

SnapLogic Data Science beschleunigt und vereinfacht die vier wichtigsten Phasen des Lebenszyklus des maschinellen Lernens:

  • Datenerfassung
  • Datenexploration und -aufbereitung
  • Modellschulung und -validierung
  • Einsatz des Modells

1) Datenerfassung

SnapLogic Data Science macht es einfach, Rohdaten für Ihre Trainingsdatensätze abzurufen. Anstatt Code zu schreiben oder die IT-Abteilung um einmalige Datenabzüge zu bitten, können Dateningenieure alle Arten von Daten durch einfaches Ziehen und Ablegen abrufen. Mit SnapLogic Data Science können Sie bei der Entwicklung eines ML-Modells problemlos eine Vielzahl von Endpunkten integrieren - Datenbanken, sowohl relationale als auch NoSQL-Datenbanken, Cloud-Anwendungen, Data Lakes, JSON-Dateien usw. - bei der Entwicklung eines ML-Modells.

2) Datenexploration und -aufbereitung

Mit SnapLogic Data Science können Data Engineers und Data Scientists in einer produktiven Low-Code-Umgebung auf einfache Weise sensible Informationen filtern, Daten umwandeln, Felder zuordnen und andere Datenaufbereitungsaufgaben durchführen. Darüber hinaus bietet SnapLogic Data Science neue Snaps und vorgefertigte Datenpipelines für Operationen, die speziell auf maschinelles Lernen ausgerichtet sind. Mit dem Categorical-to-Numeric-Snap im ML Data Preparation Snap Pack können Sie beispielsweise kategorische Daten (z. B. klein, mittel, groß) mit nur wenigen Klicks in numerische Daten konvertieren, indem Sie Integer- oder One-Hot-Codierung verwenden.

3) Modellschulung und -validierung

SnapLogic Data Science beschleunigt nicht nur die Erstellung der Trainingsdatensätze. Es beschleunigt auch das Training und die Validierung von Modellen. Diese Fähigkeit ermöglicht es Datenwissenschaftlern, Modelle mithilfe von Snaps zu konfigurieren, wodurch die Skripterstellung weiter reduziert wird. Beispielsweise implementieren die Snaps für Regressionsmodelle (z. B. der Predictor - Regression Snap) mehrere hochmoderne Algorithmen (z. B. lineare Regression), die auf ausgereiften Open-Source-Bibliotheken basieren, die Datenwissenschaftler beim Aufbau eines Modells verwenden können.

Wenn Sie jedoch lieber ein Modell von Grund auf neu erstellen, die Flexibilität von Python nutzen und Jupyter Notebooks verwenden möchten, unterstützt SnapLogic Data Science auch dies. Schreiben Sie einfach das native Python in Jupyter und veröffentlichen Sie es direkt in der SnapLogic-Pipeline, um es zu operationalisieren.

SnapLogic Data Science ermöglicht es Ihnen auch, Ihr Modell mit Kreuzvalidierungs-Snaps zu validieren - ein schneller und einfacher Prozess.

4) Einsatz des Modells (Produktion)

Die Bereitstellung eines Modells ist oft ein langsamer, mühsamer Prozess. In vielen Fällen müssen Entwickler das Produktionsmodell in eine andere Programmiersprache übersetzen, damit das Modell in der realen Welt funktioniert. Mit SnapLogic Data Science entfällt diese Übersetzungsphase und Sie können Ihr Modell sofort nach Fertigstellung als API bereitstellen. Darüber hinaus automatisiert SnapLogic Data Science viele der Schritte, die mit dem kontinuierlichen Training Ihres Modells verbunden sind, und stellt so sicher, dass Ihr Modell seine Vorhersagegenauigkeit im Laufe der Zeit kontinuierlich verbessert.

Schlussfolgerung

SnapLogic Data Science macht maschinelles Lernen zum ersten Mal für Unternehmen jeder Größe zugänglich. Sie können damit schneller als je zuvor leistungsstarke Modelle erstellen, trainieren, validieren und bereitstellen. Jetzt können Unternehmen ihre Initiativen zum maschinellen Lernen mit Zuversicht verfolgen, denn sie wissen, dass sich mit SnapLogic Data Science die Chancen auf eine hohe Rendite ihrer KI-Investitionen deutlich erhöht haben.

  • Erfahren Sie mehr über alle Vorteile und Funktionen von SnapLogic Data Science.
  • Laden Sie das Datenblatt zu SnapLogic Data Science herunter.
  • Verschaffen Sie sich einen schnellen Überblick über SnapLogic Data Science in diesem kurzen Demo-Video.
  • Sehen Sie sich unser neuestes Webinar zum Thema ML an: "Mangel an Datenwissenschaftlern? Kein Problem! Maschinelles Lernen im Self-Service mit SnapLogic"
Ehemaliger Chief Data Officer bei SnapLogic

Wir stellen ein!

Entdecken Sie Ihre nächste große Karrierechance.