OpenAI hat kürzlich GPT-4 eingeführt, die neueste Version seines Sprachmodells. Diese Iteration bietet gegenüber den GPT-3-Modellen erhebliche Verbesserungen bei der Generierung und den Schlussfolgerungsmöglichkeiten. Wir glauben, dass GPT-4 und die Nachfolgemodelle die Automatisierung von Daten und Application Integration verändern werden.
Unsere Vision bei SnapLogic ist es, reibungslose Integration und Automatisierung zu bieten. Wir haben dazu beigetragen, Pionierarbeit bei der Einbindung von KI- und ML-Technologien zu leisten, um die Integration, Automatisierung und Orchestrierung von Datenflüssen in Unternehmen zu optimieren. Unsere KI-Lösung Iris, die anhand von Metadaten im Petabyte-Bereich trainiert wurde, hat unseren Kunden in den letzten sechs Jahren bereits einen enormen Nutzen gebracht. Wir untersuchen nun aktiv den Einsatz von GPT-4, um die Fähigkeiten unserer Plattform weiter zu verbessern.
Große Sprachmodelle (LLMs) wie GPT-4 können Unternehmen dabei unterstützen, die Integration von Geschäftsprozessen zu vereinfachen und zu automatisieren und Daten anwendungsübergreifend in Data Warehouses für das Berichtswesen und für deskriptive und prädiktive Analysen zusammenzuführen.
Was wir bis jetzt gesehen haben
Bei SnapLogic haben wir eine Vielzahl von Integrations- und Automatisierungsanwendungen mit ChatGPT (GPT-3.5) prototypisiert, um die in der Geschäftssprache ausgedrückten Absichten mit der technischen Implementierung zu verbinden, um das Geschäftsziel zu erreichen. Wir wollten sehen, wie die erweiterte Argumentation und die längere Prompt-Unterstützung von GPT-4 unsere integrationsbasierten Anwendungsfälle verbessert.
In den letzten zwei Tagen haben wir unsere bisherigen Aufforderungen sowohl mit GPT-3.5 als auch mit GPT-4 getestet und verglichen. Darüber hinaus haben wir mit völlig neuen und anspruchsvolleren Anwendungsfällen experimentiert. Bislang sind wir von der verbesserten Genauigkeit der GPT-4-Antworten äußerst beeindruckt. Es ist erwähnenswert, dass GPT-4 derzeit teurer pro Token (Promptlänge) und etwas langsamer in der Antwortgenerierung ist. Die Kosten und der Zeitaufwand scheinen jedoch durch die verbesserte Antwortgenauigkeit gerechtfertigt.
Unser Interesse richtet sich auf den enormen Druck, unter dem Unternehmen stehen, ihre Flexibilität zu erhöhen und gleichzeitig die Kosten zu senken. In unserer Arbeit stellen wir fest, dass die Fragmentierung von Prozessen und Daten durch die gleichzeitige Verbreitung von SaaS-Anwendungen für Abteilungen, die zunehmende Nutzung öffentlicher und selbst entwickelter APIs und die Explosion heterogener Daten aus den Geschäftssystemen der Abteilungen zu den größten Hindernissen für die Agilität von Unternehmen gehören.
Anwendungsfälle für KI in der Datenintegration und -automatisierung
Wir glauben, dass LLMs die Integration von Daten und Anwendungen in den folgenden Bereichen vereinfachen können:
1. Extraktion
SQL ist die Sprache der Geschäftsdaten sowohl in Datenbanken als auch in Cloud Data Warehouses. 65 % der Pipelines unserer Kunden enthalten mindestens einen SQL-Snap. Die Erstellung von Abfragen innerhalb dieser Snaps kann ein anspruchsvoller Prozess sein, der nicht nur ein tiefes Verständnis von SQL, sondern auch von den Strukturen der Zieldatenbank und den spezifischen Nuancen der einzelnen Datenspeicher erfordert. Die fortschrittlichen NLP-Funktionen von GPT-4 können die Formulierung von SQL-Abfragen vereinfachen. Mit der Fähigkeit, komplexe Datenstrukturen und -beziehungen zu verstehen, kann GPT-4 den Benutzern helfen, genauere und effektivere Abfragen mit Hilfe von natürlichsprachlichen Eingabeaufforderungen zu erstellen. Dies kann den Zeitaufwand und die technischen Kenntnisse, die für die Extraktion von Daten aus verschiedenen Quellen erforderlich sind, erheblich reduzieren.
2. Umwandlung
GPT-4 kann den Datenaufbereitungsprozess vereinfachen, indem es die Umwandlung von Daten von einem Format in ein anderes automatisiert. Mit fortschrittlichen maschinellen Lernfunktionen kann GPT-4 Muster und Beziehungen in den Daten erkennen und die Logik generieren, die für die automatische Umwandlung in das gewünschte Format erforderlich ist. Dies kann den Zeit- und Arbeitsaufwand für die Datenaufbereitung erheblich reduzieren und die Genauigkeit der Daten erhöhen.
3. Erstellung von Datenpipelines
Durch die Verwendung natürlichsprachlicher Eingabeaufforderungen kann GPT-4 die Erstellung von Datenpipelines vereinfachen, indem es den Benutzer durch den Prozess führt. Indem sie ihre Anforderungen in natürlicher Sprache angeben, können Benutzer manuelle Eingriffe minimieren, da GPT-4 den notwendigen Verarbeitungsablauf, Ausdrücke oder Skripte generiert, die zur Erstellung der Pipeline benötigt werden. Dadurch können Unternehmen Zeit sparen und Fehler bei der Erstellung von Pipelines reduzieren. Darüber hinaus kann GPT-4 geeignete Konfigurationen für Datenverbindungen vorschlagen, wodurch die Herausforderung der Verbindung mit Unternehmensdaten entfällt.
4. Qualitätssicherung
GPT-4 kann bei der Automatisierung von Tests und der Qualitätssicherung von Daten- und Anwendungsintegrations- und Orchestrierungsprozessen helfen. Wir haben festgestellt, dass GPT-4 kleine Datensatzproben zusammenfassen und Datenqualitätsprobleme wie Datenfehler und Konflikte identifizieren kann. Diese Antworten können dann verwendet werden, um Datenbereinigungstransformationen auf einen größeren Datensatz anzuwenden, um qualitativ hochwertige Daten für die Zieldatenbank oder das Cloud Data Warehouse zu erzeugen.
5. Fehlersuche
Bei Problemen oder Fehlern in der Daten- und App-Integration und den Orchestrierungsprozessen kann GPT-4 bei der Fehlerbehebung helfen. Mit der Fähigkeit, komplexe Datenstrukturen und -beziehungen zusammenzufassen sowie komplizierte Systemfehlermeldungen in einfache Sprache umzuwandeln, kann GPT-4 die Ursache des Problems schnell identifizieren und mögliche Lösungen vorschlagen. Dies kann den Zeit- und Arbeitsaufwand für die Fehlersuche erheblich reduzieren und die Effizienz des Systems steigern.
6. Einblicke
Die fortschrittlichen NLP-Funktionen von GPT-4 können Benutzern helfen, Einblicke in eine Teilmenge von Unternehmensdaten zu erhalten, indem sie ihnen erlauben, Fragen an die Daten in natürlicher Sprache zu stellen. Die Möglichkeit, dass nicht-technische Fachleute Fragen in ihrem Sinne stellen können, kann den Zeit- und Arbeitsaufwand für die Datenanalyse erheblich reduzieren und die Genauigkeit der Erkenntnisse erhöhen.
Wir sind davon überzeugt, dass die fortschrittlichen NLP-, maschinellen Lern- und Datenverarbeitungsfunktionen von GPT-4 erhebliche Möglichkeiten zur Vereinfachung und Automatisierung von Daten- und Anwendungsintegrations- und Orchestrierungsprozessen bieten.
Weiter im Gespräch: Wie geht es weiter?
Wir bei SnapLogic sind begeistert von dem Potenzial von GPT-4 und freuen uns darauf, seine Möglichkeiten weiter zu erforschen, während wir unsere langjährige Vision von reibungsloser Integration und Automatisierung weiter umsetzen.
Wir arbeiten schnell und sind zuversichtlich, dass wir durch die Zusammenarbeit mit der SnapLogic-Community in der Lage sein werden, eine neue Erfahrung zu liefern, die in Bezug auf die Zeit bis zur Wertschöpfung transformierend ist und dem Unternehmen sowohl auf der oberen als auch auf der unteren Ebene Ergebnisse liefert.
Besonderen Dank an Greg Benson, Chief Scientist, und Manish Rai, Vice President, Product Marketing bei SnapLogic, für ihre Gedanken und Beiträge zu dieser sich entwickelnden Diskussion.
Um das Gespräch fortzusetzen und mehr über diese Fortschritte zu erfahren, sehen Sie sich das Reveal Event an : Die Zukunft der Integration mit generativer KI - jetzt als On-Demand-Version verfügbar.