"Das Leben bewegt sich ziemlich schnell. Wenn man nicht ab und zu innehält und sich umsieht, könnte man es verpassen." - Ferris Bueller's Day Off, 1986.
Es fühlt sich an, als gäbe es sowohl mehr Unsicherheit und im Gegensatz zu vor einem Jahr um diese Zeit eine größere Akzeptanz auf dem Big-Data-Markt. Einen Monat vor der Strata/Hadoop World 2015 in New York ist es also an der Zeit, einen Blick auf Big Data damals und heute zu werfen.
Branchenanalysten haben einen interessanten Blickwinkel auf das Thema, da sie regelmäßig sowohl mit Technologieanbietern als auch mit Käufern sprechen. Sehen wir uns also die Meilensteine des letzten Jahres aus der Sicht von Gartner an. (Für einige dieser Berichte ist ein Gartner-Abonnement erforderlich, aber ich habe auf öffentlich zugängliche Blogbeiträge verwiesen, wo dies möglich war.]
4. August 2014: Gartner veröffentlicht seinen jährlichen "Hype Cycle"-Bericht über Big-Data-Technologien. ("Hype Cycle for Big Data 2014," Frank Buytendijk, Gartner.) [Anmeldung erforderlich]
Der Hype Cycle ist ein von Gartner entwickeltes Reifegradmodell für aufkommende Technologien innerhalb einer bestimmten Kategorie. Diese regelmäßig erscheinenden Berichte zeigen, wo sich eine bestimmte Technologie in ihrem Lebenszyklus befindet und wie lange es dauern wird, bis sie die nächste Phase ihrer Entwicklung erreicht. Die Phasen sind:
Innovationsauslöser -> Gipfel der überhöhten Erwartungen -> Tal der Enttäuschung -> Hang der Erleuchtung -> Plateau der Produktivität.
Der Gedanke dahinter (meine Interpretation) ist, dass jede neue Technologie eine Hype-Phase hat, in der die Begeisterung größer ist als die tatsächliche Akzeptanz oder der erzielte geschäftliche Nutzen. Auf diese Phase folgt in der Regel eine Talsohle, in der die Begeisterung nachlässt, sich Skepsis einschleicht und die Anwender die geschäftlichen Anforderungen und Realitäten berücksichtigen müssen, bevor sie die Technologie auf bestimmte Anwendungsfälle anwenden und zum Plateau übergehen, auf dem die Technologien zu einer messbaren geschäftlichen Produktivität beitragen.
Dem Bericht von 2014 zufolge befanden sich die Big-Data-Technologien entweder auf dem Höhepunkt des Hypes oder in der Talsohle:
"Big Data als Ganzes hat den Gipfel der aufgeblähten Erwartungen überschritten und rutscht in den Tiefpunkt der Ernüchterung. Sobald die Akzeptanz zunimmt und die Realität auf der Grundlage erster Erfolge und Misserfolge eintritt, ist der Höhepunkt des Hypes überschritten. Die Innovation wird weitergehen, der Innovationsschub ist voll, aber der Tiefpunkt der Ernüchterung wird schnell und brutal sein. Realisierbare Technologien werden schnell wachsen, verbunden mit einer Erschütterung aller Anbieter, die einfach auf den Zug aufgesprungen sind. Dies ist im Grunde eine gute Nachricht. Es werden robustere und unternehmenstauglichere Lösungen auf den Markt kommen, und Big-Data-Implementierungen werden sich von Systemen der Innovation zu unternehmenskritischen Systemen der Differenzierung entwickeln."
Außerdem sind diese Technologien weit davon entfernt, einen geschäftlichen Mehrwert zu schaffen.
"In vielen Fällen ist der Wandel noch mindestens zwei bis fünf Jahre entfernt - oder mehr. Darüber hinaus deuten viele Technologien darauf hin, dass sie veraltet sein werden, bevor sie das Plateau der Produktivität erreichen.
Im August 2015 wurde der Bericht über den Big Data Hype Cycle aktualisiert...
Aber es gibt keinen neuen Bericht. Laut einem Blogeintrag vom 20. August Blogbeitrag des Gartner-Analysten Nick Heudecker, "Big Data ist nicht obsolet. It's Normal." [kein Abonnement erforderlich]
"Erstens ist das Profil der Big-Data-Technologie in einigen Hype-Zyklen abgefallen, in anderen jedoch in den Tiefpunkt der Desillusionierung vorgedrungen. Zweitens, haben wir den sehr populären Hype Cycle für Big Data aufgegeben [Hervorhebung von mir]. Der Grund für beides ist einfach: Big Data ist kein eigenständiges Thema mehr. Stattdessen haben sich die verschiedenen Themen, die früher Big Data umfassten, in andere Bereiche entwickelt. Welche anderen Bereiche?
- Fortgeschrittene Analytik und Datenwissenschaft
- Business Intelligence und Analytik
- Informationsmanagement im Unternehmen
- In-Memory-Computing-Technologie
- Informationsinfrastruktur
Die Merkmale, die Big Data definieren, diese lästigen 3 Vs [Volumen, Vielfalt, Geschwindigkeit], sind nicht länger exotisch. Sie sind alltäglich."
Ein Jahr - und Big Data wird von einer gehypten Technologie, die noch im Bereich der Early Adopters angesiedelt ist, zu einem alltäglichen und selbstverständlichen Bestandteil langjähriger Technologiebereiche wie Analytik, Business Intelligence und Informationsinfrastruktur. Warum ist das so? Und was bedeutet das?
In Teil 2 werde ich die Treiber und Hindernisse für die Einführung von Hadoop anhand der jährlichen Umfragen von Gartner zur Hadoop-Einführung aus den Jahren 2014 und 2015 näher beleuchten.