Stimme aus dem Channel Big Data: „Shit in, Shit out“
Achim Heisler, unsere Stimme aus dem Channel, hat sich auf diversen Messen umgesehen. Im Blick hatte er dabei die große Datenflut. Hierfür findet der A-H-S-Geschäftsführer teilweise krasse Worte.
Anbieter zum Thema
Wenn ich mir die Ergebnisse meines persönlichen Veranstaltungsdreikampfs EuroCIS, Bitkom Big Data und CeBIT anschaue, dann ziehen viele Kollegen mit großem Schwung an einem losen Seil. Viele Punkte aus meinem letzten Artikel zu Thema Smarthome finden eine unheilvolle Projektion in die Welt von Industrie 4.0 und Big Data. Hier sehe ich eine riesige Lücke zwischen Strategie und operationaler Umsetzung, was unter anderem daran liegen könnte, dass Strategieberater den unendlichen Datenfluss als gegebene Konstante betrachten.
Was steckt also hinter dem Buzzword-Bingo und wo lauern die Probleme? Die Themen Big Data, IoT, Industrie 4.0 waren auf allen Messen vertreten und zogen auch sehr viele Menschen an. Wie ich, sind viele am Stand der Dinge interessiert.
Beginnen möchte ich bei Big Data, welches auch die Grundlage für die Artikelüberschrift liefert. Unbestritten ist wohl, dass durch IoT und Industrie 4.0 die Datenmengen mit denen wir operieren müssen, nochmals exponentiell ansteigen wird. Ein wichtiger Beitrag der hier von Big Data geleistet werden muss, ist, die wichtigen von den unwichtigen Daten zu unterscheiden und zu filtern. Denn selbst mit Hana und Co. würden die Sensor- und Aktorendaten unsere Systeme überfluten.
Auch wenn ich nun Daten habe, dann sind sie noch nicht gesichert. Über das Datenhandling wurde auf den Messen sehr wenig gesprochen. Ein weiterer wichtiger Punkt ist neben der Quantität eben auch die Qualität der Daten (siehe Überschrift). Und genau an diesem Punkt liegt immer noch die große Schwäche von Big Data.
Keine Qualität, keine hochwertige Antwort
Ist es schon bei internen Daten schwierig ein konsistentes Datenschema aufzubauen, wird dies bei unstrukturierten externen Daten ein fast unmögliches Unterfangen. Alternativ kaufe ich externe Daten zu, die eine hohe Datenqualität besitzen. Aber hier muss die Frage nach dem Wert der Daten erlaubt sein. Denn alleine durch die Datenverfügbarkeit ergibt sich noch keine intelligente Auswertung. Auch wenn uns pseudointelligente Systeme wie IBM Watson so etwas suggerieren wollen, habe ich immer noch kein System gefunden, das selbstständig Zusammenhänge entdeckt. Und genau dies wäre doch der Mehrwert von Big Data, beispielsweise für eine prädiktive Analyse.
Die heutigen iterativen Systeme zeigen mir ihr Versagen täglich. Warum erhalte ich beispielsweise, immer Werbung für Produkte, die ich gerade erworben habe? Ein individuelles Cross-Selling, welches über „die x gekauft haben, haben auch yz gekauft“ hinaus geht, hat mir niemand vorführen können. Und dies bei Firmen, die nun wirklich in ihren Stammdaten alles über mich wissen müssten.
Dies gilt auch für Entscheidungssysteme. Big Data ist hier nur eine Suchmaschine mit Entscheidungswahrscheinlichkeiten, versagt aber vollkommen bei geschlossenen Fragen. Nur mehr Daten in den Hauptspeicher zu packen und diese viel schneller zu einem dummen Cube zu kombinieren, bringt nichts, außer mehr Fehlentscheidungen pro Tag zu produzieren. Dies kann schon bei Managementsystemen schlimme Folgen haben, wo am Ende die Kosten von Big Data wieder sozialisiert werden. Durch mangelhafte Daten werden die Entscheidungsbäume nicht nur komplexer, sondern führen auf Grund nicht überschaubarer Entscheidungsparameter auch zu Fehlentscheidungen. Bei komplett automatisierten Prozessen wird Datenmüll (shit in) am Anfang der Prozesskette besonders deutlich. Fehlerhafte Ergebnisse (Provider, Formbriefe, Fehlerverleugnung ) am bitteren Ende der Prozesskette (shit out) haben uns alle schon in den Wahnsinn getrieben.
Übertragen wir die Problematik bei der Datenerfassung auf die IoT oder Industrie 4.0, dann ist jedem klar, dass Standards bei der Erfassung und Übermittlung der Daten unabdingbar sind. Unter diesem Aspekt finde ich es verantwortungslos, wenn Meinungsführer unter dem Deckmantel der Innovation, Dinge wie Datenqualität und Datensicherheit als Thema hinten anstellen wollen.
Lesen Sie auf der nächsten Seite, inwiefern Heisler einen Silberstreif am Horizont entdeckt.
(ID:43316734)