In den vergangenen zwei Jahrzehnten zeigt sich ein deutlich positiver Trend in der Business Intelligence: Unternehmen verbessern kontinuierlich ihr Management von Massendaten. Trotz intensiver Bemühungen zeigt sich jedoch, dass viele vermeintlich „einfache“ Analysen auf Grundlage vorhandener Geschäftsdaten weder einfach noch zeitnah durchführbar sind.
Der Autor: Dr. Karsten Konrad ist Senior Director Data Science bei der Unternehmensberatung für Preismanagement und Vertrieb Prof. Roll & Pastuch – Management Consultants.
(Bild: Prof. Roll & Pastuch – Management Consultants)
Einige Beispiele aus unserer Beratungspraxis verdeutlichen diese Herausforderungen: Ein Produktionsunternehmen macht klare Unterschiede in der Preisgestaltung zwischen „Projektgeschäft“ und „Standardgeschäft“. Jedoch fehlt sowohl eine Definition dessen, was ein Projekt charakterisiert, als auch eine Zuordnung in den Transaktionsdaten, die erkennen lässt, zu welcher Kategorie ein verbuchter Umsatz gehört. Im Rahmen einer strategischen Neuausrichtung eines Unternehmens sollen Standardkunden im Vergleich zu internationalen Key-Accounts preislich bevorzugt werden. Die dafür erforderliche Klassifizierung der Kunden ist jedoch unvollständig oder mehrdeutig, ebenso wie die Konzernstrukturen der Großkunden.
So soll beispielsweise bei einem Maschinenbauunternehmen die Preisgestaltung von Ersatzteilen davon abhängen, ob es sich um Standard-Ersatzteile oder Verschleißteile handelt. Obgleich die Maschinen überwiegend vom Hersteller gewartet werden, lässt sich eine notwendige Segmentierung der Ersatzteile lediglich indirekt über Verkaufsfrequenzen ableiten.
Die wahren Hemmnisse bei strategischen Analysen sind dabei weniger die umfangreichen „großen Daten“ wie Transaktionsdaten aus Verkäufen oder Logistik. Vielmehr sind es die „kleinen Daten“ – jenseits der herkömmlichen, einmalig anzulegenden Stammdaten – die vielen Unternehmen Schwierigkeiten bereiten. Diese Referenzdaten, die essenzielle und veränderliche Verbindungen zwischen Geschäftsobjekten darstellen, bilden nur einen geringen Anteil der gesamten Daten, die ein Unternehmen verwaltet.
Der Grund, warum Referenzdaten nicht von der beobachteten Qualitätssteigerung anderer Datenkategorien profitieren, ist relativ einfach: Die Pflege dieser „Slowly Changing Dimensions“ erfordert kontinuierliche Aufmerksamkeit von menschlichen Experten, um Aktualität und Qualität zu gewährleisten. Bei vielen dieser Daten lässt das Interesse allerdings im Laufe der Zeit nach, sofern sie nicht die Basis für kritische Kennzahlen des (Top-)Managements bilden. Zum Beispiel wird ein Vertriebsmitarbeiter, der im CRM-System Gründe für verlorene Angebote dokumentieren soll, dies nur so lange akribisch tun, wie er davon überzeugt ist, dass diese Informationen tatsächlich sinnvoll genutzt werden.
Dreamteam – KI und gute Referenzdaten
Mit der zunehmenden Verbreitung von Künstlicher Intelligenz (KI) in den vergangenen Jahren steigt die Bedeutung von Referenzdaten weiter an. Maschinelle Lernverfahren, die aus Daten Erkenntnisse gewinnen, sind nicht in der Lage, das erforderliche Domänenwissen ausschließlich aus vorhandenen Geschäftsdaten zu generieren. Daher ist Künstliche Intelligenz auf qualitativ hochwertige Referenzdaten angewiesen, um präzise Vorhersagen treffen zu können.
Ein Beispiel für die Anwendung maschinellen Lernens ist die Preisoptimierung durch die Vorhersage von Preiselastizitäten. Das Fundament für die hierfür benötigten Daten bilden Bestellzeilen der Kunden mit Angaben wie Produkt-ID, Menge und Preis. Jedoch sind für die Effektivität der mittels KI erstellten Modelle zusätzliche externe Domäneninformationen erforderlich, die als Referenzdaten bereitgestellt werden müssen. In Bezug auf den elektronischen Handel könnten dies zum Beispiel sein:
Informationen zu Produktfamilien, die homogene oder austauschbare Produktgruppen definieren
Nachfragefaktoren in verschiedenen Regionen, wie beispielsweise Feiertage und typische Urlaubsmonate
spezifische Marktbedingungen, wie Produktneueinführungen oder Werbeaktionen der Konkurrenz
Fehler oder Lücken in den Referenzdaten haben früher meist nur zu zusätzlichem Aufwand in der Analyse geführt. Heute jedoch können Mängel in den Referenzdaten vor allem die Digitalisierung kritischer Geschäftsprozesse behindern. Für viele Unternehmen bedeutet dies einen erheblichen Wettbewerbsnachteil, sollten sie das Management von Referenzdaten weiterhin vernachlässigen.
Priorisieren und automatisch Generieren
Unternehmen können oft relativ einfach die ihnen derzeit noch fehlenden Daten identifizieren. Allerdings resultiert dieser Prozess häufig in einer überraschend langen Liste, die selbst in einem ambitionierten Projekt zunächst nicht gänzlich bearbeitet werden kann. Zur optimalen Steuerung einer Referenzdateninitiative bietet sich folgendes Vorgehen an:
Ein initialer Workshop mit Vertretern verschiedener Fachabteilungen sollte die Basis aller Entscheidungen sein, um eine konsolidierte Longlist für die Dateninitiative zu entwickeln. Die teilnehmenden Fachabteilungen benötigen einen erkennbaren Nutzen, um ausreichend motiviert an der späteren Mitarbeit zu sein.
Kurzfristig sollten zunächst jene Referenzdaten hoch priorisiert werden, die für entscheidungsrelevante, häufig benötigte und zeitkritische Analysen grundlegend sind. Beinahe immer sind die zunächst Daten zu Märkten und Kunden wie z. B. Potenziale, Beziehungen zwischen Unternehmen und Brancheninformationen der Kunden.
Mittelfristig können Referenzdaten entwickelt werden, die zur besseren Automatisierung von Geschäftsprozessen beitragen. Hier besteht oft etwas mehr Zeit, da die Infrastruktur für die Automatisierung meist noch nicht vorhanden ist.
Vermeiden sollte man Referenzdaten, deren Nutzen im Vergleich zum Pflegeaufwand hoch ist. „Low Hanging Fruits“, die mit geringem oder keinem Aufwand realisiert werden können, sollten als Nebenprodukt einer größeren Dateninitiative mitgenommen werden.
Auch wenn sich sicher Informationen finden, die frei verfügbar sind oder zugekauft werden können, muss damit gerechnet werden, dass die Experten der Fachabteilungen initial Energie und Zeit in das Sammeln der Daten einbringen müssen. Aufgrund der weitverbreiteten Verfügbarkeit maschineller Lernverfahren sind Unternehmen allerdings heute in der Lage, diese Techniken zur effizienteren Generierung von Referenzdaten einzusetzen.
Zum Beispiel ist bei einer fehlenden Produktsegmentierung nicht zwingend erforderlich, wie früher alle Produkte manuell zu klassifizieren. Stattdessen können menschliche Experten einen Teil der Produkte segmentieren und die daraus gewonnenen Erkenntnisse mittels Klassifikationsverfahren anwenden, um die restlichen Produkte automatisiert zu klassifizieren. Ähnlich lassen sich bestehende Produkt- und Kundenhierarchien durch Data Mining in übersichtlichere Cluster umwandeln, die als Stammdaten im Data Warehouse die Analyse erleichtern. Low-Code-Plattformen wie KNIME, Rapid Miner oder Orange ermöglichen es den „Citizen Data Scientists“ in Unternehmen, mit vergleichsweise geringem Aufwand die heute noch bestehenden Datenlücken zumindest in Teilen zu schließen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.