Definition Was ist Datenqualität und was zeichnet sie aus?

Von Martin Droysen

Anbieter zum Thema

Der Begriff der Datenqualität beschreibt die Eignung von Informationen für eine bestimmte Anwendung beziehungsweise einen spezifischen Einsatzbereich. Eine mangelhafte Datenqualität sorgt für einen erheblichen betriebswirtschaftlichen Schaden.

Grundlagenwissen zum IT-Business
Grundlagenwissen zum IT-Business
(Bild: © adiruch na chiangmai - Fotolia.com)

Der Ausdruck Datenqualität bezeichnet die Eignung spezifischer Informationen für einen klar definierten Einsatzbereich. Es geht also um die Frage, inwiefern sich Daten für ein bestimmtes Vorhaben nutzen lassen. Dieses Thema ist für alle Unternehmen von entscheidender Bedeutung: Eine Studie von Gartner's hat beispielsweise ermittelt, dass der durchschnittliche Umsatzverlust von Firmen aufgrund einer schlechten Datenqualität schon 2018 jährlich 15 Millionen US-Dollar betrug. Schon damals wurden 50 Prozent der IT-Budgets für die Aufbereitung von Daten ausgegeben. Durch die fortschreitende Vernetzung ist das Informationsvolumen seit damals erheblich gewachsen. Die Datenqualität ist also noch wichtiger geworden.

Die „eine“ Datenqualität existiert nicht

Zu beachten ist, dass sich die Qualität von Daten stets an ihrem Anwendungsbereich bemisst. Es gibt also nicht den „einen“ Aufbereitungszustand, den Informationen haben sollten. Dies lässt sich leicht an einem Beispiel zeigen: Gesamtverkaufszahlen geben zwar an, wie gesund ein Shop grundsätzlich ist. Sie zeigen aber nicht, welche Produkte sich besonders gut oder schlecht verkaufen. Umgekehrt heißen hohe Umsätze eines speziellen Angebots nicht, dass der Händler ein insgesamt gesundes Unternehmen betreibt. Für Antworten auf diese Fragen müssen die vorliegenden Daten unterschiedlich aufbereitet werden.

Die Datenqualität messen

Diese Faktoren und Kennzahlen sind wichtig:

  • Zugänglichkeit: Können wirklich alle Daten abgerufen werden?
  • Vertrauen: Sind die Informationen korrekt?
  • Verständlichkeit: Sind die Daten so leicht erfassbar, dass sie problemlos interpretiert werden können?
  • Singularität: Sind die Informationssätze frei von Redundanzen?
  • Einheitlichkeit: Haben die Daten das identische Format?
  • Konsistenz: Stimmen alle gesammelten Informationen überein? Passen beispielsweise Werte aus unterschiedlichen Maschinen zusammen?
  • Operationalisierbarkeit: Liegen klare Definitions- und Wertebereiche für die Arbeit mit den Daten vor und wie lauten diese?
  • Skalierung: Lässt sich eine Entwicklungskurve ableiten?
  • Vergleichbarkeit: Wie lauteten die Informationen aus vorherigen Messzeiträumen?

Wenn Unternehmen (oder sonstige Organisationen) die Datenqualität erhöhen möchten, was aufgrund der oben genannten Gründe sinnvoll ist, dient diese Liste als geeigneter Leitfaden. Sie ist allerdings nicht vollständig. Anwendungsspezifisch können weitere Punkte hinzukommen. Hierfür sei noch einmal an das obige Beispiel erinnert: Für die Gesamtgesundheit eines Shops sind nicht nur die Umsätze, sondern auch die Gewinnmargen entscheidend. Sie spielen allerdings keine Rolle, um die Entwicklung des Kundenaufkommens zu bewerten.

Quellen:

https://www.gartner.com/smarterwithgartner/how-to-stop-data-quality-undermining-your-business

https://pipeline.zoominfo.com/operations/dirty-data-bottom-line

https://www.westphalia-datalab.com/datenqualitaet-was-ist-das-und-wie-gut-muessen-meine-daten-sein/

https://www.talend.com/de/resources/was-ist-datenqualitaet/

(ID:48579545)

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung