Datenqualität: Warum "dirty data" den Erfolg Ihrer Marketingaktivitäten gefährden kann

Datenqualität: Warum

Was ist Datenqualität?

Die Bedeutung von Daten für den Erfolg der Werbe- und Marketingmaßnahmen eines Unternehmens ist allgemein anerkannt. Sie werden als wertvolle Ressource betrachtet und können in einem hart umkämpften Markt zum Vorteil werden. Unsaubere Daten hingegen können den Erfolg von datengesteuerten Marketingaktivitäten beeinträchtigen.

In einer Studie von Experian aus dem Jahr 2019 stellten die Autoren fest, dass 95 % der Befragten in ihrem Unternehmen Auswirkungen einer geringen Datenqualität sehen.

Doch was genau bestimmt die Datenqualität (DQ)?

Lee et al. (2006) definieren Datenqualität als ein Maß des Zustands von Daten, die auf den folgenden Dimensionen basiert:

  • Frei von Fehlern: Diese Dimension spiegelt das Ausmaß wider, in dem die Daten korrekt sind.
  • Vollständigkeit: Das Ausmaß, in dem die Entitäten, Attribute oder Werte in einem Datensatz vollständig sind.
  • Konsistenz: Alle Instanzen eines Datenelements in einem Datensatz oder in verschiedenen Datenbanken sollten identisch sein.
  • Glaubwürdigkeit: Das Ausmaß, in dem die Daten als wahr und glaubwürdig angesehen werden.
  • Angemessene Menge an Daten: Die vorhandene Datenmenge sollte weder zu gering noch zu groß sein.
  • Aktualität: Gibt an, wie aktuell die Daten in Bezug auf die Aufgabe sind, für die sie bestimmt sind.
  • Zugänglichkeit: Diese Dimension spiegelt die leichte Zugänglichkeit der Daten wider.

Die Bewertung der Datenqualität hängt von den Datenanforderungen und dem Zweck ab, für den sie verwendet werden sollen. So kann derselbe Standard für die Datenqualität in einem Fall ausreichend sein, in einem anderen jedoch nicht. So müssen beispielsweise die Abrechnungsdaten für Werbekampagnen sehr hohe Anforderungen an die oben genannten Kriterien erfüllen, während bei Daten von Drittanbietern wie Nielsen Ad Intel eine höhere Fehlertoleranz bestehen kann.

Das Problem mit Dirty Data

Allzu oft hat das Datenqualitätsmanagement keine betriebliche Priorität, und folglich ist die Datenqualität unbekannt. Wenn Daten unsauber sind, wird das wahre Bild verzerrt und die Wahrscheinlichkeit kostspieliger Entscheidungen steigt. Wahrscheinlich haben Sie schon einmal von dem Prinzip "Müll rein, Müll raus" gehört. Es besagt, dass ein System, das mit minderwertigen Daten gefüttert wird, wahrscheinlich auch ein minderwertiges Ergebnis liefert. Die negativen Auswirkungen einer falschen Entscheidungsfindung auf Ihre Marketingaktivitäten können vielfältig sein. Eine ineffiziente Zielgruppenansprache kann dazu führen, dass das Budget durch Streuverluste verschwendet wird und somit die Rentabilität sinkt. Unpersonalisierte Inhalte könnten bei den Verbrauchern Abneigung hervorrufen und so die Kundenbeziehung verschlechtern. Fehler in der Rechnungsstellung und verzerrte Berichte können das Vertrauen und die Glaubwürdigkeit Ihres Unternehmens untergraben. Unsaubere Daten erhöhen auch die Kosten für die Datenbereinigung. Der hohe Zeitaufwand für die Behebung dieser Probleme bindet Ressourcen, die nicht anderweitig genutzt werden können.

Alles in allem kann eine schlechte Datenqualität Ihr Unternehmen in eine wirtschaftliche Lage versetzen, in der es einem Wettbewerbsnachteil ausgesetzt ist. Wenn die Produkte und Dienstleistungen auf dem Markt auf lange Sicht deutlich besser sind, könnte der Erfolg Ihres Unternehmens gefährdet sein.

Warum eine hohe Datenqualität immer schwieriger zu erreichen sein könnte

Da immer mehr Unternehmen Daten im Terabyte-Bereich verarbeiten, sehen sie sich im Kontext von Big Data mit Problemen der Datenqualität konfrontiert. In ihrem 2015 veröffentlichten Paper gehen Cai und Zhu näher auf diese Auswirkungen ein. Sie stellen fest, dass die Vielfalt der Datenquellen eine Vielzahl von Datentypen und komplexen Datenstrukturen mit sich bringt, was den Datenintegrationsprozess weiter erschwert. Wie der Begriff Big Data bereits andeutet, wird es immer schwieriger, die DQ für immer größere Datenmengen in einer bestimmten Zeit zu bewerten. Hinzu kommt, dass sich die Daten in einem sehr schnellen Tempo verändern, was immer höhere Anforderungen an die Datenverarbeitungstechnologie stellt.

Die zunehmenden Anforderungen an datenbezogene Aufgaben, gepaart mit der steigenden Nachfrage nach qualifizierten Bewerbern, müssen zu einer Qualifikationslücke führen. In einer aktuellen Studie von Experian stellten die Autoren fest, dass 87 % der Befragten Schwierigkeiten bei der Besetzung datenbezogener Positionen in ihren Unternehmen sehen.

Wie kann man die Datenqualität verbessern und aufrechterhalten?

Alle Aktivitäten im Zusammenhang mit der Analyse, Verbesserung und Sicherung der Datenqualität lassen sich unter dem Begriff Datenqualitätsmanagement (DQM) zusammenfassen.

Im Allgemeinen wird zwischen präventiven und reaktiven Maßnahmen unterschieden. Erstere zielen darauf ab, Fehler zu vermeiden, die sich negativ auf die Datenqualität auswirken. Während letztere versuchen, bereits bestehende Datenqualitätsprobleme zu erkennen und zu beheben. Generell sollte das Ziel sein, zu verhindern, dass Datenmängel in das Data Warehouse gelangen.

Doch nicht nur verschmutzte Daten sind mit Kosten verbunden, sondern DQM-Maßnahmen verbrauchen auch wertvolle Ressourcen. Otto und Österle präsentierten eine ökonomische Interpretation des optimalen Datenqualitätsniveaus. Sie stellen fest, dass die Kosten für verschmutzte Daten mit steigender Datenqualität sinken.

Dagegen steigen die Grenzkosten von Datenqualitätsmaßnahmen mit höherer Datenqualität.

Das optimale Niveau der Datenqualität liegt also nicht in der Abwesenheit von schmutzigen Daten, sondern im Minimum der Gesamtkostenkurve. Daher sollte das Datenqualitätsmanagement eine kostenoptimale Kombination aus reaktiven und präventiven Maßnahmen anwenden. Da diese Vorschläge eher theoretisch sind, möchte ich Ihnen ein paar praktische Tipps geben:

  1. Wenn dies noch nicht der Fall ist, dann bündeln Sie Datenqualitätskompetenzen in einem Kompetenzzentrum. Sie können in einem Business-Intelligence- oder Data-Engineering-Team konzentriert sein; in größeren Organisationen gibt es ganze Data-Governance-Abteilungen. Dies erhöht das DQ-Niveau und bringt klare Verantwortlichkeiten für DQM-Maßnahmen mit sich.
  2. Eine weitere wichtige Rolle spielt das Sammeln von Datenanforderungen. Dies mag zunächst trivial klingen, erfordert aber tatsächlich ein tiefes Verständnis der Zustände und Szenarien, die relevant werden können. Oftmals ist das Expertenwissen einer Fachabteilung hilfreich bei der Formulierung von Geschäftsregeln, die zur Prüfung der Datenqualität herangezogen werden können.
  3. Oftmals stammen unsaubere Daten aus anderen Quellen oder Abteilungen. Da die Qualität der Daten unbekannt ist, sollten sie gründlich untersucht werden.
  4. Wenn DQ-Probleme nicht außerhalb des Teams auftreten, haben sie ihren Ursprung innerhalb des Teams. Duplikate nach dem Zusammenführen von Datenquellen, fehlende Daten aufgrund einer unharmonischen Auftragsplanung sind typische Beispiele dafür, was intern schief gehen kann. Ein sorgfältiges Design von Datenpipelines in jedem Schritt des Prozesses, von der Datenintegration über die Datenverarbeitung und das Testen bis hin zur Job-Orchestrierung, ist entscheidend.
  5. Die häufigste Quelle für unsaubere Daten sind menschliche Fehler. Sei es, dass Mitarbeiter Tippfehler machen oder es versäumen, die erforderlichen Informationen zu liefern. Ergreifen Sie Maßnahmen zur Vermeidung oder Einschränkung menschlicher Interaktionen und versuchen Sie, Prozesse zu automatisieren.

Fazit

Unsaubere Daten sind eine ernsthafte Bedrohung für den Erfolg einer Marke. Jüngste Entwicklungen wie die erwähnte Qualifikationslücke oder Big Data machen es noch schwieriger, die Datenqualität zu verwalten. Nichtsdestotrotz müssen Sie Maßnahmen ergreifen und eine Initiative gegen unsaubere Daten in Ihrem Unternehmen starten. Eine hohe DQ erfordert ein leistungsfähiges Kompetenzzentrum, das in der Lage ist, sorgfältig konzipierte Datenpipelines zu implementieren. Darüber hinaus ist es ratsam, menschliche Fehler zu reduzieren oder auf ein Minimum zu beschränken und Prozesse zu automatisieren, wo dies möglich ist. Wenn Sie diese Tipps befolgen, werden Sie in der Lage sein, die DQ in Ihrem Unternehmen zu steigern und zu erhalten. Dies ist zwar mit einigem Aufwand verbunden, kann aber für Ihre Marke von großem Nutzen sein.

Wenn Sie sich von den Aufgaben des Datenqualitätsmanagements überfordert fühlen oder die Folgen von unsauberen Daten fürchten, dann sprechen Sie uns an!

Wir freuen uns darauf, Sie dabei zu unterstützen, ein datengesteuertes Marketing in Ihrem Unternehmen zu etablieren. 

Quellen

Braverman, S: Global Review of Data-Driven Marketing and Advertising; J Direct Data Digit Mark Pract 16; S. 182 (2015); https://link.springer.com/article/10.1057%2Fdddmp.2015.7

Experian: Benchmark report: 2019 Global data management research; Taking control in the digital age; S.10 (2019); https://www.edq.com/490ed5/globalassets/white-papers/2019-global-data-management-benchmark-research.pdf

Lee, Y. W., Pipino, L. L., Funk, J. D., Wang, R. Y: Journey to Data Quality; MIT Press. Boston; S.55-60 (2006); https://mitpress.mit.edu/books/journey-data-quality

Cai, L. und Zhu, Y.: The Challenges of Data Quality and Data Quality Assessment in the Big Data Era; Data Science Journal; 14, S.3. (2015); https://datascience.codata.org/articles/10.5334/dsj-2015-002/

Experian: Benchmark report: 2020 Global data management research; The data-driven organization, a transformation in progress; S.14 (2020); https://thedataliteracyproject.org/app/default/files-module/local/downloads/2020-global-data-management-research.pdf

Boris Otto, Hubert Österle: Corporate Data Quality - Voraussetzung erfolgreicher Geschäftsmodelle; Springer Gabler; S.33 (2016); https://library.oapen.org/bitstream/handle/20.500.12657/28094/1001900.pdf?sequence=1

Erhalten Sie viermal im Jahr die für Sie relevantesten Artikel per E-Mail.

Zum Newsletter anmelden


© Copyright | Mercury Media Technology GmbH