29. Dezember 2008 - Datenqualität

Warum sich bereinigte Daten besser schützen lassen

Fehlerhafte Daten können zu ungenauen Statistiken, falschen Planzahlen und steigenden Kosten führen. Doch neben dem wirtschaftlichen Schaden leidet auch der Datenschutz. Dubletten werden bei Sperrung oder Löschung übersehen, vertrauliche Informationen gehen an den falschen Empfänger und an sich unkritische Datenfelder enthalten personenbezogene Daten, da die Felder falsch befüllt oder missbraucht wurden. DSBs sollten deshalb bei der Datenerfassung, bei Datenmigrationen und dem Datenbankwechsel einen genauen Blick auf die Datenqualität werfen.

Datenschutzkonzept ist Grundlage der Datenschutzorganisation (Bild: Mathias Rosenthal / iStock / Thinkstock)

Sind die Adressdaten eines Unternehmens mit Fehlern durchzogen, sind Probleme bei den Versandaktionen vorprogrammiert. Wenige Tage nach dem Versand kommen zahlreiche Kundenbriefe zurück, da die genannten Empfänger nicht zu ermitteln waren.

Es geht nicht nur um die Portokasse

Bei anderen Kunden merkt das betroffene Unternehmen die Fehler in der Adressdatenbank nur indirekt. Nachdem verschiedene Kunden schon häufiger das gleiche Angebotsschreiben mehrfach in ihrer Post hatten, bestellen sie wütend den Newsletter-Service ab.

Fehlerhafte Adressdaten führen aber nicht nur zu unnötigen Portoausgaben, ungenutzten Vertriebschancen und verärgerten Kunden.

Vertrauliche Post landet bei anderem Kunden

Ein guter Kunde bittet vielleicht um eine Kopie seiner Verträge aus den letzten Monaten. Diese Anfrage wird seiner Kundennummer zugeordnet. Durch einen Fehler in der Adressdatenbank ist dort jedoch die Kundennummer mit einer anderen Person verknüpft, die nun die Verträge zusammen mit der Vertragsanschrift des richtigen Kunden erhält.

An diesem leider nicht untypischen Beispiel wird deutlich, dass eine mangelhafte Datenqualität ohne weiteres zu einem ungewollten Datenabfluss führen kann.

Dies gilt natürlich auch für die digitale Kommunikation, wenn zum Beispiel die falsche E-Mail-Adresse bei einem Geschäftspartner hinterlegt wird.

Mehr zum Thema „Datenabfluss“

Datenfelder werden missbraucht

Selbst auf Feldebene geschützte Datenbanken können vertrauliche Daten preisgeben, wenn zum Beispiel die Datenbankfelder missbraucht werden.

Kommentarfelder, die als unkritisch eingestuft wurden, werden bei der Erfassung mit Telefonnummern oder Kreditkarteninformationen belegt, weil die an sich dafür vorgesehenen Felder bereits mit einer anderen Telefonnummer oder Kreditkarte belegt sind.

Auswertungen, die an sich anonyme Ergebnisse liefern sollten, enthalten dann plötzlich personenbezogene Angaben. Die Einschränkung von feldspezifischen Berechtigungen führt oftmals nicht zu der gewünschten Datensicherheit, denn die vertraulichen Informationen verteilen sich mitunter auf ganz andere Felder, Datensätze und Tabellen, als es eigentlich geplant war.

Einmal löschen oder sperren reicht vielleicht nicht

Wenn Datensätze gelöscht oder gesperrt werden sollen, kann es durch eine mangelhafte Datenqualität passieren, dass zwar der entsprechende Datensatz gefunden und abgeändert wurde, aber eine Dublette des Datensatzes bleibt unverändert, entgeht also der Datenlöschung oder Datensperrung.

Ein Kunde wurde dann zwar aus dem Verteiler gestrichen, sie oder er bekommt aber durch die Dublette weiterhin die unerwünschte Werbung.

Solche Dubletten sind in Kundendatenbanken sehr verbreitet. Kommen Kundendaten auf verschiedenen Wegen zur Erfassung, also zum Beispiel einmal telefonisch, einmal durch den Posteingang und ein drittes Mal per E-Mail, dann wird dieser Kunde häufig mehrfach angelegt.

Aber es gibt noch andere Gründe für Datenfehler.

Vorsicht bei der Zusammenführung von Datenbanken

Eine klassische Ursache für Datenfehler besteht in der Vereinigung von zwei oder mehr Datenbanken. Hier können schnell Dubletten entstehen, wenn man nicht genau aufpasst.

Ebenso können Daten in falsche Felder gelangen, wenn zum Beispiel in einer Datenbank ein Feld anders definiert war oder wenn homonyme Datenfelder, also Felder gleichen Namens mit unterschiedlicher Bedeutung, vorliegen.

Ebenso können Datenfelder vertauscht werden

  • bei der elektronischen Datenübertragung unter Verwendung falsch programmierter Austauschschnittstellen (Fehler im Datenmapping),
  • bei der Verknüpfung verschiedener Unternehmensanwendung (wie Warenwirtschaft und CRM-System),
  • bei der Umstellung auf ein neues Anwendungssystem oder
  • bei einem Softwareupgrade.

Ebenso sind kritisch zu sehen

  • die fehlende oder mangelhafte Datenbank-Dokumentation,
  • keine geregelte Zuständigkeit für die Datenerfassung,
  • die Nutzung einer Vielzahl von unterschiedlich strukturierten Datenquellen und
  • keine ausreichende Softwareunterstützung bei der Datenerfassung, insbesondere durch intelligente Validierungsregeln.

Datenqualität ist eine Grundlage für den Datenschutz

Datenschutzbeauftragte sollten sich deshalb ausführlich mit der Datenqualität im Unternehmen befassen, da andernfalls Sicherheitsrichtlinien und Schutzmaßnahmen nicht greifen können und der unbemerkte Datenabfluss die Folge sein kann.

Die Datenqualität lässt sich insbesondere steigern durch
  • die genaue Festlegung der Datenfeldbeschreibung,
  • geeignete Validierungsregeln und Plausibilitätsprüfungen bei der Datenerfassung,
  • die genaue Definition und der umfassende Test von Austauschschnittstellen und -formaten
  • das Erzwingen von bestimmten Datenformaten (wie nur Datumsangaben möglich und zum Beispiel keine Telefonnummer)
  • die Konsistenzprüfung bei abhängigen Daten (wie Ort und Postleitzahl)
  • eine genaue Planung und Tests bei Datenmigrationen
  • automatische Dublettenprüfungen

Oliver Schonschek
Oliver Schonschek ist Diplom-Physiker und Fachjournalist

Sie glauben, Sie hätten noch so viel Zeit? Falsch! Es gibt mehr zu tun, als Sie vielleicht denken! ▶ Zeit zu handeln