Information und Bildungsarbeit von und für die SAP®-Community
5. September 2022

Das dreckige Dutzend

Mehr Daten bedeuten nicht automatisch mehr Überblick. Im Gegenteil. Trotzdem stellen Unternehmen viel zu selten ihre Datensammelwut und die Validität der zusammengetragenen Informationen infrage.
avatar

Welchen Wert aber können vermeintlich richtungsweisende Entscheidungen haben, deren Grundlage fragwürdige oder verunreinigte Quellen darstellen? Egal ob veraltet, doppelt registriert oder schlicht unvollständig – die Gründe für schlechte Qualität von Informationen sind vielseitig. Dabei betrifft das Problem Dirty Data besonders Unternehmen, die große Mengen an Daten erfassen. „Sticht das Chaos bereits ins Auge, ist der Frühlingsputz mehr als überfällig“, weiß Andreas Köninger, Digitalisierungsexperte und Vorstand bei SinkaCom. „Schließlich fällt die Bereinigung immer schwerer, je reicher die Speicher gefüllt sind.“ Glücklicherweise können Maßnahmen auf struktureller Ebene die Datenhygiene immens verbessern und so für zuverlässiges Reporting sorgen. 

Entgegen der landläufigen Annahme hilft in Sachen Datenhaushalt viel nicht immer viel. Im Gegenteil: Sammelwut ist eher kontraproduktiv. „In der Praxis zeigt sich diesbezüglich regelmäßig, dass neben der Komplexität auch Aufwände und Kosten exponentiell steigen, während die Datenqualität in noch stärkerem Maße fällt“, betont Andreas Köninger. Als ersten Schritt zur Verbesserung der Lage gilt es daher die eigenen Prozesse zu hinterfragen. Welches Ziel wird mit dem Sammeln der Informationen verfolgt? Fördern sie die Optimierung von Abläufen? Lassen sich Kennzahlen aus dem Wissen ableiten? Besitzen Daten keine Relevanz, lohnt sich eine Löschung, um das Dickicht auszudünnen. Ein solches Vorgehen entspricht dann auch dem DSGVO-Grundsatz der Datensparsamkeit.

„Um im nächsten Schritt eine effektive Analyse zu ermöglichen, braucht es eine Form von Kompatibilität zwischen allen verwendeten Datenformaten“, weiß Andreas Köninger. „Das beginnt bei einer einheitlichen Unternehmenssprache und hört bei einer vollautomatisierten Umwandlung der Informationen auf.“ Denn nur wenn alle Abteilungen beispielsweise dieselbe Bezeichnung für einen Geschäftsprozess oder Kunden verwenden, lassen sich Unreinheiten wie doppelte Einträge überhaupt erkennen. So können etwa unterschiedliche Bezeichnungen wie „Geschäftsführer“ und „Vorsitzender der Geschäftsführung“ den Maschinen mehrere Posten suggerieren, obwohl es sich um dieselbe Stelle handelt.

Im Zweifelsfall unterstützen eigenständige Anwendungen bei der Übertragung der Informationen in das gewünschte Format und bereinigen Ungenauigkeiten automatisch. Besonders wenn von externen Partnern regelmäßig Übertragungen eintreffen, reduziert ein spezialisiertes Programm oder eine gut konzipierte Schnittstelle das Potenzial für Dirty Data. Gelingt es, alle relevanten Informationen abteilungsübergreifend zu vereinheitlichen und somit auslesbar zu machen, ist ein großer Schritt getan. Schlanke Strukturen wirken Wunder gegen Dirty Data.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

magnifiercrosschevron-down