Infrastruktur MAG 1712

Garbage in – Garbage out

[shutterstock.com:467490299, petovarga]

Während sich Experten noch über die Genauigkeit von Matching- oder Vorhersage-Algorithmen Gedanken machen, hinkt die Qualität der zugrunde liegenden Stammdaten hinterher. Auf welcher Grundlage sollen dann also geschäftsentscheidende Vorhersagen getroffen werden?

Rund 85 Prozent der Unternehmen haben nach Lünendonk (2016) ein Stammdatenproblem. Was aus dem Business-Intelligence-Umfeld schon seit Jahren bekannt ist, schlägt sich nun im Rahmen der digitalen Transformation nieder.

Unternehmen müssen prozessorientiert auf den digitalen Wandel vorbereitet sein. Das schließt die Sicherstellung einer hohen Stammdatenqualität mit ein. Hier können nun neue Möglichkeiten (z. B. Machine Learning) direkt in den Prozess eingreifen und eine Sicherstellung der Datenqualität zum Zeitpunkt des Entstehens ermöglichen.

Ein derartiger Eingriff in die Geschäftsprozesse muss von den Unternehmen gewollt sein. Wer es allerdings nicht tut, wird in ein paar Jahren das Nachsehen haben.

ad_banner

Zwei aktuelle Beispiele

Stellen Sie sich vor, Ihr Matching-Algorithmus schreibt automatisch einen Kandidaten an, der aber aufgrund nicht vollständiger und nicht aktueller Daten gar nicht der richtige ist. Woher soll der Algorithmus auch wissen, was wirklich vollständig und aktuell bezogen auf die Daten des Kandidaten bedeutet?

Die entstandenen Kosten durch den unnötigen Zeitverlust (Mails schreiben, hinterher telefonieren etc.) sind faktisch da, peinlich ist aber das Anschreiben eines falschen Kandidaten.

Stellen Sie sich vor, Sie entscheiden sich aufgrund eines automatischen Algorithmus für einen Lieferanten, dessen Daten wie in Beispiel 1 ebenfalls unvollständig und nicht aktuell sind oder gar falsch gepflegt wurden (Konditionen, Liefertreue, gesetzliche Voraussetzungen etc.).

Ist die Bestellung einmal ausgelöst, ist es schwierig, diese wieder zurückzunehmen. Neben dem Aufwand der Rückabwicklung leidet hier vor allem die Glaubwürdigkeit als Auftraggeber.

Joern Doering, machine learning, Stammdaten

Eingriff in die Geschäftsprozesse

Um die Qualität der Stammdaten zu verbessern, kann vor allem im SAP-Umfeld nun mit der Hana-Plattform in den Geschäftsprozess eingegriffen werden. Der Vorteil besteht darin, dass bei der Hana-basierten Stammdatenpflege die Möglichkeiten von Abgleichalgorithmen genutzt werden können, die dem Bearbeiter der Daten bereits signalisieren, ob eine Eingabe prinzipiell richtig oder falsch bzw. zu einem bestimmten Grad der Wahrscheinlichkeit richtig oder falsch ist.

Was richtig oder falsch bedeutet, kann auch hier im Umfeld der Hana-Technologie auf der Basis der bereits existierenden Daten abgeleitet werden. Wie hoch der Grad der Genauigkeit der Stammdaten in Gänze ist, muss im Vorfeld evaluiert, definiert und ggf. geradegezogen werden.

Mit den nun hinzukommenden Daten wird sich peu à peu die Genauigkeit (= Konsistenz und Vollständigkeit sowie Aktualität und Semantik) der Daten weiter erhöhen und somit die Grundlage für weiterführende Entscheidungen verbessern. Dieser Prozess bedient sich der Methodik des Machine Lear­ning – Lernen aus den anfallenden Daten.

Bei dem Prozess wird der Sachbearbeiter aber ebenso gefordert. Er ist die letzte Instanz zur qualitativen Sicherstellung der Daten! Ihm wird mit dem Machine Learning aber ein Tool angeboten, den notwendigen visuellen Check erfolgreich auszuführen.

Warum nun Hana?

Ein entscheidender Schritt zur Qualitätsverbesserung der Stammdaten ist die interaktive Einflussnahme durch Vorschlagswerte und/oder Wahrscheinlichkeitsaussagen während der Dateneingabe. Die ­Erfahrungswerte aus dem Machine-Learning-Ansatz müssen in Echtzeit zur Verfügung stehen.

Eine Auswertung von Erfahrungswerten in „angrenzenden“ Datenhaltungssystemen (Hadoop etc.) wird für die Echtzeitverarbeitung der Daten nicht förderlich. Die Erfahrungswerte (nicht zwingend die gesamte Datenbasis, aus denen diese Erfahrungen extrahiert wurden) sollten also dort liegen, wo sie zur Laufzeit benötigt werden – direkt in der Datenbank des operativen Systems.

Um diese Möglichkeiten innerhalb der SAP-Hana-Plattform zu nutzen, sind die lizenztechnischen Voraussetzungen zu erfüllen. In jedem Falle ist es eine Investition – aber eine Investition, die sich lohnt.

Schon heute können nicht nur circa fünf bis zehn Prozent der gesamten Arbeitszeit, die für die Behebung von Stammdatenfehlern aufgewendet werden muss, eingespart werden, sondern die auf modernen Algorithmen basierenden Erkenntnisse können vertrauensvoll in echten geschäftlichen Gewinn umgewandelt werden – heute und vor den Mitbewerbern am Markt.

Detect Value CI Banner

Über den Autor

Jörn Döring, Detect Value

Jörn Döring ist Geschäftsführer und Mit-Gründer von Detect Value

Hinterlassen Sie einen Kommentar

AdvertDie Meinung 2