Information und Bildungsarbeit von und für die SAP®-Community
8. August 2022

Quantität und Qualität

Obwohl der Wechsel zu S/4 unausweichlich ist, zögern viele Unternehmen noch. Ein Grund, die Transformation zu meiden, könnte die hohe Anzahl an Stammdaten mit mangelnder Datenqualität in den verschiedenen Datensilos sein.
avatar

Die Stammdaten müssten schließlich für die Migration vorbereitet werden. Dabei ließen sich bei der Gelegenheit relevante Dubletten in den Stammdaten identifizieren und mit der richtigen Strategie vermeiden. Wie sollten Unternehmen hier vorgehen? SAP setzt Unternehmen nicht nur bei der Migration nach S/4 ein Ultimatum durch das Ende des Herstellersupports der Vorversionen. SAP forciert zudem die Migration in die Cloud.

Der DSAG-Investitionsreport 2022 zeigt, dass bisher 32 Prozent der Unternehmen S/4 on-premises nutzen, sechs Prozent S/4 in der Private Cloud und zwei Prozent in der Public Cloud. Unternehmen zeigen laut dem Bericht Zurückhaltung bei der vollständigen Migration, denn offenbar setzen knapp die Hälfte der Unternehmen, die S/4 im On-prem-Einsatz haben, parallel noch ERP/ECC 6.0 beziehungsweise die Business Suite 7 ein. Das deutet darauf hin, dass einer vollständigen Ablösung durch das neue System noch nicht genug vertraut wird. 

Leider treffen die Cloud-First-Strategie und das veränderte Datenmodell bei Unternehmen allzu oft noch auf über die Jahre gewachsene Datensilostrukturen. So hat eine IDC-Studie im Jahr 2020 ergeben, dass in Unternehmen im Schnitt 23 Datensilos unterhalten werden. Eine Barc-Studie aus dem Vorjahr belegt, dass sich bei 65 Prozent der Studienteilnehmer daran noch immer nichts grundlegend geändert hat. Im Gegenteil, die Zahl der Datensilos steigt sogar weiter. Das ist weder für eine vollständige Migration noch für eine Hybridnutzung verschiedener Systeme hilfreich, sondern macht die unausweichliche Ablösung noch schwieriger.

Der DSAG-Report zeigt auch, dass das Investitionsverhalten für S/4 im Vergleich zum Vorjahr leicht rückläufig ist. Unternehmen sollten diesen Zeitpunkt nutzen, um die Qualität ihrer Stammdaten zu verbessern und dauerhaft beizubehalten. Denn nur mit einer gesichert hohen Datenqualität kann die Ablösung vom Altsystem gelingen und die Wertschöpfung der neuen Lösung voll ausgenutzt werden.

Wie ein falscher Fünfziger

Unternehmen sind gut beraten, ihre Stammdaten schon vor der Migration nach S/4 in das neue Datenmodell zu übertragen und die Entitäten richtig zuzuordnen. Immer noch vorhandene Datensilos, aber auch Namens- oder Adressänderungen und menschliche Eingabefehler sorgen jedoch immer wieder für doppelte oder gar mehrfach vorhandene Datensätze. Selbst in gut bewirtschafteten Datensammlungen sind im Schnitt noch fünf Prozent redundante Datensätze vorhanden, wenn man einmal von den gewollten Dubletten wie beispielsweise differierende Rechnungs- und Lieferadresse absieht. Die Doppelungen gilt es aufzuspüren, und zwar in dem Sinne, dass bei Dublettenprüfung und unscharfer Suche der relevante Datensatz gefunden wird. Nur so kann der richtige Geschäftspartner im Zweifel eindeutig identifiziert werden.

Es empfiehlt sich, dem Entstehen von Dubletten gleich bei der Eingabe entgegenzuwirken, um nicht erst später den gesamten Datenbestand durchforsten und bereinigen zu müssen. Im Idealfall erfolgt die Dublettenprüfung nah am Dialog in der Geschäftspartnertransaktion. Doch auch die Überprüfung im Address Search Body in SAP ist eine Option: Hier kann zunächst die Hana Fuzzy Search direkt bei der Eingabe neuer Daten im Hintergrund nach Bestandsdaten suchen und abgleichen. Es entsteht allerdings eine recht umfangreiche Liste möglicher Kandidaten doppelter oder mehrfacher Datensätze.

Doch welche Datensätze, sprich welcher Geschäftspartner, sind im Zweifel korrekt und relevant? Eine händische Nachbearbeitung der Vorschlagsliste ist nötig. Bei großen Datenbeständen können das Hunderte oder gar mehrere Tausend Datensätze sein – für die Sachbearbeitenden kaum effizient zu bewältigen, geschweige denn, den richtigen Geschäftspartner zu identifizieren.

Hana Fuzzy Search

Im Umfeld von S/4 oder der Hana-Datenbank unter SAP ERP oder SAP CRM kann daher eine zusätzliche intelligente und in SAP integrierte Identity-Lösung, wie etwa von Uniserv, als Add-on helfen, die Kandidatenliste der Hana Fuzzy Search auf die relevantesten Treffer einzugrenzen. So werden etwa 90 Prozent der irrelevanten Dubletten aussortiert. Bei der Dublettenprüfung, also dem Anlegen oder Ändern eines Datensatzes, wie auch bei der unscharfen Suche mit Suchen, Öffnen, Bewerten und Auswählen des Geschäftspartners verbleibt am Ende eine überschaubare Menge relevanter Datensätze, die abschließend effizient manuell bearbeitet werden kann. Die finale Entscheidung, welcher Datensatz der richtige, also der relevante ist, kann zügig getroffen werden. 

Aus der Eingabe (grüner Input in erster Zeile) findet das System mit dem Uniserv-Add-on und Hana Fuzzy Search das Ergebnis (Match) und bewertet dieses. Der Vorteil liegt in der Transparenz: Der Anwender erkennt den Weg (Farbschema) zu den Daten und kann diese so nochmals evaluieren. 

Besonderheiten bei der Identifizierung: Während bei einer unscharfen Suche im Suchfenster einige wenige Argumente einer Person oder Firma eingegeben werden, werden bei der Dublettenprüfung für das Anlegen oder Ändern eines Datensatzes strukturiert verschiedene Elemente, etwa Vor- und Nachname, Straße, Hausnummer, Postleitzahl und Ort eingegeben. Entsprechend sind besondere Möglichkeiten zur Identifizierung zu beherrschen. Nach der Reduzierung verbleiben noch rund zehn Prozent Treffer, für die ein Score die aggregierte Wahrscheinlichkeit angibt, ob ein Datensatz eine Dublette oder schon den richtigen Datensatz darstellt. Je höher der Score, umso wahrscheinlicher handelt es sich um eine Dublette. Die Bewertung erfolgt über vorab definierte Tokens, also bestimmte Segmente oder Bestandteile, die bei der Suche mithilfe länderspezifischer Wissensbasen und eines zugrunde liegenden Algorithmus überprüft werden.

Die Tokens können vom User eingesehen werden, die Bewertung erfolgt also transparent. Im Expertenmodus sehen User, welche Tokens wie bewertet wurden. Das erläutert die Einstufung der Relevanz eines Datensatzes und hilft den Mitarbeitenden, den richtigen, relevanten Datensatz zu identifizieren. Es empfiehlt sich also, neben der Hana Fuzzy Search auf zusätzliche Technologie zu setzen, die die Ergebnisliste so weit eingrenzt, dass Geschäftspartner zeitsparend und effizient korrekt identifiziert werden können. Es gilt: Relevanz vor Menge. Das hilft Unternehmen enorm dabei, neue Dubletten oder mehrfache Datensätze erst gar nicht entstehen zu lassen. 

Vor allem die eingangs erwähnte Hälfte der Unternehmen, die parallel auf verschiedenen Versionen von SAP arbeiten, laufen Gefahr, Dubletten als sprichwörtlichen Ballast im Datenbestand mitzuführen. Vor der vollständigen Umstellung sollten sie deshalb eine Dublettenprüfung und insgesamte Datenqualitätssicherung durchführen. Und im späteren Betrieb den Blick auf doppelt und mehrfach vorhandene Datensätze fest installieren, damit keine neuen Dubletten als „falsche Fünfziger“ ein System auf Dauer wieder verunreinigen.


Suchparameter

Synonymsuche: Die Namen „Steffi“ und „Stefanie“ werden als potenziell zusammengehörig angezeigt.

Überhangsuche: Doppelnamen werden auch durch die Eingabe des Einzelnamens gefunden, etwa „Heinz Müller-Schulze“ bei „Heinz Müller“.

Tippfehler: Dublette trotz fehlerhafter Eingabe erkannt, etwa bei „Stehpan“ und „Stephan“.

Akronym-Auflösung: Abkürzungen werden erkannt, etwa bei „TK“ für „Techniker Krankenkasse“.

PLZ-Gleichsetzung: Postleitzahlen, die geografisch nah beieinander liegen, können entsprechend gewertet werden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

magnifiercrosschevron-down