MAG 1611 Szene

Guter Lehrer für Mining-Algorithmen

[shutterstock:530971171, danleap]
[shutterstock:530971171, danleap]
Geschrieben von Holger Stelz, Uniserv

Die Annahme, dass Prognosen nur so gut sein können wie die Daten, auf denen sie basieren, klingt plausibel. Im Rahmen einer Bachelorarbeit an der Hochschule der Medien (HdM) Stuttgart wurde dieser Zusammenhang nun erstmals empirisch untersucht und anhand einer konkreten Testreihe bestätigt.

Die Vergabe der Bachelorarbeit erfolgte im Rahmen der im Frühjahr vereinbarten Zusammenarbeit der HdM mit der Firma Uniserv aus Pforzheim, einem spezialisierten Anbieter von Lösungen für das Kundendatenmanagement.

Der Autor der Arbeit, Paul Titze, Student am Fachbereich Information und Kommunikation des Studiengangs Wirtschaftsinformatik und digitale Medien an der HdM, überprüfte mithilfe verschiedener Testszenarien, in denen Datenanalysen mithilfe von Stammdaten verschiedener Qualität durchgeführt wurden, den Zusammenhang zwischen qualitativ hochwertigen Stammdaten und den Ergebnissen der Analyse via Supervised Machine Learning.

Ergebnis: Vor allem beim Supervised Learning, bei dem die Stammdaten die Grundlage für das Lernen des Algorithmus bilden, konnten mit einer durch Stammdatenmanagement qualitativ hochwertig aufbereiteten Datengrundlage deutlich bessere Vorhersagen erzielt werden als beim Machine Learning mit einem unbehandelten Datenset.

„Mit seiner Arbeit hat Herr Titze erstmals auch empirisch nachgewiesen, dass Datenqualität und Predictive-Analytics-Prognosequalität in direktem Zusammenhang stehen“

„Unternehmen, die heute Predictive Analytics als Grundlage für strategische Geschäftsentscheidungen nutzen, sollten also alles daransetzen, bei den der Analyse zugrunde liegenden Daten eine möglichst hohe Datenqualität zu erreichen.“

Studiengang und Prototyp

Die Vergabe der Bachelorarbeit ist nur eine der gemeinsamen Aktivitäten, die im Rahmen einer Kooperation zwischen Hochschule der Medien und Uniserv vereinbart wurden.

So bietet die HdM beispielsweise seit dem Wintersemester 2016/2017 den neuen Masterstudiengang Data Science und Business Analytics. Das Weiterbildungsangebot umfasst fünf Semester und ist berufsbegleitend.

„Der Bedarf an ausgebildeten Datenspezialisten ist enorm. Gerade internationale Konzerne benötigen dringend das Know-how, wie man aus großen Datenmengen Wissen generiert.

Praktische Szenarien gibt es etwa in der Automobilindustrie, die aufgrund der Fahrweise eines Autofahrers in der Lage ist, den Verschleiß eines Pkw vorherzusagen.

Aber vor allem im Marketing spielen Daten eine große Rolle. Das bekannteste Beispiel ist der Versandhändler Amazon, der dem Kunden auf Basis seiner Such- und Kaufhistorie personalisierte Angebote unterbreitet.“

Uniserv unterstützt das neue Ausbildungsangebot inhaltlich und finanziell.

Golden Profile

Für die Ausbildung setzt die Hochschule der Medien die von Uniserv neu entwickelte Lösungs- und Prozessmethodik Ground Truth ein.

Ground Truth unterstützt Unternehmen dabei, in einem mehrstufigen Vorgehen letztendlich das Golden Profile eines jeden Kunden zu erstellen, das dessen Adressdaten, sein Kaufverhalten, seine Interessen und Vorlieben, aber auch seine Kommunikation und Interaktion mit dem Unternehmen zu einem zentralen Datensatz aggregiert.

Speziell für Predictive Analytics entwickelten die beiden Kooperationspartner einen Prototyp auf der Basis des Ground Truth.

Anhand dieses Prototyps sollte die Bedeutung der Datenqualität als kritischer Erfolgsfaktor für die Güte von Prognosen veranschaulicht werden.

Professor Lehmann erklärt zur Bedeutung von Ground Truth als Grundlage für Predictive Analytics:

„Ground Truth ist ein didaktisch guter Lehrer für Mining-Algorithmen.“

https://e-3.de/partners/uniserv-gmbh/

Über den Autor

Holger Stelz, Uniserv

Holger Stelz ist Managing Director CDH-Solutions und Mitglied der Geschäftsführung von Uniserv.

Hinterlassen Sie einen Kommentar

AdvertDie Meinung 2