Die Meinung der SAP-Community MAG 2003 Open Source Kolumne Uncategorized

Integration von Hana und Hadoop

Open-Source
Geschrieben von Michal Alexa, Datavard

Es gibt jeden Tag neue Entwicklungen in der IT-Branche. Das macht es schwer zu entscheiden, worauf man sich wirklich konzentrieren sollte, in was man investieren sollte, um sein Unternehmen zu einem datengetriebenen zu machen.

So liest man auch viel über SAP Hana und Ha­doop. Und das zu Recht. Hana ist eine extrem schnelle und leistungsstarke Technologie, die unverzichtbare Grundlage für einen Großteil der SAP-Produkte werden wird.

Und Hadoop ist die Open-Source-Plattform, wenn es darum geht, große Datenmengen in unterschiedlichen Systemen zu verarbeiten. Es gibt zwar Stimmen, die behaupten, Hadoop sei aufgrund der finanziellen Schwierigkeiten tot.

Aus meiner Sicht macht Hadoop sich jedoch nur warm für die nächste Runde. Und es gibt immer noch viele Unternehmen, die in diese Open-Source-­Technologie investieren. Und das aus gutem Grund.

Oracle

Nutzer sind naturgemäß sehr an neuen Technologien und Möglichkeiten interessiert. Das trifft sicher auch auf Ihre Organisation zu. Aber manchmal will man einfach zu viel zu schnell.

Die Idee von Hadoop entstand irgendwo in großen Konzernen, bei IT-Giganten wie Google oder Yahoo, die vernetzte Datenmanagement-Systeme für ihren Bedarf entwickelt haben. Nicht selten wird die Meinung vertreten, dass eine Technologie, die für ein Unternehmen funktioniert, auch für ein anderes funktionieren muss. Dem ist aber leider nicht so.

Es ist ein großer Unterschied, ob eine neue Technologie für einen bestimmten Anwendungsfall entwickelt wurde oder ob die Implementierung dieser neuen Technologie der Anwendungsfall selbst ist.

Wenn man also nicht sicher ist, wie und ob das Unternehmen von Technologien wie Hadoop profitieren könnte, müssen Anwendungen identifiziert werden, die es wert sind, solch kostenintensive Implementierungen zu testen und zu nutzen.

Denn nur anhand solcher werden die Vorteile der Nutzung von Hana mit Hadoop spürbar. Und dann wird die Rechnung auch recht einfach. Bei der Implementierung von Hana kann man sich viel Zeit und Geld für das Downsizing von Lizenzen und Hardware sparen, indem man einen Teil der Daten in Hadoop speichert.

Diese einfache Auslagerung ist für uns quasi ein Standardszenario. Im Wesentlichen analysieren wir dabei, welche Daten im System aktiv genutzt werden, und entwickeln Offloading-Konzepte für die, die nicht viel genutzt werden.

Es ist immer wieder überraschend, wie viele Daten in SAP-Systemen von Unternehmen, speziell im BW, ungenutzt sind. Nach der Migration der Daten nach Hadoop (oder einem anderen Ziel) ist das SAP-System bereit für die Migration nach Hana – nicht nur kleiner als zuvor, sondern auch für zukünftiges Datenwachstum gerüstet.

Die Integration von SAP und Hadoop bringt von Haus aus viele Möglichkeiten, den Wert von Daten zu steigern: durch die Verbindung von SAP-Daten mit Daten aus anderen Systemen und Bereichen wie Informationen über Verfügbarkeits- und Preisänderungen von Materialien für die Produktion, Stimmungsanalysen für Marketingstrategien, kundenbezogene Umsatzdaten, Kundenverhalten für den Handel und Ähnliches.

Solange man weiß, was man herausfinden möchte, können passende Daten gesammelt und mit den Stammdaten (SAP-Daten) des Unternehmens integriert werden.

Um all diese Datenquellen zu nutzen, braucht es einfach eine leistungsstarke und skalierbare Plattform wie Hadoop und eine schlanke Integration mit SAP. Hadoop wird mit Komponenten geliefert, mit denen die meisten Datenquellen genutzt werden können, außer SAP.

Hier gibt es einfach auf Applikations- und auf Datenmodell-Ebene signifikante Unterschiede. Wenn man also einfach Daten aus SAP-Systemen entnimmt, bekommt man Ergebnisse, die keinen Sinn machen oder, noch schlimmer, persönliche Daten oder andere kritische Daten enthalten, auf die überhaupt kein Zugriff bestehen sollte.

Wir empfehlen daher immer ein schlankes Tool für die Integration mit SAP. „Schlank“ bedeutet hier, dass keine weitere Hardwarekomponente im System installiert werden muss, die Lösung eine nahtlose Integration mit der SAP-Benutzeroberfläche bietet und die Daten für Data Scientists und Ingenieure aus der Big-Data-Welt öffnet – und gleichzeitig SAP-Berechtigungskonzepte einhält.

https://e-3.de/partners/datavard-gmbh/

Über den Autor

Michal Alexa, Datavard

Michal Alexa ist Senior Manager Solution Engineering bei Datavard.

Do NOT follow this link or you will be banned from the site!