Datensicherheit in Echtzeit


Die In-memory-Datenbank Hana hält Daten im Arbeitsspeicher vor und beschleunigt damit Analysen des Geschäftsverlaufs sowie Trendberechnungen gegenüber klassischen relationalen Datenbanken enorm.
Sie dient als Basis für Lösungen wie die SAP Business Suite oder das neue SAP Simple Finance und eignet sich für den Parallelbetrieb von OLAP (Online Analytical Processing) und OLTP (Online Transaction Processing).
Hana stellt aber hohe Anforderungen an die IT-Organisation. So warnte Gartner Ende 2014, dass sich IT-Teams für das Management der Plattform ganz neue Kenntnisse aneignen müssen.
Neben dem reinen Betrieb werfen Storage, Backup, die Migration und die Kapazitätsplanung Fragen auf: Welche Komponenten benötige ich heute, wie sieht mein Bedarf in zwei Jahren aus?
Viele IT-Organisationen haben hier keine Erfahrungswerte, ist doch Hana eine noch recht junge Lösung. Anfangs offerierte SAP die 2010 vorgestellte Plattform, wie der Name Hana („High-Performance Analytic Appliance“) andeutet, nur als Komplettsystem.
Bald bekundeten Anwender jedoch Bedarf, bestehende Speicherlösungen weiterzuverwenden. Deshalb ergänzte SAP die Appliances 2013 um den TDI-Ansatz: Anwenderunternehmen können dank TDI Compute-Blöcke mit Storage-Equipment nach Wunsch kombinieren – sofern diese Bausteine von SAP für TDI zertifiziert sind.
Neben der Weiterverwendung bestehenden Speicher-Equipments bietet TDI gegenüber den Komplettsystemen eine Reihe zusätzlicher Vorteile, etwa Flexibilität bei der Komponentenwahl, z. B. im Rahmen einer Dual-Vendor-Strategie.
Da Hana hier keine „Black Box“ darstellt, wird die Einbindung in ein unternehmensweit einheitliches Monitoring von ITSM-Metriken erleichtert. Ein gemeinsames Vorhalten von Hana- und Nicht-Hana-Daten auf dem gleichen Storage-System wird durch den Aufbau virtueller Arrays ermöglicht, während die Appliance rein auf Hana beschränkt ist.
Zusätzlich besteht die Möglichkeit, durchgängig Flash-Speicher („All-Flash Storage“) zu nutzen – eine Option, die bei den Appliances nicht vorgesehen ist.
All-Flash für Hana
Bei traditionellen festplattenbasierten Speichersystemen muss man eine Vielzahl von Spindeln einsetzen, um eine hohe I/O-Rate zu erzielen. Flash-Speicher ist hier um ein Vielfaches schneller – und dank des Fehlens mechanischer Bauteile und drehender Medien weniger anfällig für Störungen.
Im Hana-Kontext erfolgen Datenzugriffe allerdings im RAM. Beim Massenspeicher geht es um I/O-Performance auf der Persistenz-Ebene.
In diesem Kontext bietet die ASIC-basierte All-Flash-Architektur von HP einige Vorteile: Die HP-3PAR-Familie skaliert linear auf bis zu 15 Petabyte Datenvolumen, abhängig von den SAP-Hana-Volumina.
Dabei benötigt ein solches All-Flash-System um den Faktor 6 weniger Strom, Kühlung und Platz im Rack als ein vergleichbares plattenbasiertes Speichersystem (siehe Kasten „Einsparpotenziale durch Flash“).
Die erzielbaren Kostensenkungen können sich schnell auf sechsstellige Beträge belaufen; allein durch die niedrigere Energiewendeabgabe kann ein Mittelständler Hunderttausende Euro sparen.
Vorab ist es allerdings erforderlich, sich gründlich über die Storage- und Backup-Anforderungen eines Hana-TDI-Systems zu informieren. Für Unternehmen, die Hana einsetzen, ist die Plattform in aller Regel geschäftskritisch, Ausfallzeiten können sie sich deshalb nicht leisten.
In puncto Storage bedeutet dies, dem Controller besonderes Augenmerk zu schenken. Um Ausfallsicherheit zu garantieren, empfiehlt HP, statt der üblichen Dual-Controller-Lösungen eine Vier-Controller-Architektur zu nutzen. So kann ein Controller ausfallen, ohne dass Daten- oder Performanceverluste zu befürchten sind.
In der Array-Architektur, die HP für 3PAR verwendet und das einzige Vier-Controller-System am Markt im Midrange-Segment ist, sind alle Controller aktiv und können auf sämtliche Daten gleichzeitig zugreifen. Dazu ist ein Clustered File System nativ implementiert.
Dies sorgt für die extrem hohe Redundanz, die im Tier-1-Storage-Bereich gefordert ist. Inzwischen ist Flash-Technologie aber auch für das Midrange-Umfeld attraktiv: HPs Datenverdichtungstechnologien für die Flash-Technik holt aus den SSDs (Solid-State Disks) 20 Prozent mehr Nettokapazität heraus, sodass, bezogen auf die Kosten je GB Nettodaten, die SSDs mit drehenden Platten preislich gleichauf liegen.
Für die geforderte Hochverfügbarkeit in virtuellen Umgebungen müssen Failover und Failback zwischen Storage-Systemen automatisch und unterbrechungsfrei erfolgen. Erweiterungen und Upgrades der Storage-Hardware müssen im laufenden Betrieb möglich sein, Firmware-Updates ebenfalls.
Ist ein Speichersystem für ein Firmware-Update herunterzufahren, kann man eigentlich nicht mehr von „Hochverfügbarkeit“ sprechen: Pausen beeinträchtigen dann zwangsläufig immer wieder den Geschäftsalltag.
Von Vorteil für den IT-Betrieb ist es, wenn das Storage-Equipment über einheitliche Architektur, Betriebssystem und Software-Funktionen verfügt – unabhängig davon, ob es sich um ein kleines, Midrange- oder High-End-System handelt und ob es nur Flash oder als Hybridsystem Flash neben Festplattenspeicher nutzt.
Das Management sollte über alle Systeme eines Herstellers hinweg mit einem einheitlichen Interface möglich sein. Unterschiedliche Verwaltungsschnittstellen erweisen sich oft als hinderlich – und somit als Fehlerquelle, die die Hochverfügbarkeit gefährden kann.
Zwar bietet Flash-Speicher die höhere Zugriffsgeschwindigkeit bei deutlich niedrigerem Energieverbrauch und Kühlungsbedarf, jedoch unterliegen SSDs einem schnelleren Alterungsprozess als drehende Platten.
Deshalb sollte ein Monitoring-Tool die SSD-Alterung überwachen und den Administrator automatisch informieren, wenn ein SSD-Baustein auszutauschen ist. HP gewährt zudem fünf Jahre Garantie auf SSDs, unabhängig davon, ob sie wegen eines Defekts oder Alterung ausfallen.
Kritisches Backup
Hochverfügbarer Storage erfordert ein solides Backup-Konzept. Dies gilt für Hana unvermindert, daran ändert auch der In-memory-Betrieb der Datenbank nichts. Im Gegenteil: Dem externen Speicher kommt eine wichtige Rolle als Backup- und Archivierungsmedium für eine geschäftskritische Datenbank zu.
Ein Blick auf die Ebenen in SAPs Hana-Architektur verdeutlicht dies: Auf der In-memory-Ebene läuft die Datenbank, während die sogenannte Persistenzebene alle Transaktionen loggt.
Für Backups darf man sich aber niemals allein auf die Persistenzebene verlassen: Tritt in der In-memory-Ebene ein logischer Fehler auf – beispielsweise durch Fehlbedienung, Wartungspannen, Stromausfall etc. –, dann wird dieser in die Persistenzebene kopiert.
Sie schützt also nicht vor korrumpierten Daten. Deshalb sind die beiden Ebenen stets durch eine Backup- und eine Archivierungsebene zu ergänzen. Erst eine separate Backup-Ebene sorgt über API-Zugriffe auf Hana für die verlässliche Datensicherung.
Der Systemverwalter kann Snapshots auf dem Array durchführen, die den Zustand des Arrays zum Zeitpunkt x widerspiegeln; hier erfolgt allerdings keine Konsistenzprüfung, bedingt durch die Gegebenheiten der SAP-API.
Deshalb sollte der Administrator mindestens einmal pro Woche ein Backup mittels Backint (Backup Integration) durchführen. Dieses umfasst Konsistenzprüfungen auf dem Medium und schließt damit Datenkorruption aus.
Zur langfristigen Aufbewahrung werden die Daten schließlich auf der Archivierungsebene gespeichert, um Compliance-Anforderungen Genüge zu tun. Auch für Backups gilt: Einheitlichkeit über alle Systeme hinweg erleichtert die Bedienung.
Eine Backup-Lösung für Hana sollte zudem die Standard-SAP-APIs nutzen, um den Anpassungsaufwand zu minimieren und die Release-Fähigkeit zu wahren. Ein QoS-Management (Quality of Service) sollte dafür sorgen, dass z. B. im Mischbetrieb von Hana mit Fremdanwendungen Backups einer Anwendung nicht die Performance von Hana-Abläufen beeinträchtigen.
Die Deduplizierung der Daten sollte möglich, aber auch abschaltbar sein. Denn eine Deduplizierung ist bei Hana nicht unbedingt sinnvoll, im Mischbetrieb mit Fremdanwendungen aber durchaus von Vorteil.
Die Datenmobilität sollte uneingeschränkt – auch standortübergreifend – gegeben sein. Nützlich ist es zudem, wenn die Backup-Lösung die Datenbestände von Hana ohne separate Backup-Agentensoftware sichern kann. Das vermeidet Lizenzkosten.
Das Gesamtkonzept
Die Komplexität einer Hana-Migration ist schnell unterschätzt. Das Projekt wird gerne isoliert nur mit Blick auf die Business-Vorteile betrachtet, ohne IT-Gesamtkonzept.
Dann fallen wichtige Fragen unter den Tisch wie jene, welche Datenbestände man besser gar nicht erst in Hana laden sollte, um das Datenvolumen im Arbeitsspeicher nicht unnötig aufzublähen.
Gefordert ist daher eine Gesamtbetrachtung vom Datenbankbetrieb über Backup/Recovery und Archivierung bis hin zu Informationssicherheit, Datenschutz und Compliance.
Nicht zuletzt gilt es, die Abhängigkeiten zwischen Hana und angeschlossenen Lösungen zu spezifizieren: Ein verbreitetes Problem beim Hana-Betrieb ist die Sicherstellung der Konsistenz sämtlicher Datenbestände – also auch der Daten per API angeschlossener Lösungen.
Selbst langjährige SAP-Kunden haben damit oft noch keine Erfahrung. Hier ist Expertise gefragt, wie sie HP als SAP-Hana-Partner der ersten Stunde mit jahrzehntelanger Erfahrung im Betrieb unternehmenskritischer IT-Infrastrukturen liefern kann.
Der Wechsel zu Hana verspricht viele Business-Vorteile, doch zuerst muss man sich den Betriebs-, Storage- und Backup-Herausforderungen stellen. Denn das Echtzeit-Business von heute benötigt hochverfügbare Datenbestände.
Einsparpotenziale durch Flash
Mit den neuen 3,84-TByte-SSDs für die HP 3PAR ist es HP gelungen, die Kosten für SSD-basierten Speicher auf unter zwei US-Dollar pro GByte Nettodaten zu senken.
Somit liegen diese SSDs preislich auf gleicher Höhe wie handelsübliche 10k-SAS-Festplatten – und das bei einer fünfjährigen Garantie auf den Flash-Speicher. Nicht nur gegen technische Defekte, sondern auch bei Abnutzung.
HPs All-Flash-Arrays ermöglichen damit im Vergleich zu traditionellen hybriden Speicher-Arrays erhebliche Kostensenkungen. Hält ein Unternehmen zum Beispiel 12 PByte nutzbare Kapazität vor, so benötigt es bei herkömmlicher Speicherarchitektur 21 Racks mit 90 Prozent HDD- und 10 Prozent SSD-basiertem Storage.
Dem gegenüber steht ein HP 3PAR StoreServ 208×0 mit 100 Prozent SSDs, das nur drei Racks belegt und für Hana TDI zertifiziert ist. Dieses benötigt jeweils 87 Prozent weniger Energie, Kühlung und Stellfläche. Ebenso günstig fällt die Vergleichsrechnung gegenüber herkömmlichen Dual-Controller-All-Flash-Arrays anderer Hersteller aus.
Ein weiteres Beispiel kann die Gesamtkostenrechnung beim Einsatz von All-Flash-Speicher im Mittelstand veranschaulichen: Die Speicheranforderungen eines mittelständischen Beispielunternehmens liegen bei 45 TiB und 15.000 IOPS.
Ein Hybridsystem HP StoreServ 7200c mit 51,7 TiB RAID 5 (136x 600 GB) verursacht über fünf Jahre gerechnet Stromkosten in Höhe von 36.345 Euro. Das System nimmt 16 Höheneinheiten (HE) im Rack ein und bringt es auf 16.403 IOPS bei 10 ms Latenz.
Ein All-Flash HP StoreServ 7200c mit 44,3 TiB (Deduplizierung 2:1) und 10x 3,84TB RAID 5 hingegen begnügt sich mit 6.307 Euro Stromkosten, es verbraucht somit 83 Prozent weniger Energie.
Dabei belegt es nur 2HE im Rack und bringt mit 48.123 IOPS rund 240 Prozent mehr Leistung – und dies bei nur 1,5 ms Latenz. Das All-Flash-System ist damit deutlich leistungsstärker, verursacht über fünf Jahre gerechnet aber keine Mehrkosten gegenüber einem Hybridsystem.