Flash- und Festplattenspeicher intelligent kombinieren - Hybrid Storage vs. All Flash

Starnberg, 18. Juni 2014 – Geringe Latenzzeiten im Sub-Millisekunden zur kosteneffizienten Applikationsbeschleunigung...

Zum Hintergrund: der folgende Beitrag mit der Überschrift „Die Handbremse bei Flash-Systemen lösen - intelligente Speichersysteme erreichen trotz einer kostengünstigen Kombination aus Flash- und Festplattenspeicher eine Latenz im Sub-Millisekunden-Bereich“ ist ein technisch orientierter Fachbeitrag von Edward Lee, Architect* bei Tintri - US-Anbieter von „Anwendungs-sensitiven“ Speichersystemen mit Fokus auf virtualisierte Systemumgebungen. Aus Sicht von Tintri werden in dem Beitrag einige zentrale technologische Aspekte bei der Beschaffung von Hybrid-Storage vs. All-Flash diskutiert und gegenübergestellt... 


Zum Beitrag: „Der Einsatz von Flash-Technologie bei Speichern hat den von langsamen Festplatten mit Spindeln verursachten Flaschenhals im Prinzip beseitigt. Neue, mit Flash bestückte Systeme bieten endlich höhere Leistung. Doch Vorsicht ist geboten! Flash bietet zwar eine außergewöhnliche hohe IOPS-Leistung, birgt aber gleichzeitig zahlreiche neue Probleme: Write Amplification, Latenzspitzen, begrenzte Schreibbeständigkeit und nicht zuletzt sehr hohe Kosten pro GB. Um die hohe IOPS-Leistung zu nutzen und gleichzeitig die Kosten pro GB von Flash-Technologie aufzuwiegen, bieten neue Flash-Speichersysteme eingebaute Intelligenz und distanzieren sich damit von der ersten Generation von Flash-Systemen. Seitdem Flash im Rechenzentrum Einzug gehalten hat versuchen etablierte und neue Anbieter die neue Technologie in unterschiedlicher Weise zu nutzen. Die entsprechenden Produkte lassen sich grob in zwei Kategorien unterteilen:

  1. Festplattenbasierte Produkte mit Flash als Cache
  2. Reine, Flash-basierte Produkte (mit oder ohne HDDs für erweiterte Kapazität)

Festplattenbasierte Systeme mit Flash als Cache nutzen Potenzial von Flash nicht optimal

Festplattenbasierte Produkte sind grundsätzlich darauf ausgelegt, die Nutzung von Festplatten zu optimieren. Sie werden mit Flash-Speicher kombiniert, der als Cache dient, um die Lesegeschwindigkeit zu erhöhen. Flash-Speicher als Cache ist relativ einfach zu implementieren und es ist daher wenig überraschend, dass sich die meisten Speicheranbieter für diesen Weg entschieden haben. Viele "Flash-as-Cache"-Implementierungen sind jedoch nicht persistent und nicht redundant, entsprechend fällt die Leistung nach Abstürzen bzw. Ausfällen von Komponenten rapide ab. Da die Masterkopie auf der Festplatte verbleibt, wirkt sich der Flash-Speicher bei Lesevorgängen positiv aus, jedoch nicht bei Schreibvorgängen. Aus diesem Grund steigt die Gesamtleistung nicht proportional zu den Verbesserungen im Bereich der Flash-Technologie.

Abb. 1: Cache-Architekturen mit Flash geben Schreibvorgänge an die Festplatte weiter und lesen direkt vom Flash

Ein immer wichtigerer Parameter moderner Systeme ist jedoch die Latenz. Abbildung 2 stellt die Auswirkungen der Flash-Zugriffsrate auf die Latenz dar. Zugriffsraten von 50 % sind typisch für festplattenbasierte Produkte mit Flash-Speicher als Cache. Selbst bei einer Zugriffsrate von 67 % ist die durchschnittliche Leselatenz jedoch immer noch zehnmal höher als bei reinen Flash-basierten Produkten. Da Festplatten integraler Bestandteil des grundlegenden Datenpfades von festplattenbasierten Produkten sind, können sie unmöglich Latenzzeiten auf Flash-Niveau erreichen und bleiben deshalb weit hinter den Möglichkeiten die Flash bietet zurück.

 

Abb. 2: Festplattenbasierte Architekturen werden trotz Flash-Speicher durch hohe Latenz beeinträchtigt

Reine Flashbasierte Systeme – teurer und komplizierter in der Verwaltung

Im Gegensatz zu Festplatten- sind Flash-basierte Produkte speziell für Flash-Technologie konzipiert und zeichnen sich durch eine deutliche geringere Latenz aus. Sie unterscheiden sich insbesondere dadurch, dass ihr grundlegender Datenpfad keinen Zugriff auf Festplatten erfordert. Bei Flash-basierten Produkten kommen oft kostengünstige MLC-Technologien zum Einsatz und zum Teil neue Techniken wie Inline-Deduplizierung und -Komprimierung, um die hohen Kosten pro GB für Flash-Speicher in Grenzen zu halten. Die meisten Flash-basierten Produkte sind reine Flash-Produkte, einige weisen aber auch integrierte Festplatten auf, um die Kapazitäten zu erweitern und die Verwaltung zu vereinfachen.

  • Die ersten reinen Flash-Produkte waren darauf ausgelegt, die höchstmögliche IOPS-Leistung zu erreichen. Entsprechend sind die Kosten pro GB in der Regel sehr hoch und es fehlt solchen Systemen an Enterprise-Features wie Hochverfügbarkeit, Snapshots und Klone. Selbst mit Inline-Deduplizierung und -Komprimierung sind reine Flash-Arrays derzeit noch zu teuer, um sie für den Großteil der Anwendungen in einem Unternehmen einzusetzen.
  • Auch wenn man von äußerst optimistischen Schätzungen für diese hochentwickelten Methoden ausgeht, werden MLC-Flash-Geräte immer mindestens fünfzehnmal so viel pro GB kosten wie SATA-HDDs. Entsprechend sind für reine Flash-Arrays separate kostengünstige festplattenbasierte Speichersysteme für Snapshots, Replikate, selten genutzte Daten und Daten von weniger I/O-intensiven Anwendungen erforderlich (Abbildung 3). Folglich besteht bei reinen Flash-Arrays ein erheblicher zusätzlicher Arbeitsaufwand bei der Bereitstellung von Anwendungen bzw. der Aufhebung der Bereitstellung zwischen Flash-Speicher und Festplatte. Die Verwendung von reinen Flash-Produkten für Enterprise-Anwendungen erfordert eine umfassende Planung, Überwachung und Erweiterung der Infrastruktur.

Abb. 3: Reine Flash-Produkte sind keine vollständigen Lösungen

Die neue Flash-Intelligenz

Zu festplattenbasierten Produkten gehört weiterhin die Festplatte und die damit limitieren Systeme können nur bedingt von der Flash-Leistung profitieren. Reine Flash-Produkte zeichnen sich hingegen durch eine gute IOPS-Leistung aus, sind jedoch teuer und es fehlt ihnen an Verwaltungsfunktionen. Entsprechend stellen beide Möglichkeiten keine umfassende Lösung für Enterprise-Anwendungen dar. Die Flash-Leistung ganz auszuschöpfen, ohne gleichzeitig die Einschränkungen und hohen Kosten reiner Flash-Produkte hinnehmen zu müssen, erfordert einen intelligenteren Ansatz.

Bei intelligenten Flash-basierten Produkten wird eine Kombination aus Flash- und Festplattenspeicher verwendet, aber Techniken wie Inline-Deduplizierung und  Komprimierung und Working-Set-Analysen angewandt, um praktisch alle I/O-Vorgänge des Flash-Speichers zu verarbeiten (Abbildung 4).

Abb. 4: Bei intelligenten Flash-basierten Produkten kommt eine Kombination aus Flash- und Festplattenspeicher zum Einsatz, um eine Flash-Zugriffsrate von 99 % zu erreichen und so effizienter als reine Flash-Arrays eine Leistung im Sub-Millisekunden-Bereich zu erzielen

Dazu werden unnötige Daten aus dem Flashspeicher entfernt und nur wichtige Daten dort belassen. Bei den aus dem Flash-Speicher entfernten Daten handelt es sich vor allem um Snapshots, Replikate, nicht genutzte Anwendungen, ausgeschaltete VMs und andere äußerst selten benötigte Daten. Anders als bei reinen Flash-Produkten kann so der nutzbaren Flash-Speicher zu 100 % gefüllt werden, ohne befürchten zu müssen, dass der Speicherplatz knapp wird.

Intelligente Flash-basierte Produkte erreichen Flash-Latenzen im Sub-Millisekunden-Bereich und sind im Hinblick auf den Betrieb weitaus einfacher und kostengünstiger als reine Flash-Produkte (Abbildung 5).

Abb. 5: In intelligenten Flash-basierten Speichersystemen werden alle Schreibzugriffe im Flash-Speicher ausgeführt, und mindestens 99 % der Lesezugriffe erfolgen vom Flash-Speicher. Schreibvorgänge auf die Festplatte erfolgen nur, wenn selten benötigte Daten entfernt und auf die Festplatte verschoben werden und die Anwendungsleistung nicht beeinträchtigt wird.


Einfach, intelligent, schnell: Die Zukunft der Enterprise-Speichertechnologie

Angesichts der Tatsache, dass zahlreiche aktuelle Probleme bei der Anwendungsverwaltung auf den Speicher zurückzuführen sind, sind Flash-Speicher in Verbindung mit Application-Awareness intelligente Speichersysteme, die nicht nur die Verwaltung des Speichers vereinfachen, sondern auch die der Anwendungen und der IT-Infrastruktur insgesamt. Die Lösung klingt einfach - warum wurde dieses Konzept also nicht schon früher umgesetzt? Die mechanischen, festplattenbasierten Systeme vor der Einführung der Flash-Technologie waren zu komplex, um derart intelligente Lösungen zu ermöglichen. Das wäre dem Versuch gleichgekommen, einen PC mithilfe von Vakuumröhren zu bauen. Der große Sprung, der im Hinblick auf die Flash-Leistung gemacht wurde, ermöglicht nun intelligente Speicherlösungen, die einfacher aufgebaut und gleichzeitig sehr viel leistungsstärker sind. Die Technologie automatisiert viele der schwierigen und lästigen Aufgaben, beispielsweise im Hinblick auf die Konfiguration, Verwaltung, Effizienz und Leistung, durch die andernfalls ein enormer Verwaltungsaufwand für die Systemadministratoren entstehen würde.

Nur auf Flash als endgültige Lösung des Speicherproblems zu setzen, wäre also zu kurz gedacht: Es kommt vor allem auf die intelligente Nutzung von Flash an, um dessen Vorteile zu genießen ohne unnötigerweise das Festgeldkonto plündern zu müssen."  Autor: Tim Lee, Tintri 2014

Bildquellen (Abb.) und Text: Tintri Corp. / Alle Rechte.


* Über den Autor

Ed Lee ist Architekt bei Tintri. Vor Tintri ware er Principal Systems Architect bei Data Domain, wo er federführend bei der Entwicklung von Data Domains Dateisystem war. Lee hält einen Ph.D. der Universität of California in Berkeley und war dort ein Mitglied des legendären Berkeley RAID-Teams.

Tintri Firmenprofil: das Unternehmen stellt nach eigenen Angaben "intelligenten Speicher her, der erkennt, lernt und sich anpasst. Der anwendungssensitive Speicher von Tintri eliminiert sowohl die aufwändige Planung als auch die komplexe Fehlerbehebung, weil er Sichtbarkeit, Kontrolle, Einblick und Agilität auf der Ebene der einzelnen virtuellen Maschine (VM) bereitstellt..."