All-Flash oder Hybrid? Leistungsmerkmale einer modernen Speicherarchitektur

München, Starnberg, 5. Okt. 2015 – Nimble Adaptive Flash mit CASL liefert mit 4-KB logischer Blockgröße eine Cache-effiziente, granulare Datenplatzierung für Hot Data...

Zum Hintergrund: Speicherspezialist Nimble liefert mit „Cache Accelerated Sequential Layout“ (CASL) die technologischen Basis seiner Adaptive Flash - Architektur, die nach Angaben des Herstellers sowohl hohe Leistung als auch skalierbare Kapazitäten zu niedrigeren Speicherkosten liefern kann. Im folgende Beitrag werden hierzu einige grundlegende Funktionsprinzipien von CASL geschildert. Das zugehörige komplette (deutschsprachige) Whitepaper von Nimble Storage finden Sie in unserer Rubrik Downloads.

Um Flash-SSDs und Festplatten in einem System integriert zu fahren, sollte dieses auf einer hierfür optimierten (hybriden) Architektur basieren. Viele der heute in Betrieb befindlichen kommerziellen Lösungen wurden in Bezug auf die Softwarearchitektur (RAID, Filesysteme-/Data-Layout für HDDs-only...) bereits vor 15 oder mehr Jahren entwickelt. Damit unterliegen sie, falls nicht entsprechend weiterentwickelt, bei Verwendung von ständig leistungsfähigeren Flashspeichern (IOPS/ Kapazität) gewissen technologischen Beschränkungen. Die Folge:

  • Eine Kombination von SSDs mit langsamer drehenden Festplatten begrenzt die erzielbare Leistung und macht den wirtschaftlichen Betrieb auf Dauer problematisch.
  • Wenn sich Daten nicht sehr schnell auf die jeweils passenden Speichermedien verschieben lassen, kann nur eingeschränkt auf geänderte Applikations-Workloads reagiert werden.
  • Speicherblockgrößen lassen sich nicht ändern und auf die jeweiligen Anwendungsprofile abstimmen.

Hohe Leistung und Kapazität zu niedrigeren Kosten

Nimble „Cache Accelerated Sequential Layout“ (CASL) vermeidet die genannten Einschränkungen mit Hilfe einer spezifischer Systemarchitektur, um die notwendige Kombination aus Performance und Kapazität zu erreichen. Die Abkürzung CASL weist dabei auf zwei Funktionalitäten hin, die den Anbieter von traditionellen Speicherlösungen unterscheiden.

  • „Sequential Layout“ steht für ein intelligentes Datenlayout, dass die I/O-Performance von der Anzahl der eingesetzten Platten entkoppelt: Hierzu werden alle Daten sequenziell auf die Festplatten geschrieben werden; das gilt auch dann, wenn es sich aus Anwendungssicht um Random Writes handelt.

  • “Cache Accelerated” bedeutet, dass für die Speicherung der Daten zusätzlich zu Festplatten ein großer Cache eingesetzt wird. Standard DRAM- Speicher sind relativ klein und stellen meist nur rund 0,1 Prozent der Speicherkapazität von Festplatten-Subsystemen dar. Dies reicht für die Zwischenspeicherung von Metadaten, die ca. 0,5 Prozent der Speicherkapazität belegen, ebenso wenig aus, wie für aktive Anwendungsdaten. Der in der CASL- Architektur verwendete Cache kombiniert DRAM mit einem hohen Flash-Anteil.

Speichersysteme, die Flash-SSDs als Cache für Tier-0 nutzen, schreiben die Daten meist zuerst in Flash und dann auf die Festplatte. Damit steigen jedoch die Kosten für den Flash-Einsatz durch die kürzere SSD-Lebensdauer, bis zu 50 Prozent mehr Kapazität für RAID und einem steigendem Rechenaufwand bei der Verlagerung von Daten.

Bei Nimble ist Flash kein eigenständiger Storage-Tier: Hot Data werden zugleich in den Flash-Bereich als auch in den geschützten Plattenbereich geschrieben. Daher kann bei SSDs auf RAID verzichtet werden. Fällt eine Solid State Disk aus, verschlechtert sich bis zu deren Austausch lediglich die Cache-Beschleunigungskapazität geringfügig. Das Auswechseln lässt sich im laufenden Betrieb vornehmen, ohne dass es laut Hersteller zu Datenverlusten oder einer Stillstandzeit kommen soll. Dies stellt die unterbrechungsfreie Ausführung aller Anwendungen sicher.

Aus Kostengründen wird der zur Leistungsbeschleunigung erforderliche Flash-Anteil auf ein Minimum reduziert. Um die Menge im Cache speicherbarer Daten zu optimieren, setzt der Hersteller bei der Blockgröße des Datenlayout an. Werden indizierte oder häufig angefragte Daten (Hot Data) im Flash abgelegt, passt der Controller die logische Blockgröße so an, dass sie exakt auf die Anwendung abgestimmt ist. CASL lässt mit 4-KB-Blöcken eine granulare Datenplatzierung zu.

  • Für weitere Effizienz sorgt die Vorkomprimierung aller Blöcke, bevor sie auf Flash geschrieben werden. Es wird ferner nur eine Kopie der Datenblöcke zwischengespeichert, auf die alle erstellten Clones gemeinsam zugreifen können.
  • Zur Leistungssteigerung trägt eine Priorisierung der am häufigsten angeforderten Datenpakete bei, die in Echtzeit im Flash-Speicher abgelegt werden. Bei jedem Schreib- und Lesevorgang entscheidet das System, ob eine Kopie der Daten im Flash verbleibt oder nicht.

Einsatz von preiswerten Flash-Bausteinen

Der Abnutzungsgrad von SSDs hängt auch von der Zahl der kontinuierlich kleinen Schreibzugriffe ab. Dies liegt daran, das auf Grund Flash-Speicher-Aufbaus mehr Flash (NAND-Zellen beschrieben werden, als es notwendig wäre. Dieser Ansatz - als „Write Amplification“ bezeichnet - erhöht die Zahl der Schreibzyklen, die eine SSD unterstützen muss. Nimble Storage adressiert Write Amplification auf folgende Weise: Das CASL-Dateisystem ist optimiert, die große Zahl an Random-Writes in einem sequenziellen I/O-Stripeset zusammenzufassen. In Flash wird nur ein Vielfaches der kompletten Erase-Block-Größen geschrieben. Ergebnis ist eine minimierte Write Amplification, die den Einsatz preiswerter Flash Bausteine wie MLC erlaubt. Zudem werden laut Hersteller in der Praxis Datenkomprimierungsraten von bis zu 40 Prozent erzielt, was zur weiteren Kostenoptimierung beiträgt.

Abb. 1: Bildquelle Nimble CASL - Leistung, Kapazität und Schutz der Daten

AnhangGröße
Image icon Nimble CASL Übersicht83.25 KB