Blog: Flash Storage im Rechenzentrum – Beschaffungskriterien und Positionierung

Starnberg, 9. Okt. 2013 - Wann ist der Einsatz von Flash Storage sinnvoll und welche Randbedingungen gilt es bei der Vorauswahl und Beschaffung zu beachten...

Einleitung: inzwischen bieten alle etablierten Hersteller ein breites Portfolio an Flash Storage an – sei es Serverbasiert über PCIe Cards wie LSI Logic oder Fusion-IO, Hybrid-Arrays (HDD, SSD, Flash) oder auch All-Flash-Arrays. Wobei die letztere Variante bislang überwiegend eine Start-Up-Domäne darstellt, da hier der größte Mehrwert- sprich Differenzierungsfaktor über spezifische Hardware- bzw. Softwarefunktionen zu erzielen ist (GreenBytes, Nimbus, Violin, Pure Storage etc.).

Die jüngsten Übernahmeaktivitäten unterstreichen die Bedeutung dieser Entwicklung (siehe EMC-XtremIO / Produkte noch in 2013), Western Digital - Virident oder Cisco- Whiptail). Neue Anbieter wie z.B. Pure Storage unterstreichen diesen Anspruch durch eine aggressive Preisgestaltung und der Aussage, dass in fünf bis sieben Jahren Standard Festplatten-Speicherarrays komplett durch Flash Arrays ersetzt werden können. Der Hersteller setzt auf Grund des günstigen Preises konsequent auf MLC und positioniert sein Angebot als direkte Ersatzbeschaffung für bisherige Harddisk-Arrays in einem breiten Leistungssegment (nicht absolutes High-End).

Einige Fakten:

  • Die technische Entwicklung in Verbindung mit fallenden Komponentenpreisen macht Flash-Storage heute nicht nur für High-End-Rechenzentren interessant; auch kleinere-bis mittlere Datenbanken, dedizierte Server, VDI- oder Virtual Machine -Umgebungen profitieren direkt durch geringe Latenzzeiten, teilweise im Sub-Millisekunden-Bereich; 
  • In Verbindung mit Daten-Deduplizierung kann FLASH seine Vorteile besonders ausspielen: Dedupe auf HDD-Systemen arbeitet auf Grund des Random I/O – Profils dieser Anwendung langsamer als mit Flash.
  • Da die Bausteine (Speicherchips) für alle Hersteller aus der gleichen Quelle stammen (Samsung, Toshiba etc.), ist neben der Hardware-Implementierung (Controller, FPGA, Intel MultiCore CPUs, Firmware) und den Kosten für SLC, eMLC oder MLC bei All-Flash-Arrays aus Betreibersicht die mitgelieferte Data-Management-Software entscheidend. Violin Memory z.B. setzt auf Storage Management Funktionen von Veritas Symantec (Cluster, Dedupe, Thin Provisioning), während die meisten anderen Hersteller auf ihr eigenes Softwareangebot zurückgreifen.
  • Entscheidend bei der Auswahl sind nicht die Performancedaten auf Grund abstrakter I/O/s vom Datenblatt sondern reale Latenzzeiten wie sie beim Einsatz der Systeme in einer Applikationsumgebung gemessen werden. Denn natürlich behauptet jeder Anbieter, mit Flash über sehr hohe E/A-Leistung zu verfügen, aber reine Spec-Sheets / Benchmarks sind eben nur bedingt aussagekräftig, da die vorhandene Systemumgebung nicht berücksichtigt wird (Engpässe bei iSCSI Ethernet, bei Servern, HBAs-/NICs oder im SAN).
  • Derzeit bleibt das Testen der Systeme vor einer größeren Beschaffung ein Muss und eine gründliche Vorplanung inkl. Analyse der vorhandenen Anwendungs-Workloads und SLAs ist sinnvoll.

Ein weiterer Punkt bei All-Flash-Arrays neben CAPEX und den Kosten pro IOPS betrifft den Leistungsumfang von Daten-Effizienz-Funktionen wie In-Line Deduplizierung (Data Reduction Ratio), intelligente Kompression, Thin Provisioning, Snapshots usw.:

  • Erst in Verbindung mit einer entsprechenden Kapazitätsoptimierung (Storage Effizienz) rechnen sich All-Flash-Systeme auch in einem breiteren Applikationsumfeld (VM-Storage, VDI oder bei höher-kapazitative Datenbank-Anwendungen).
  • Hybrid-Storage-Systeme (Dell, IBM, HDS, EMC, NetApp, HP, Tegile, Nimble etc.) profitieren neben (Auto-)Tiering-Funktionen von Data-Efficiency-Tools, um damit auch bei hohen Kapazitätsanforderungen konkurrieren zu können.
  • Beispiel: 30TB an Oracle Produktionsdaten durch Deduplizierung-/Kompression effektiv auf rund 1.5TB auf einem All-Flash-Array zu speichern, bedeutet eine 20:1 Data Reduction Rate. Kann diese Rate erreicht werden, bedeutet das 95 % CAPEX - Einsparung bei teurer NAND-Kapazität – Leistungszuwächse nicht quantifiziert.
  • TCO-Analysen beim Einsatz von Flash Storage (gegenüber reinen HDD-Arrays) innerhalb einer kommerziellen Datenbank-Umgebung (20 TB) zeigen Einsparpotentiale von ca. 30% (über drei Jahre gerechnet); was sich hauptsächlich auf geringere Lizenz- und Betriebskosten zurückführen lässt.

Faustregel: je effizienter und automatisierter das Data Management der Flash-Umgebung, desto niedriger sind die Gesamtkosten der Speichersysteme (TCO/ OPEX).

Beschaffungskriterien und Empfehlungen zur Planung und zum Einsatz von Flash Storage:

  • Ein kontinuierliches systemweites Application Performance Management- Monitoring sorgt für Planungssicherheit bei der Umsetzung einer Flash Strategie und identifiziert mögliche Leistungs-Engpässe wie Netzwerk, HBA-/NIC oder Server I/Os pro-aktiv. Stichwort „Balanced System“ !

  • Prüfen Sie, ob die von Ihnen eingesetzte Storage Management Software eine entsprechende Integration der verschiedenen neuen Storage Technologien (SAS, SATA, FC, SSD und FLASH) sowie Data Tiering unterstützt bzw. dafür über heterogene Storage Services wie Snapshots, Tiering und Datenreplikation verfügt (Speichervirtualisierung)

  • Verfügt FLASH Storage analog zu meiner bisherigen Speicherumgebung über die selben Hochverfügbarkeits-Merkmale plus Robustheit und Zuverlässigkeit; welche RAID Implementierung wird eingesetzt ?

  • Unterstützt das System Non-Disruptive Firmware-/ Software/ Hardware Upgrades ?

  • Welche ggf. zusätzlichen Kosten entstehen mir durch notwendigen Zukauf von weiteren Software-Lizenzen zur Daten-Deduplizierung, Data Compression oder Daten-Replikation? Wird mit Inline- oder Post-Processing Data Reduction gearbeitet ?

  • Wie einfach und schnell lässt sich das neue System in vorhandene Systemumgebungen integrieren und betreiben (install, configure, operate). Entstehen signifikante zusätzliche betriebliche Aufwendungen (OPEX / TCO / Betriebskosten) ?

  • Welche Daten-Reduzierungsraten sind in meiner Applikationsumgebung zu erreichen? Kommen automatisierte Verfahren zum Einsatz. Wie hoch ist der Betreuungsaufwand im laufenden Betrieb.

  • Speichern Sie wichtige (Hot / high value data) Unternehmensdaten von wesentlichen Anwendungen auf Flash (Datenbanken, Decision Support, virtual maschine); also Daten, die aus Benutzersich wirklich einen sehr schnellen Zugriff benötigen.

  • Steht bei Bedarf ein Testsystem ohne größeren Aufwand zur Verfügung?

Zusammenfassung:

Flash ist nicht Disk und die Architektur und das Design der Speichersysteme unterscheiden sich fundamental (Beispiel: RAID). Besonders bei schreibintensiven I/O-Workloads macht sich dieser Umstand bei Flash direkt bemerkbar. Es ist deshalb wichtig zu verstehen, welche Applikationsprofile und Anforderungen vorliegen, um die optimale Lösung zu finden (z.B. I/O-Blockgröße, Read-/Write-Ratio, Sequential vs. Random Access usw.). Weitere Punkte betreffen das Sizing der Speichernetze und aller angeschlossenen Server.

Flash-Arrays unterscheiden sich auf Grund der Standardisierung der Hardware-Komponenten wesentlich durch die Verwendung intelligenter Software, sprich Data-Efficiency-Tools. Sie sind damit bereits heute eine direkte Alternative zu klassischen Festplatten-Arrays, die auf Grund mechanischer Latenzzeiten vielfach nicht mehr in der Lage sind, alle Performance-Anforderungen aus User-Sicht sowohl Kosten- als auch energieeffizient zu erfüllen. Je effizienter und automatisierter hierbei das Data Management, desto niedriger die Gesamtkosten des Systems (TCO/ OPEX) und hier unterscheidet sich die neue Technik nicht von bisher eingesetzten Systemen.

Falls Sie hierzu mehr Infos aus erster Hand möchten, darf ich Sie auch auf unsere kommende Fachtagung „Performance Tag für Rechenzentren“ am 14. Nov. 2013 in Düsseldorf hinweisen.

Die Fachtagung ist für professionelle IT-Anwenderunternehmen wie immer kostenfrei. Infos zur Agenda und Anmeldung finden Sie unter:

http://www.storageconsortium.de/content/content/fachkonferenzen-des-storage-consortium


Links zu aktuellen Anbietern (Auswahl ist aus Platzgründen nicht vollständig):

EMC: http://www.xtremio.com/

NetApp: http://www.netapp.com/us/products/storage-systems/flash-ef540/index.aspx

IBM: http://www-03.ibm.com/systems/de/storage/flash/

Pure Storage: http://www.purestorage.com/

Nimbus: http://www.nimbusdata.com/

Tegile: http://www.tegile.com/

LSI Logic: http://www.lsi.com/products/flash-accelerators/pages/default.aspx

Fusion-IO: http://www.fusionio.com/

Violin Memory: http://www.violin-memory.com/i/