EMC XtremIO All-Flash-Array Inline-Dataservices in der Übersicht

Starnberg, 17. Juni 2014 - Interne Architektur des All-Flash-Systems aus verschiedenen parallelverarbeitenden Systemkomponenten reduziert SSD-bedingte Latenzen…

Zum Hintergrund: EMC XtremIO ist eine Kombination aus Standard HW (Commodity Server), hochspezialisierten Systemkomponenten (Infiniband, Clustertechnik) sowie spezifischer Storage Management - Software (XDP, scale-out dedupe, thin volumes). Die Lösung ist technologisch hoch integriert und ein dediziertes high-end Speicherprodukt, dass sich Architekturseitig nicht mit anderen EMC-Storagesystemen vergleichen lässt. Damit geht der Herstellter einen anderen Weg wie Anbieter von Flash Storage im Rahmen von Automated Storage Tiering bzw. auch Hybrid Storage.

Übrigens: Mehr zum Thema Flash Storage und zur Beschaffung finden Sie hier im Bereich Downloads. Verschiedene Vorträge zum Thema, gehalten auf unserem Flash Storage Summit am 22. Mai in Kronberg stehen dort zum freien PDF-Download zur Verfügung (der CIO-Beitrag der Baader Bank AG ist nur für registrierte Benutzer dieser Seite verfügbar).

XtremIO wird nicht im Kombination mit FAST (EMC Tiering) verwendet und stellt sich als eigenständige Array-Lösung zu VMAX oder VNX dar. Verschieden ist auch der Ansatz, Metadaten getrennt von User-Data zu verarbeiten und quasi eine n-Node Scale-out Cluster Deduplizierungs-Flashlösung anzubieten. Der Nachteil von Flash SSDs gegenüber nativen Flash NAND-only - Implementierungen wird durch genannten Konzeption, RDMA über Infiniband und Auto-Expansion etc. kompensiert (Latency); allerdings sind die Beschaffungskosten ohne effektive Deduplizierungsrate entsprechend (ca. 22 EUR/GB ohne Dedupe); bei Dedupe-Raten von 1:10 spricht man laut Hersteller von ca. EUR 2,20 pro GB, was in Anbetracht der publizierten Leistungswerte keine unrealistische Zahl darstellt. Die Kosten pro I/O sollen bei ca. 1.0 EUR liegen. Der Straßenpreis einer 1-Brick-Einstiegskonfiguration ist zwischen 180.000 EUR – 210.000 EUR angesiedelt (Listenpreise sind natürlich enstprechend höher).

Realisiert werden die Leistungswerte des Systems mit Hilfe einer Scale-Out Multi-Controller-Architektur; im Ergebnis kommen vier aufeinander abgestimmte und parallel arbeitende Technologieverfahren zum Einsatz:

  1. Content-Based Data Placement (Hashing Algorithmus)
  2. Zweistufige Metadaten-Engine
  3. XtremIO Datenschutz (XDP)
  4. Shared In-Memory Metadata

Content-Based Data Placement lastet das XtremIO-Array innerhalb eines Bruchteils einer Sekunde über alle SSDs und Array-Controller gleichmäßig aus. Redundante Daten werden direkt bei der Übertragung entdeckt und gelöscht (Scale-out Dedupe); Thin Provisioning erzeugt "All Thin Volumes".

Die Dual-Stage Metadata Engine ermöglicht es dem Array, den Arbeitsspeicher voll auszuschöpfen und Daten überall auf dem Array zu verteilen, ohne sog. Garbage Cleaning des Flashspeichers. Damit lässt sich laut Anbieter ein Leistungsschwund vermeiden; die Latenzzeit kann massiv verringert werden; auch wird eine bis zu 10-fache Reduzierung der Flash-Lebensdauer (im Vergleich zu Flash-Arrays mit Garbage Collection) laut Anbieter vermieden.

XtremIO Data Protection (XDP) ist ein flash-optimierter Algorithmus (kein trad. RAID), der vor SSD-Fehlern schützen soll und verglichen mit herkömmlichem RAID bis zu 40% mehr Kapazität ohne Leistungseinbußen bereitstellt. XDP erzeugt nur 8% Overhead und ist gegenüber RAID5/6 schneller und zuverlässiger; komplexe RAID-Setups und Tuning-Maßnahmen fallen weg (TCO).

Shared In-Memory Metadata erlaubt es laut Hersteller, Daten bereits im Array zu klonen, so dass Aufgaben, wie beispielweise der Einsatz von virtuellen Maschinen, beschleunigt werden.

  • EMC XtremIO konkurriert als absolutes High-End System in seiner eigenen Kundenbasis derzeit wohl hauptsächlich mit unabhängigen Flash-Spezialisten wie Nimbus, Violin Memory, dem neuen NetApp All-Flash Array FAS8080 EX, sowie Dell, Oracle, HP 3PAR, HDS oder IBM (TMS). IBM liefert geringere Latenzzeiten (im Bereich von 120 - 400 µs) ohne Deduplizierung, während Nimbus die Option einer abschaltbaren Kapazitätsoptimierung besitzt. Weitere Anbieter im Leistungsbereich etwas darunter sind z.B. Pure Storage, Fujitsu oder auch X-IO (hybrid Array).

Fazit: Die Beschaffung von high-end Flash-basierten Speichersystemen setzt ein detailliertes Wissen über I/O-Pattern und Anwendungen bzw. Workloads (targets) voraus. Reine SPECs von Herstellern als Vergleich sind wenig zielführend, User-Response-Zeiten sind hingegen fast alles und eine zielgenaue Analyse eigener Anforderungen muss der Beschaffung (Kosten von eMLC/SLC / Komplexität / Preis pro IOPS / TCO etc.) deshalb immer vorausgehen.

+++ Informationen zum Thema Flash Storage finden Sie in unserer Downloads. Hier stehen aktuelle Hersteller- und Anwendervorträge - gehalten auf unserem Flash Storage Summit am 22. Mai in Kronberg - zum freien Download zur Verfügung +++ Weitere Infos finden Sie auch auf dieser Webseite unter den Stichwörtern Flash und Blog.

Abb. 1: Bildquelle EMC XtremIO, Inline Data Services, Content-Based Data Placement, 2014

AnhangGröße
Image icon EMC Xtreme IO DeDupe.jpg89.27 KB