Backup-Zeiten um 80 Prozent mit Flash SSDs reduziert

Starnberg, 24. Jan. 2013 – RamSan Flash Memory Array liefert hohe IOPS-Leistung im SAN für IBM Storage Filesystem Metadaten...

Zum Hintergrund: Die Research Computing- und Cyberinfrastruktur Gruppe (RCC) an der Penn State Universität erbringt IT-Services für die mehr als 5.000 Mitglieder der Lehr- und Forschungseinrichtung. Hardwareseitig arbeitet das RCC dazu mit einem Cluster aus 1.000 Servern (10.000 CPU-Kerne). Die Storage-Infrastruktur besteht aus 14 Servern, auf denen Red Hat Enterprise Linux 5 im Cluster installiert ist. Die Server sind mittels 8 Gb/s Fibre Channel HBAs an 900 TB SAN-Festplattenspeicher angeschlossen; die Daten werden über Ethernet zum Compute-Cluster übertragen.

Das Storage Cluster basiert auf IBM GPFS - scale-out NAS Cluster-Filesystem – das zur Policy-basierten aktiven Verwaltung von Dateien für Backup-/Migration, Archivierung und Index-Tagging mit dedizierten File-Metadaten arbeitet. Dies stellte im Dauerbetrieb jedoch eine hohe Random I/O Belastung für die HDDs dar. GPFS-Metadaten selbst sind klein (512 Byte) und die Speicherkapazität damit nicht das Problem. Vielmehr stellt die hohe IOPS-Anforderung bei Millionen von Dateien die eigentliche Herausforderung für die Performance der SAN-Infrastruktur dar.

1. Problem: Geschwindigkeit beim Backup

Das RCC hatte hierzu 200 schnelle 15K RPM Festplatten eingesetzt, um die Metadaten-Verarbeitung für die (in der Nacht durchgeführten) Backups der Nutzerdaten zu handhaben (bewusstes „Over-Provisioning“ aus Performancegründen).

Trotz Zuweisung der hohen Anzahl von HDDs betrug die nächtliche inkrementelle Sicherungszeit jedoch immer noch 6 Stunden und beeinflusste damit andere Betriebsabläufe negativ. Konsequenz: Die Konfiguration war für diese Art von Anwendungsanforderung zu langsam.

2. Lösung: High-Performance RamSan-810 Flash-Speicher

Das RCC-Team ersetzte die Festplatten durch schnellen FLASH-Speicher. Anwenderzitat: "Wir benötigen nicht Kapazität, sondern Leistung ", sagt Vijay Agarwala, Sr. Direktor für Penn State RCC. Es gab Operationen wie nächtliche Backups, die den Status aller Dateien im System zu prüfen hatten jedoch durch den Leistungsengpass bei den Festplatten beeinträchtigt wurden. Deshalb war es sinnvoll, mit einem Flash-Memory-Array die bisherigen Laufwerke zu ersetzen", sagte Jason Holmes, Systemadministrator bei RCC. Die RamSan-810 SSD–Konfiguration von IBM (ex Texas Memory Systems, TMS) wurde nach Anwenderangaben gewählt, weil hier am wenigsten manuelle Tuning- bzw sonstige Optimierungs-/Abstimmungsarbeiten nach der Installation notwendig wurden.

Penn State hat zwei RamSan-810 1HE Flash-Speichersysteme in einer für Hochverfügbarkeitszwecke gespiegelten Konfiguration getestet, um die Vorteile der Replikations-Funktion von GPFS zu übernehmen. Die RamSan Rack-Einheiten enthalten jeweils 2 TB SSD Flash und lassen sich aktuell auf 10 TB skalieren.

RamSan-810 ist das erste Flash-Speicher-System von TMS, das eMLC Flash Memory verwendet. eMLC ist sowohl Technologisch als auch aus Preis-/Performance-Aspekten gut für lese-intensive Anwendungsprofile geeignet. Die RCC-Applikation mit 85/15 Lese-Schreib-Verhältnis war damit ein geeigneter Kandidat für die Konfiguration.

Anmerkung: eMLC bietet hier eine höhere Wirtschaftlichkeit als SLC NAND, das zwar eine bessere Schreibleistung (z.B. RamSan-710) aufweist, jedoch verbunden mit Mehrkosten bei der Beschaffung. Weitere Informationen zur Positionierung von MLC versus SLC finden Sie auch in unserer Rubrik „BLOG“ vom 17. Jan. 13 unter:

> http://www.storageconsortium.de/content/?q=node/1497

3. Fazit: Die Vorteile der neuen SSD-Lösung waren laut RCC sofort spürbar. Nach Installation der RamSan-810-Systeme konnten die nächtlichen Backup-Zeiten um den Faktor 6 verbessert werden. Anwenderzitat: "GPFS erlaubt es uns, die Metadaten von Festplatte online auf RamSan-SSD Storage zu bewegen und damit die Backupläufe auf eine Stunde zu reduzieren, sagte Holmes. TMS ist für diese Anwendung die beste Lösung, vor allem in Bezug auf Reife und Performance. Die Lösung arbeitet stabil und funktionierte bei uns einfach aus der Box“.

http://www.psu.edu/

http://www-03.ibm.com/systems/storage/solutions/ssd/

Bildquelle: IBM US, Systems and Technology Group - Jan. 2013