Cornell University Center for Advanced Computing arbeitet mit Red Hat Scale-Out Clustered Storage

Starnberg, 22. Jan. 2013 – Global Namespace Architektur des Red Hat Storage Filesystems bei CAC im High-Performance Computing Cluster im Einsatz...

Zum Hintergrund: Die begrenzte Skalierbarkeit traditioneller Fileserver, verbunden mit steigenden Kosten und Einschränkungen beim Management komplexer werdender NAS-Umgebungen (Technologie-Silos, keine lineare Performance-Steigerung) ist der Grund für die Entwicklung einer neuen Generation von File-basierten (clustered) Storagelösungen (siehe NetApp Clustered Data ONTAP, IBM GPFS/SONAS, EMC Isilon, DELL, HP usw.). Das nordamerikanische Cornell University Center for Advanced Computing (CAC) benötigte eine hoch skalierbare und robust verfügbare Storage-Lösung für seine Kunden (weltweite Forschungseinrichtungen), die datenintensive Researchprojekte im High Performance Computing (HPC-) Umfeld durchführen.

Anwenderprofil: Gegründet 1865 ist die Cornell University derzeit die größte Universität in der „Ivy League“ http://de.wikipedia.org/wiki/Ivy_League mit mehr als 20.000 Studenten aus rund 120 Ländern. Das „Cornell University Center for Advanced Computing (CAC)“ wurde im Jahr 2007 gegründet, um die Universität bei High-Performance-Computing-(HPC) Initiativen zu unterstützen bzw. datenintensive Forschung auch für die Regierung und Industrie zu ermöglichen. Als „Early Adopter“ neuer Technologien bietet das CAC Wissenschaftlern aus einer Vielzahl von Disziplinen heute die Möglichkeit, ihre Forschungen durch das vorhandene HPC-Umfeld zu beschleunigen.

CAC betreibt aktuell 15 Red Hat Enterprise Linux High-Performance-Computing-Cluster inklusive der Red Hat Storage (Software) Appliance. Anwenderzitat: "Mit Red Hat Storage konnten wir die Ausgaben für unsere aktuelle Infrastruktur mittels der „Low-Cost-Software-Lösung“ drastisch reduzieren...“, so James Vanee, IT Direktor des Instituts für Biotechnologie und Life Science Technologies, der Cornell Universität.

Lösungsprofil: Die Red Hat Storage Software Appliance erlaubt laut Anwender den Aufbau einer robusten Storage-Plattform, um die steigenden Anforderungen von Anwendungen wie DNA-Sequenzierung, Proteomik und Bildgebung – also meist extrem große Datenmengen – entsprechend skalierbar zu erfüllen.

Zu den Herausforderung: Vor dem Einsatz der Scale-out Storage Software konnten die Wissenschaftler nicht auf unstrukturierte Daten zugreifen bzw. wurden durch die Begrenzungen der Standard-Filesysteme (8 Terabyte bzw. 16 Terabyte pro Knoten) in ihrer Arbeit eingeschränkt. Da das Institut mehr als 20 Terabyte an Daten pro Monat produziert, wurde eine Lösung gesucht, die sowohl skalierbar als auch hochverfügbar arbeiten kann. Die Wissenschaftler wollten ferner keine Zugriffsbeschränkungen auf das Dateisystem, so dass ein globaler Namensraum notwendig wurde. Zitat: "Die Idee einer Scale-out Storage-Lösung war etwas, für das wir uns schon immer interessiert hatten, aber aufgrund der hohen Kosten nie umsetzen konnten“ so James Vanee.... „wir hatten andere Lösungen betrachtet, aber die hohen Kapitalkosten solcher Systeme waren für uns unerschwinglich".

Red Hat Storage für CAC High-Performance Computing Clusters:

Red Hat Storage (ehemals Gluster) ermöglicht es CAC nun, ihre bestehende Storage-Hardware-Infrastruktur weiter zu benutzen. Die Scale-Out-Architektur inkl. skalierbarem globalen Namensraum erlaubt es, sowohl hohe Performance und Verfügbarkeit sicherzustellen, als auch das Handling bis hin zu größten Datenmengen kosteneffizient zu realisieren. Laut CAC wurden die Installation der Red Hat Storage Software Appliance innerhalb weniger Tage abgeschlossen, und läuft nun seit ca. 12 Monaten einwandfrei in der Produktion. Heute nutzt das Institut die Lösung vor allem, um Daten aus der DNA-Sequenzierungs-Forschung zu speichern. Sie wird aber auch für die Archivierung von Kopien von Daten aus anderen Gruppen innerhalb der Abteilung verwendet.

  • Zur Hardware: Derzeit sind rund 158 Terabyte mit Dell R610 Rackserver über InfiniBand auf DataDirect Networks, DDN 9900 HPC Storage-Arrays gespeichert.

Zusammenfassung der Vorteile - Höhere Skalierbarkeit und Verfügbarkeit zu geringeren Kosten:

Mit Red Hat Storage Software Appliance ist das Cornell Institut für Biotechnologie und Life Sciences in der Lage, ihre bestehenden Speichersysteme weiter zu verwenden. Dies erlaubt es dem Institut, storageseitig kostengünstiger zu skalieren als über ein Hochleistungs-SAN. Zitat: "Kostenvermeidung war eines unserer Hauptziele bei der Suche nach einer neuen Storage-Lösung", sagte Vanee. Darüber hinaus können die Wissenschaftler jetzt ohne Dateisystem-Beschränkungen auf ihre Experimentaldaten und Forschungsergebnisse zugreifen.

Fazit: Mit der Red Hat Storage Software Appliance kann das Institut weiter wachsen, bei gleichzeitiger Erhöhung der Produktivität. "Eines meiner wichtigsten Ziele als IT-Leiter ist es, ein schnell reagierendes Umfeld auf Basis neuer Technologien zu schaffen", sagte Vanee. "Wenn unsere Abteilung eine halbe Million Dollar für einen neuen (DNA) Sequenzer ausgibt, will niemand warten, um die Daten zu speichern...“

Mehr zum Thema und Red Hat Storage finden Sie unter folgenden Weblinks:

http://www.cornell.edu/research

http://de.redhat.com/products/storage-server/

http://www.storageconsortium.de/content/?q=node/1441

http://www.storageconsortium.de/content/?q=downloads

Bildquelle: Red Hat Storage Server, 2012