CERN - Network Attached Storage (NAS) Infrastruktur

Starnberg, 8. Jan. 2013 – Hochverfügbare Database Services durch die Implementierung von Oracle Datenbanken auf NetApp Storagesystemen…

Zum Hintergrund: Das CERN verwaltet die unterstützende IT‐Infrastruktur für rund 2.500 Mitarbeiter plus globale Forschungsgemeinschaft, bestehend aus über 10.000 Wissenschaftlern-/Studenten von 608 Universitäten aus 113 Ländern. Zu den Verantwortlichkeiten des wissenschaftlich-/technischen Personals am CERN gehören die Konstruktion, die Installation und der Betrieb der Teilchenbeschleuniger sowie die Vorbereitung-/Durchführung von Experimenten und die Analyse und Interpretation der erfassten Daten. Anwenderzitat: „Unsere Anwender bringen die Systeme bis an ihre Grenzen“, sagt Frédéric Hemmer, Leiter der IT‐Abteilung am CERN… wir nehmen kontinuierlich Anpassungen der IT vor, bei Bedarf sogar jede Woche, um die Zusammenarbeit und Kommunikation zu erleichtern und um die wachsenden und immer schneller eintreffenden Mengen an Experimentdaten zu bewältigen.“ 

Mehr zum Thema "Storage und CERN" finden Sie als registrierter Benutzer dieser Seite übrigens auch in unserer Rubrik "Downloads". Im Rahmen unserer 9. Anwenderkonferenz im Mai 2011 bei DESY in Hamburg entstand das Vortragsdokument "A Data Deluge to Characterize Little Bangs at CERN", gehalten von P. Vande Vyvre – CERN/PH for the ALICE Collaboration für das Storage Consortium, das im folgenden Link zum PDF-Download zur Verfügung steht:

http://www.storageconsortium.de/content/?q=downloads

Die richtige Balance zwischen Performance, Skalierbarkeit, Zuverlässigkeit und Kosten ist also eine permanente Herausforderung, die ebenso wir der enorme Umfang der Forschungsarbeiten große Anforderungen im Hinblick auf das Management von Big Data nach sich zieht. Innerhalb des IT‐Teams ist die Abteilung Database Services auch für die zugehörige Storage‐Technologie verantwortlich (am CERN werden bereits seit 1982 Datenbanken und Tools von Oracle genutzt). Inzwischen kommen Oracle Technologien in der gesamten Organisation zum Einsatz und spielen nach CERN-Angaben eine wichtige Rolle bei den Beschleuniger-Kontrollsystemen, Engineering‐ und Verwaltungsapplikationen sowie LHC Experimenten. Sie bieten die erforderliche Funktionalität, einschließlich Hochverfügbarkeit, Skalierbarkeit und Performance, sowie umfangreiche Tools zur Datenverteilung-/Sicherung und Verwaltung.

Im Kontext des raschen Datenwachstums und der Leistungsanforderungen (Daten können z.B. mit bis zu 6.0 GB/sec eintreffen), musste eine flexible Speicherinfrastruktur aufgebaut werden, um die geschilderten Anforderungen hinreichend zu erfüllen (einfaches Management, Verfügbarkeit und Skalierbarkeit). Schon 2007 entschied man sich am CERN nach einer öffentlichen Ausschreibung für NetApp Technologien für die LHC Protokolldatenbank auf Basis Oracle Datenbank mit RAC‐Technologie (Real Application Clusters). Seitdem wurde am CERN die gesamte Oracle Infrastruktur auf Systemen von NetApp vereinheitlicht. Inzwischen werden 99 % aller Oracle Daten auf NetApp Lösungen gespeichert. Grancher bestätigt, dass die Abteilung Database Services durch die Implementierung von Oracle Datenbanken auf NetApp Systemen die Effizienz-Anforderungen bei gleichzeitig hoher Stabilität, Performance und Skalierbarkeit erfüllen kann. Folgende Funktionen wurden Anwenderseitig hervorgehoben:

  • 10 GbE bietet einen bekannten Wachstumspfad hin zu einer höheren Bandbreite sowie die Kosteneffizienz einer Technologie, die sich bereits allgemein durchgesetzt hat. Mit 10 GbE können zudem dieselben Switches und Netzwerkdienste genutzt werden, die auch in anderen Bereichen am CERN zum Einsatz kommen. Das heißt, die IT‐Abteilung am CERN kann ihre Kosten senken, indem die Verwaltungsaufgaben dem Netzwerkteam übertragen werden, das sich ohnehin bereits rund um die Uhr um das Management und den Support kümmert.
  • Oracle Direct NFS (dNFS) unterstützt verschiedene Pfade zum Storage. Diese Technologie erhöht die Skalierbarkeit und verdoppelt für gewöhnlich die Performance eines klassischen NFS (durch Umgehung des Betriebssystems des Servers). IT‐Abteilung am CERN muss sich nicht mehr um die korrekte Konfiguration des NFS sogen, da Oracle die NFS‐Anfragen direkt aus der Datenbank heraus generiert.
  • SATA plus NetApp Flash Cache ermöglicht eine Performance wie bei FC‐Laufwerken, jedoch zum niedrigeren Preis. Eine FC‐ Lösung wäre angesichts der Performance‐Anforderungen und Wachstumsraten am CERN nicht wirtschaftlich darstellbar.
  • NetApp FlexClone erlaubt die Erzeugung temporärer, beschreibbarer Kopien. Laut Ausschreibung wünschte man sich am CERN platzsparende Snapshots und beschreibbare Kopien großer Datenbanken, und zwar ohne Beeinträchtigung der Performance durch Replizierungsprozesse. Die maximal zulässige Beeinträchtigung für gegebene Workloads durch die Erzeugung einer spezifischen Anzahl an Snapshots war genau vorgegeben.
  • NetApp Data ONTAP 8 im Cluster-Mode ermöglicht eine kontinuierlich hohe Applikations‐Performance und Storage‐Effizienz durch Ergänzung von Storage‐Ressourcen und Datenverschiebungen ohne Unterbrechung des laufenden Betriebs. In der CERN Umgebung darf keine Applikation gestoppt werden, das heißt, die Infrastruktur muss die durchgängige Ver‐ fügbarkeit durch unterbrechungsfreie Upgrades und administrative Abläufe sicherstellen. Grancher sagt, der Cluster‐Mode harmoniere beson‐ ders gut mit Oracle via NFS und ermögliche die am CERN benötigte Flexibilität.

Anwenderzitat: "Dank NetApp können am CERN Daten ohne Duplizierung gesichert, Datensätze für verschiedene Zwecke ohne Kopieren bereitgestellt und Datenduplikate problemlos eliminiert werden. „Ohne NetApp SnapRestore bräuchten wir schon Wochen zur Wiederherstellung nur einer einzigen Oracle Database mit mehreren Terabyte“, so Grancher. „Mit NetApp ist jedoch auch die Größe der Datenbank irrelevant – wir können sowohl eine 1‐ als auch eine 10‐Terabyte‐Datenbank in Sekundenschnelle kopieren und in wenigen Minuten oder Stunden wiederherstellen. Früher dauerte die Wiederherstellung einer Oracle Database mit 100 TB ganze 28 Tage – jetzt benötigen wir nur noch 15 Minuten. Zusammen mit Oracle Real Application Testing ermöglicht uns SnapRestore zudem die schnelle Wiederholung eines Workloads zu Testzwecken….“

Nachfolgend der Link zum gesamten Anwenderbericht von NetApp/CERN:

http://www.netapp.com/de/system/pdf-reader.aspx?pdfuri=tcm:3-103426

http://public.web.cern.ch

Quelle: NetApp_CERN 2012