IBM Big Data Hochleistungsrechner für US-Energieministerium geplant

Böblingen, Starnberg, 21. Nov. 2014 – Höhere Leistung mit OpenPOWER-Technologien von IBM, Mellanox und NVIDIA; neuer datenzentrischer Ansatz…

Zum Hintergrund: Big Data erfordert mittelfristig neue Architekturen zur Verarbeitung der immer größeren Datenmengen. Derzeit werden in Serversystemen die Daten ständig zwischen Speicher und Prozessor hin und her geleitet, um sie zu bearbeiten oder zu analysieren. Im Umfeld von Big Data ist dieser Ansatz laut IBM ungenügend, weil zu viel Zeit und Energie dafür aufgewendet werden muss. Um dem zu begegnen, wurden bislang immer schnellere Prozessoren eingesetzt, die allerdings aufgrund der Datenmengen immer weniger Kapazitäten zur Bearbeitung und Analyse zur Verfügung stellen konnten, da sie vielmehr mit dem Management und dem Transport der Daten zwischen den einzelnen Systemkomponenten beschäftigt waren. 

  • IBM Forscher haben in den letzten fünf Jahren eine neuartige, datenzentrische Systemarchitektur entwickelt, in der die notwendigen Komponenten eines Computersystems und damit Rechenleistung dort „angesiedelt“ sind, wo die Daten sitzen. Damit können laut Hersteller "Datenanalyse, Modellierung, Visualisierung und Simulation mit bisher unerreichter Geschwindigkeit durchgeführt werden."

Das US-amerikanische Energieministerium und IBM gaben hierzu nun den Abschluß eines Vertrages über 325 Millionen US-Dollar bekannt: Kernstück ist der Aufbau von zwei der weltweit fortschrittlichsten „datenzentrischen“ Supercomputer an den US-Forschungsstandorten Lawrence Livermore und Oak Ridge. Das IBM System nutzt eine neuartige Architektur, bei der die Systemtechnologien quasi um die Daten herum gebaut werden. Diese müssen seltener zwischen Speicher und Prozessoren hin und zurück transportiert werden, wodurch der Energieverbrauch des Gesamtsystems drastisch sinkt. Die Inbetriebnahme beider Rechner ist nach vorliegenden Angaben für 2017 beziehungsweise 2018 geplant. 

Leistungsumfang und Einsatzgebiete

Die beiden Forschungszentren des Energieministeriums erwarten, dass die beiden IBM Supercomputer zu den energieeffizientesten Computersystemen weltweit gehören werden. Im Vergleich zu den bestehenden Systemen der Labore soll ihre Performance bis zu zehn Mal höher bei 5 x verbesserter Energieeffizienz.

  • Die beiden auf OpenPOWER basierenden Installationen mit dem Namen „Sierra“ am Lawrence Livermore Institute und „Summit“ in Oak Ridge werden eine Leistung von jeweils mehr als 100 Petaflops erreichen und dabei fünf Petabyte an dynamischen und Flashspeichern nutzen. Der Datendurchsatz wird sich auf mehr als 17 Petabyte pro Sekunde summieren – dies entspricht etwa der Datenmenge von 100 Milliarden Bildern auf Facebook pro Sekunde. Durch den neuen Ansatz können die Installationen nicht mehr nur klassisch wissenschaftliche Daten modellieren und simulieren, sondern ihre Rechenleistung auch für hochkomplexe Datensätze beispielsweise aus dem Gesundheitswesen oder der Betriebs- und Finanzwirtschaft zur Verfügung stellen.

Offene Architekur mit Hilfe von OpenPOWER

Durch den Einsatz der OpenPOWER-Technologie in einem modular integrierten System werden beide Forschungszentren in der Lage sein, die Supercomputer entsprechend den spezifischen zukünftigen Anforderungen anzupassen.

NVIDIA hat in Zusammenarbeit mit IBM die so genannte NVIDIA NVLink Technologie entwickelt, die es CPUs und GPUs ermöglicht, die Daten fünf bis 12-Mal schneller zwischen den entsprechenden Prozessoren zu bewegen. NVIDIA NVLink werden in IBM POWER CPUs integriert werden und die nächste Generation der NVIDIA GPUs wird auf der NVIDIA Volta (TM) Architektur basieren - und so Sierra und Summit eine bisher nicht erreichte Leistungskapazität ermöglichen. Gemeinsam mit Mellanox wird IBM ausserdem einen so genannten intelligenten Interconnect implementieren, um die Datenverarbeitung innerhalb der Systeme weiter zu optimieren.

  • IBM bietet bereits datenzentrische Technologien für seine Kunden an: IBM POWER8, IBM Elastic Storage Server, IBM Elastic Storage Software basierend auf GPFS (General Parallel File System) - Technik sowie IBM Platform Computing Software.
  • IBM Research wird nach eigenen Angaben zukünftig mit Lawrence Livermore und Oak Ridge zusammenarbeiten, um Tools und Technologien für die beiden Computersysteme zu entwickeln.
  • An der Entwicklung von Applikationen für datenzentrische Systeme werden auch Wissenschaftler des deutschen IBM Forschungs- und Entwicklungszentrum in Böblingen sowie von IBM Research – Zürich in Rüschlikon beteiligt sein. 

Zitat: „Die heutige Ankündigung markiert eine Abkehr vom traditionellen Supercomputing, das mit der wachsenden Datenflut nur noch unzureichend Schritt halten kann. Der datenzentrische Ansatz von IBM ist aus unserer Sicht das neue Paradigma in diesem Bereich: Offene Computerplattformen, die in der Lage sind, mit den wachsenden Datenmengen umzugehen,“ sagt Tom Rosamilia, Senior Vice President, IBM Systems and Technology Group. „Was die beiden Systeme zudem besonders macht: Die Kerntechnologien sind bereits heute für Unternehmen und Organisationen unterschiedlichster Größen und aus unterschiedlichsten Industriezweigen verfügbar.“

Datacentric Design Infografik

Details zu IBM Technical Computing:

http://www.ibm.com/technicalcomputing