Optimierung im Apache Hadoop MapReduce-Framework

Ratingen, Starnberg, 25. Febr. 2013 - Syncsort erzielt mit seinem Beitrag deutliche Verbesserung bei der Integration großer Datenmengen mit Hadoop…

Zum Hintergrund: Syncsort, Anbieter von Software zur Datenintegration, stellt eine neue Funktion zur Verbesserung der Integration großer Datenmengen und des ETL von Apache Hadoop vor; die neue Funktion wird in Apache Hadoop 2.0.3-alpha eingebundenDie entscheidende Verbesserung ist die Option, externe Sortierverfahren im Hadoop-MapReduce-Framework zu implementieren. Hierdurch lässt sich die Entwicklung beschleunigen, komplexe ETL-Prozesse und MapReduce-Jobs ohne Programmierung erstellen und Hadoop selbst optimieren. Der Patch vereinfacht Anwendungsfälle, die derzeit in MapReduce äußerst anspruchsvoll sind, so dass sie effizienter implementiert werden können. Die zusätzliche Flexibilität durch die neue Funktion wird die Hadoop-Umgebung erweitern und es derzeitigen Hadoop-Benutzern ermöglichen, ein breiteres Spektrum von Anwendungsfällen für die Analyse großer Datenmengen zu bewältigen. Ferner stellt Syncsort im Frühjahr eine Plug-In-Version seiner Lösung für die Hochleistungssortierung DMExpress bereit

http://hadoop.apache.org/docs/current

http://www.syncsort.com/Solutions/HadoopOptimization.aspx

Die Version befindet sich bereits bei ausgewählten Kunden im Betatest. Zitat: "Hadoop ist eine sich schnell weiterentwickelnde Umgebung, die sich zum kommenden Betriebssystem für die Verarbeitung großer Datenmengen entwickelt", so Josh Rogers, Senior Vice President des Bereichs Datenintegration bei Syncsort. "Wir konzentrieren uns auf den Ausbau der Datenintegrations- und ETL-Funktionen von Hadoop. Damit möchten wir Hindernisse beseitigen, die sein Potenzial einschränken und Unternehmen bei der Erweiterung ihrer Big-Data-Projekte unterstützen." Syncsort hat nach vorliegenden Angaben gemeinsam mit der Entwicklergemeinschaft von Apache Hadoop Verbesserungen und Problemlösungen erarbeitet und wird diese Zusammenarbeit in zukünftigen Projekten fortsetzen. Mehr Information zum Themenkreis finden sich hier:

http://blog.syncsort.com/

Anwenderberichte zur Datenintegration mit Syncsort finden sich unter:

http://www.syncsort.de/Anwenderberichte/Datenintegration.aspx