Echtzeit-Einblicke in die Datenhaltung von Unternehmen zeigt Prioritäten auf

München, Starnberg, 17. Febr. 2016 – Veritas-Analyse zeigt, dass 41 Prozent der Daten veraltet sind; neues Daten-Genom-Projekt gestartet, um Datentrends zu untersuchen…

Zum Hintergrund: Der erste sog. "Data Genomics" - Index von Veritas Technologies liefert eine Darstellung, wie sich Unternehmensdaten weltweit zusammensetzen (*). Die Echtzeit-Einblicke zeigen, dass über 40 Prozent der Dateien (files) in den letzten drei Jahren nicht verwendet wurden – eine Erkenntnis auf deren Basis Unternehmen in größerem Umfang Kosten reduzieren könnten. Mit dem Datengenom-Index macht Veritas nach eigenen Angaben den ersten Schritt, um Datenumgebungen in Unternehmen zu indexieren und die gespeicherte Anzahl an Daten messbar zu machen. Daher kann er auch für nachfolgende Studien als Vergleichsmaßstab dienen; Organisationen können auf Basis dieser Informationen dann intelligente Maßnahmen und ggf. Korrekturen einführen. Hier die wichtigsten Erkenntnisse der Studie:

Entwickler dominieren

Der Index zeigt, dass Bilder, Entwicklerdateien und komprimierte File-Daten knapp ein Drittel der gesamten Umgebung ausmachen. Gemessen an der reinen Zahl der Dateien machen Entwicklerdateien 20 Prozent der Gesamtmenge aus. In den letzten zehn Jahren hat sich der Anteil von Präsentationen im Vergleich zu anderen Dateitypen hingegen um 500 Prozent reduziert. Der Trend zeigt deutlich, dass die Dominanz von PowerPoint vorbei ist.

Im Herbst werden am meistern Daten erzeugt

Der Herbst dominiert im Hinblick auf die Erstellung von Dateien: Es werden 91 Prozent mehr Textdateien, 48 Prozent mehr Tabellenkalkulationen und 89 Prozent mehr Systemdateien für Speicherorte und Informationen produziert. Anscheinend nehmen wir die meisten Videos im Sommer und Herbst auf und speichern diese dann auf Unternehmensspeicher: Die Zahl der Videos steigt in diesen Jahreszeiten um 68 Prozent.

41 Prozent der Datenumgebung werden nicht angerührt

Mit der Ausnahme von regulatorischen oder Compliance-Anforderung sind drei Jahre normalerweise der Zeitraum, nach dem potenziell relevante Dateien nicht mehr aktuell sind. Der Report zeigt, dass 41 Prozent der Daten einer durchschnittlichen Umgebung in den letzten drei Jahren nicht verändert wurden und damit „abgelaufen“ sind.

Verwaiste Daten werden zur Bürde

Verwaiste Daten haben keinen aktuellen „Eigentümer“. Dieser hat entweder seine Rolle im Unternehmen gewechselt oder hat es verlassen. Unternehmen verlieren diese Daten oftmals aus dem Sinn, sie kosten aber viel Geld. Der Index zeigt, dass verwaiste Daten oft Videos, Bilder und Präsentationen sind – reichhaltige Inhalte, die eigentlich nicht unbeachtet bleiben sollten. Sie nehmen zudem einen hohen Anteil an Speicherplatz ein - und zwar über 200 Prozent mehr, bezogen auf die gezählte Anzahl der gesamten Dateien.

Effekte auf die Speicherkosten

Mit ähnlichen Einsichten in ihre Daten können Organisationen Bereiche priorisieren und finanzielle Vorteile erzielen. Traditionelle Office Formate wie Präsentationen, Tabellenkalkulationen und Dokumente nehmen aufgrund ihres Alters mehr Platz ein, als sie eigentlich benötigen. Dies führt zu hohen Kosten. Visuelle Formate wie Videos und Bilder belasten die Unternehmen ebenfalls sehr. Der Fokus sollte darauf liegen, Daten entsprechend zu archivieren, zu löschen und zu migrieren. Der durchschnittliche Speicherbedarf in Unternehmen liegt bei zehn Petabytes. Ein Archivierungsprojekt, das sich ausschließlich auf veraltete Daten bezieht, kann daher zu Einsparungen von jährlich bis zu zwei Millionen US-Dollar sorgen (1).

„Von unseren Kunden hören wir, dass sie mit zwei unterschiedlichen Naturgewalten konfrontiert werden: dem exponentiellen Datenwachstum sowie begrenzten Ressourcen und Budgets, um der Datenflut mit neuen Servern oder Anwendungen Herr zu werden“, erklärt Steve Vranyes, CTO bei Veritas.


(*) Der Data Genomics Index ist laut Veritas die erste Studie, die einen Vergleichsindex mit präzisen Details von echten Datenumgebungen erstellt – von der Dateizusammensetzung über das durchschnittliche Alter bis hin zu den Größenverhältnissen der einzelnen Dateien. Veritas möchte dazu auch eine Community und ein Forum bzw. mit dem Data Genomics Projekt die erste Forschungsinitiative ihrer Art ins Leben rufen. Unternehmen sollen dadurch die Art ihrer Daten besser verstehen. Der Data Genomics Index ist der erste Beitrag dazu. Das Projekt soll Datenwissenschaftler, Industrieexperten und Meinungsführer zusammenbringen, um das sog. "Information Management-Genom" zu entschlüsseln. Teilnehmer teilen ihre Forschungsarbeiten und diskutieren weltweit mit Unternehmen, die Schwierigkeiten haben, die zunehmenden Herausforderungen beim Datenwachstum zu lösen. Veritas ist Gründungsmitglied und wirkt an dem Projekt mit, es ist aber kommerziell vom Geschäft des Unternehmens getrennt.

(1) Cappuccio, David J. Use a TCO Model to Estimate the Costs of Your Data Center. Gartner, 26. Juni 2012. Online.


Abb. 1: Bildquelle Veritas, Auszug aus dem aktuellen Data Genomics Index, 2016