Aus Datenbergen entscheidungsrelevantes Wissen gewinnen

 

 

Die richtigen Informationen zur richtigen Zeit am richtigen Ort bereitzustellen: Dies ist einer der Schlüsselfaktoren für den Unternehmenserfolg. Dell bietet zur Bewältigung der Datenflut zwei Lösungen: Erstens eine zertifizierte Hadoop-Referenzarchitektur auf Basis von Intel-basierten Dell-PowerEdge-Servern, um sehr große Datenmengen für Business-Entscheidungen aufzubereiten, und zweitens die Dell-Fluid-Data-Architektur zur effizienten Speicherung und Verwaltung von Informationen.

Autoren: Hans Schramm */Michael Holzerland*
 





Ähnlich wie im 19. Jahrhundert scheint heute wieder ein neuer Goldrausch ausgebrochen zu sein. Allerdings werden keine Flusslandschaften umgepflügt, sondern es wird in digitalen Datenbergen geforscht. Marktforscher IDC schätzt, „... dass sich die Datenmengen, die innerhalb eines Jahres erstellt, vervielfältigt und konsumiert werden, bis 2020 alle zwei Jahre verdoppeln.“ Es werde aber nur ein halbes Prozent der weltweiten Datenbestände analysiert, der Rest lediglich archiviert und vieles bald wieder gelöscht, so IDC.

Die Erkenntnis, dass Daten ein wichtiger Produktionsfaktor sind, ist so neu nicht. Neu sind aber die Dimensionen und die riesigen Möglichkeiten, die sich daraus für eine dauerhaft höhere Agilität und eine gesteigerte Wettbewerbsfähigkeit der Unternehmen ergeben.
 

Die Herausforderung bei der Datenflut ist weit größer als das reine Datenvolumen. Die Menge ist nur ein Aspekt, ein zweiter ist die enorme Vielfalt an strukturierten, semi- und unstrukturierten Daten (Bilder, Blogs, Chats, Dokumente, Videos, etc.). Der dritte Aspekt schließlich betrifft die schnelle Entstehung und Veränderung dieser Daten. Entscheidungsrelevante Erkenntnisse aus der Datenflut zu gewinnen, ist einer der Kernfaktoren, um einen Vorsprung gegenüber dem Wettbewerber zu haben oder schneller auf unvorhergesehene Business-Ereignisse reagieren zu können. Zur Beschreibung dieser drei Dimensionen hat sich der Begriff Big Data eingebürgert.

Gemeinsam mit Partnern hat Dell Lösungspakete geschnürt, um riesige Datenberge effizienter erfassen, verarbeiten, analysieren und aufbereiten zu können. Bald unterstützt Dell auch die neue Intel® Distribution for Apache Hadoop Software (Intel® Distribution). Zum Einsatz kommt Hadoop etwa auf dem Dell-PowerEdge-Server R720XD (ein 2-HE-Rack-Server mit zwei Sockeln und Intel® Xeon® E5-2600 Prozessoren), dem C6220 (bis zu vier unabhängige, Hot-Swap-fähige 2-Sockel-Serverknoten in einem 2-HE-Gehäuse mit Intel® Xeon® E5-2600-Prozessoren) und oder dem C8000.

 




Riesige Datenmengen zu erfassen, sie zu verarbeiten und für Business-Entscheidungen aufzubereiten ist einer der Schwerpunkte von Big Data. Liegt der Fokus auf der effizienten Speicherung großer Datenvolumina ist ein intelligentes Storagemanagement gefragt. Dell bietet mit seinem Storage-Konzept Fluid Data dafür einen umfassenden Ansatz, der aus drei Eckpfeilern besteht: Der erste ist das automatische, dynamische Tiering. Dabei werden Daten ihrer Relevanz für aktuelle Geschäftsprozesse entsprechend an der effektivsten Stelle in einem Storagesystem gespeichert. Ein zweiter Eckpfeiler ist die effiziente Speicherauslastung mit Thin Provisioning und der dritte Eckpfeile eine hohe Skalierbarkeit.

Fazit: Unternehmen verschaffen sich durch zwei zentrale Lösungswege die notwendigen Freiräume für Innovationen und Aktivitäten, die einen entscheidenden Wettbewerbsvorteil bringen: Erstens, indem sie riesige Datenmengen mit Hadoop verarbeiten und für Business-Entscheidungen aufbereiten. Und zweitens, indem sie ein automatisiertes intelligentes Datenmanagement implementieren, wie es die Fluid-Data-Lösungen von Dell bieten. Abhängig davon, wo der Schwerpunkt jeweils liegt, sind Unternehmen damit bestens für Big Data gerüstet.

 


 

*Hans Schramm ist Field Product Manager Enterprise bei Dell in Frankfurt am Main.
*Michael Holzerland ist System Engineer Datacenter and Cloud bei Dell in Frankfurt am Main.

 

 
Intel, das Intel logo, Intel Inside, das Intel Inside Logo, Intel Centrino, das Intel Centrino Logo, Celeron, Intel XScale, Intel Xeon, Intel SpeedStep, Itanium, und Pentium sind Marken der Intel Corporation oder ihrer Tochtergesellschaften in den USA oder anderen Ländern. Andere Marken oder Produktnamen sind Eigentum der jeweiligen Inhaber