Die neue Realitt: Erweiterung des Data Warehouse um Hadoop, NoSQL & Co

von Stefan Mller (it-novum GmbH)

Etwas angestaubt und in die Jahre gekommen wirkt das Konzept des Data Warehouse in Zeiten von Big Data, MapReduce und NoSQL. Dabei besitzt eine standardisierte und zentrale Datenbasis grere Aktualitt als zu den Anfangszeiten des Data Warehouse-Ansatzes: Fr viele Unternehmen sind Daten ein wertvoller Rohstoff, um Entscheidungsprozesse zu untersttzen und Wettbewerbsvorteile zu erzielen.

Der klassische Ansatz des Data Warehouse stt in Zeiten explodierender Datenmengen und -heterogenitt an seine Grenzen. Zudem machen moderne Technologien wie Hadoop, NoSQL und analytische Datenbanken den effektiven und effizienten Umgang mit extrem groen Datenmengen mglich. Das Data Warehouse ist damit aber nicht berflssig geworden. Nach wie vor liegt der Fokus darauf, entscheidungsrelevante Informationen zu identifizieren und zu verteilen. Neben den neuen Data Scientists existieren nach wie vor die unterschiedlichen Berichtsempfnger und Analysten mit Zugriff auf die klassischen BI-Tools. Big Data-Technologien helfen, das Data Warehouse sinnvoll zu erweitern, so dass die Datenmengen kostengnstig gespeichert und schnell vorverarbeitet werden knnen. Data Blending heit die Antwort, um alle neuen Quellen sinnvoll miteinander zu kombinieren und die Vorteile ganzheitlich nutzen zu knnen.

Über den Autor Stefan Mller:

Nach mehreren Jahren Ttigkeit im Bereich Governance & Controlling und Sourcing Management leitet Stefan Mller den Bereich Business Intelligence beim Open Source- und SAP-Dienstleister it-novum. Stefans Herz schlgt fr die Mglichkeiten, die Open Source-Lsungen wie Pentaho, Hadoop, Infobright etc. bieten und ihre Integration in die SAP-Welt. Seine Begeisterung fr Business Open Source fr Datenanalyse und -aufbereitung gibt Stefan regelmig in Fachartikeln, Statements und Vortrgen weiter.