Haus aus Papier

Wer im Bereich Data Analytics, Datenmanagement und künstliche Intelligenz mitmischen will, muss an erster Stelle dafür sorgen, dass seine Daten konsolidiert werden. Das sorgt in vielen Unternehmen für eine Herausforderung.

Ein Data Warehouse (DWH), zu dt. „Datenlager“ oder auch „Datenplattform“ hilft Unternehmen dabei, Daten aus unterschiedlichen Quellen zu konsolidieren, zu verwalten und je nach Bedarf zu verarbeiten. Das bezeichnet man auch als „Single Source of Truth“, also eine Quelle, die alle notwendigen und aktuellen Informationen enthält.

Neu ist das Konzept nicht, bereits Mitte der 80er Jahre gab es bereits Entwicklungen, die beispielsweise unter dem Begriff „Information Warehouse“ ähnliche Bedürfnisse gedeckt haben.

Alles auf einen Blick mit unserer Infografik als PDF-Download. 

Laden Sie hier die Infografik herunter

Ein Data Warehouse hat folgende Eigenschaften:

Integriert – Daten, die aus unterschiedlichen Quellen und mit unterschiedlichen Strukturen zusammenkommen, werden in einer einheitlichen Form gespeichert.

Chronologisch – Auch historische Daten bzw. die Datenhistorie spielt eine Rolle im Data Warehouse, um beispielsweise in Reports verschiedene Zeitabschnitte miteinander zu vergleichen.

Beständig – Daten werden nicht temporär, sondern dauerhaft gespeichert.

Themenorientiert – Die Daten werden nach bestimmten Datenobjekten ausgewählt, die für die Auswertung relevant sind.

Wozu dient ein Data Warehouse?

  • Zusammenführung von Daten aus verschiedenen Quellen und verschiedener Datenarten und zwar so, dass diese zentral verfügbar und einsehbar sind.
  • Das Data Warehouse bietet dadurch eine ideale Grundlage, um beispielsweise Daten zu analysieren oder Data Mining zu betreiben.
  • Optimierung der Datenqualität durch eine Datenbereinigung und beispielsweise eine standardisierte Taxonomie aber auch Metadaten, um die Historie festzuhalten.
  • Strukturierung der Daten, so dass diese für den Anwender informativ und lesbar sind.
  • Performance-Steigerung für komplexe Anfragen, ohne dass operative Systeme beeinträchtigt werden.

(Quelle: Wikipedia)

Cloudbasierte Data Warehouses

Ein großer Vorteil moderner Data Warehouse-Angebote ist das Anbieten cloudbasierter Leistungen. Durch Cloud Computing, besonders als Service-Leistung, können Infrastrukturkosten gespart, Skalierungen ermöglicht und Preisstrukturen transparenter angeboten werden. Zusätzlich ist die Leistung unabhängig vom Nutzerstandort gleich, so dass insbesondere Unternehmen profitieren, die international agieren.

Herausforderungen

Bei der Auswahl des Data Warehouse spielt immer eine Rolle, welche Datenformate aktuell genutzt werden, da nicht jedes Warehouse alle Formate verarbeiten kann. Auch eine erfolgreiche Verknüpfung mit den Systemen ist notwendig. Gerade bei älteren Systemen sollte dies geprüft werden, um zu garantieren, dass der Dateninput auch gelingt.

Zusätzlich spielen gerade im europäischen Raum Datenschutzgrundlagen eine wichtige Rolle. Von der Datenverschlüsselung bis zur Anonymisierung gibt es diverse Faktoren, die für Unternehmen eine Rolle spielen (könnten), um ihre Daten auch nach den gegebenen Anforderungen zu speichern.


Erfahren Sie, wie Sie mit Snowflake ihr eigenes cloudbasiertes Data Warehouse einrichten können.

New call-to-action


Bei der Qualitätssicherung des Beitrags hat mich übrigens meine Kollegin Rosina Germanova mit ihrem Fachwissen unterstützt.

Rosina Germanova ProfilRosina Germanova ist Senior Consultant im Bereich Business Intelligence. Sie hat über fünf Jahre Berufserfahrung und verfügt über den nötigen Werkzeugkasten um Daten mit Leben zu befüllen und wertvolles Wissen zu erzeugen.

Kontaktieren können Sie Rosina Germanova via LinkedIn