Eine Beispiel-Roadmap für den Aufbau Ihres Data Warehouse
Veröffentlicht: 2018-03-30Data Warehousing, eine Technik zur Konsolidierung all Ihrer Unternehmensdaten an einem Ort für einfacheren Zugriff und bessere Analysen, ist der Traum aller Geschäftsbeteiligten. Der Aufbau eines Data Warehouse ist jedoch eine sehr komplexe Aufgabe, und schon vor den ersten Schritten sollten Sie sich der Antwort auf diese beiden Fragen absolut sicher sein:
- Die Ziele Ihrer Organisation
- Ihre detaillierte Roadmap zum Aufbau eines Data Warehouse
Jede dieser Fragen kann, wenn sie unbeantwortet bleibt, Ihr Unternehmen auf lange Sicht viel kosten. Es handelt sich um eine relativ neue Technologie, und Sie werden viel Spielraum für Fehler schaffen, wenn Sie die spezifischen Bedürfnisse und Anforderungen Ihres Unternehmens nicht kennen. Diese Fehler können Ihr Lager sehr ungenau machen. Noch schlimmer ist, dass ein fehlerhaftes Data Warehouse schlimmer ist, als überhaupt keine Daten zu haben, und eine ungeplante Strategie kann Ihnen am Ende mehr schaden als nützen.
Da es verschiedene Ansätze für die Entwicklung von Data Warehouses gibt und jeder von der Größe und den Anforderungen der Organisationen abhängt, ist es nicht möglich, einen einheitlichen Plan zu erstellen.
Lassen Sie uns dennoch versuchen, eine Beispiel-Roadmap zu erstellen, die Ihnen dabei helfen wird, ein robustes und effizientes Data Warehouse für Ihr Unternehmen zu entwickeln:
Inhaltsverzeichnis
Aufbau eines Datawarehouse
Data Warehouse ist äußerst hilfreich bei der Organisation großer Datenmengen, um sie effizient abzurufen und zu analysieren. Aus dem gleichen Grund sollte äußerste Sorgfalt darauf verwendet werden, sicherzustellen, dass die Daten schnell zugänglich sind. Ein Ansatz zur Gestaltung des Systems ist die dimensionale Modellierung – eine Methode, mit der große Datenmengen effizient und schnell abgefragt und untersucht werden können. Da die meisten in Data Warehouses vorhandenen Daten historisch und stabil sind – sie ändern sich gewissermaßen nicht häufig, besteht kaum eine Notwendigkeit, sich wiederholende Backup-Methoden anzuwenden. Stattdessen kann nach dem Hinzufügen von Daten das gesamte Warehouse auf einmal gesichert werden – anstatt routinemäßig zu sichern.
Data-Warehousing-Tools lassen sich grob in vier Kategorien einteilen:
- Extraktionswerkzeuge,
- Tabellenverwaltungstools,
- Abfrageverwaltungstools und
- Tools zur Datenintegrität.
Jedes dieser Tools ist in verschiedenen Stadien der Entwicklung des Data Warehouse äußerst nützlich. Die Recherche Ihrerseits hilft Ihnen dabei, mehr über diese Tools zu erfahren, und ermöglicht es Ihnen, diejenigen auszuwählen, die Ihren Anforderungen entsprechen.
Schlüsselkonzepte von Data Warehousing: Ein Überblick
Sehen wir uns nun eine Beispiel-Roadmap an, die Ihnen dabei helfen wird, ein robusteres und aufschlussreicheres Warenlager für Ihr Unternehmen aufzubauen:
Bewerten Sie Ihre Ziele
Der erste Schritt beim Einrichten des Data Warehouse Ihrer Organisation besteht darin, Ihre Ziele zu bewerten. Wir haben das bereits erwähnt, aber wir können es nicht genug betonen. Die meisten Organisationen verlieren wertvolle Einblicke, nur weil sie kein klares Bild von den Zielen, Anforderungen und Zielen ihres Unternehmens haben. Wenn Sie beispielsweise ein Unternehmen sind, das nach Ihrem ersten bedeutenden Durchbruch sucht, möchten Sie möglicherweise Ihre Kunden zum Aufbau von Beziehungen einbeziehen. Sie müssen also einen anderen Ansatz verfolgen als eine Organisation, die gut etabliert ist und jetzt die nutzen möchte Data Warehouse zur Verbesserung ihrer Abläufe. Ein Data Warehouse ins Haus zu bringen ist ein großer Schritt für jedes Unternehmen und sollte nur nach einiger Sorgfalt Ihrerseits durchgeführt werden.
Analysieren Sie aktuelle technologische Systeme
Indem Sie Ihren Kunden und Geschäftsbeteiligten gezielte Fragen stellen, können Sie Einblicke in die Leistung Ihres aktuellen technischen Systems, die Herausforderungen, mit denen es konfrontiert ist, und die möglichen Verbesserungen gewinnen. Darüber hinaus können sie sogar herausfinden, wie geeignet ihr aktueller Technologie-Stack ist – und so effizient entscheiden, ob er beibehalten oder ersetzt werden soll. Verschiedene Abteilungen Ihrer Organisation können dazu beitragen, indem sie Berichte und Feedback bereitstellen.
Die häufigsten Beispiele für Data Mining
Informationsmodellierung
Ein Informationsmodell ist eine Darstellung der Daten Ihrer Organisation. Es ist konzeptionell und ermöglicht es Ihnen, sich eine Vorstellung davon zu machen, welche Geschäftsprozesse miteinander verknüpft werden müssen und wie sie verknüpft werden können. Das Data Warehouse wird letztlich eine Sammlung korrelierender Strukturen sein, daher ist es wichtig, die Indikatoren zu konzeptualisieren, die miteinander verbunden werden müssen, und leistungsstarke Methoden zu erstellen – das ist die sogenannte Informationsmodellierung. Der einfachste Weg, ein effizientes Informationsmodell zu entwerfen, besteht darin, wichtige Leistungsindikatoren in Faktentabellen zu sammeln und sie mit verschiedenen Dimensionen wie Kunden, Mitarbeitern, Produkten usw. in Beziehung zu setzen.

Lernen Sie Datenwissenschaftskurse von den besten Universitäten der Welt. Verdienen Sie Executive PG-Programme, Advanced Certificate-Programme oder Master-Programme, um Ihre Karriere zu beschleunigen.
Gestaltung des Lagers und Verfolgung der Daten
Nachdem Sie Einblicke in Ihr Unternehmen gewonnen und ein effizientes Informationsmodell erstellt haben, ist es jetzt an der Zeit, Ihre Daten in das Warehouse zu verschieben und deren Leistung zu verfolgen. Während der Entwurfsphase ist es wichtig zu planen, wie alle Daten aus verschiedenen Datenbanken verknüpft werden, damit die Informationen beim Laden in unsere Data-Warehouse-Tabellen miteinander verbunden werden können. Die ETL-Tools können sehr zeit- und kostenintensiv sein und erfordern möglicherweise Experten für eine erfolgreiche Implementierung. Daher ist es wichtig, die richtigen Tools zur richtigen Zeit zu kennen – und die kostengünstigste Option auszuwählen, die Ihnen zur Verfügung steht. Ein Data Warehouse verbraucht viel Speicherplatz, daher müssen Sie planen, wie Sie die Daten im Laufe der Zeit archivieren. Eine Möglichkeit, dies zu tun, besteht darin, ein Datenspeichersystem mit dreifacher Granularität beizubehalten (darüber werden wir später noch mehr sprechen). Das Problem mit der Granularität besteht jedoch darin, dass sich die Datenkörnung über einen bestimmten Zeitraum verzögert. Sie sollten Ihr System also so gestalten, dass die unterschiedliche Granularität mit einer bestimmten Datenstruktur konsistent ist.
Setzen Sie den Plan um
Nachdem Sie Ihren Plan entwickelt und die Daten miteinander verknüpft haben, ist es an der Zeit, Ihre Strategie umzusetzen. Die Implementierung von Data Warehouse ist ein großer Schritt, und es gibt eine tragfähige Grundlage für die Planung des Projekts. Das Projekt sollte in Stücke zerlegt und Stück für Stück angegangen werden. Es wird empfohlen, für jeden Chunk der Aufgabe eine Abschlussphase zu definieren und nach Abschluss alle Bits zusammenzufassen. Mit einer solch systematischen und durchdachten Implementierung wird Ihr Data Warehouse viel effizienter arbeiten und die dringend benötigten Informationen liefern, die während der Datenanalysephase benötigt werden.
Das Was ist was von Data Warehousing und Data Mining
Aktualisierung
Ihr Data Warehouse ist darauf ausgelegt, die Tests der Zeit und der Granularität zu bestehen. Es muss über lange Zeiträume und auf vielen Granularitätsebenen konsistent bleiben. In der Designphase des Setups können Sie sich für verschiedene Speicherpläne entscheiden, die in das sich nicht wiederholende Update eingebunden sind. Beispielsweise kann ein IT-Manager ein tägliches, wöchentliches oder monatliches Getreidespeichersystem einrichten. Im Tageskorn können die Daten im Originalformat, in dem sie erhoben wurden, 2-3 Jahre aufbewahrt werden, danach müssen sie zusammengefasst und in das Wochenkorn verschoben werden. Jetzt können die Daten für die nächsten 3-5 Jahre in der wöchentlichen Granstruktur verbleiben, danach werden sie in die monatliche Granstruktur verschoben.
Das Befolgen der oben genannten Roadmap stellt sicher, dass Sie für das bevorstehende lange Rennen auf dem richtigen Weg sind. Wenn Sie Fragen haben, können Sie diese gerne in den Kommentaren unten hinterlassen.
Was ist ein Data Warehouse?
Ein Data Warehouse ist eine Art Datenverwaltungssystem, das entwickelt wurde, um Business Intelligence- und Analyseaktivitäten zu erleichtern und zu unterstützen.
Mit Data Warehouses können Sie logische Abfragen ausführen, zuverlässige Prognosemodelle erstellen und wichtige Trends in Ihrem Unternehmen erkennen. v
Wie lange dauert der Aufbau eines Data Warehouse?
Zeit ist ein häufiges Ärgernis in Bezug auf Data Warehousing und Business Intelligence auf dem Markt. Auch wenn die Zahlen umstritten sind, bleiben wir beim traditionellen Verständnis, dass Data Warehousing oft lange braucht, um Ergebnisse zu sehen.
Der Zeitaufwand für die Einrichtung von Analytics ist einfach zu groß. Der Zeitaufwand für den Aufbau eines Data Warehouse kann zwischen 12 und 24 Monaten betragen. Aber es lohnt sich auf jeden Fall, da erfolgreiche Data-Warehouse-Projekte die Prozesse und Visionen eines Unternehmens vollständig verändern können. Sie haben die Fähigkeit, Probleme zu beleuchten, den Weg zu neuen Perspektiven zu ebnen und Mitarbeitern auf allen Ebenen zu helfen, ihr tägliches Arbeitsleben zu verbessern.
Was sind einige der wichtigsten Funktionen eines Data Warehouse?
Einige der grundlegenden Komponenten eines typischen Data Warehouse sind:
1. Zentrale Datenbank: Der Eckpfeiler Ihres Data Warehouse ist eine Datenbank. Dies waren herkömmliche relationale Datenbanken, die vor Ort oder in der Cloud verwendet werden konnten. In-Memory-Datenbanken gewinnen jedoch aufgrund von Big Data, der Notwendigkeit echter Echtzeitgeschwindigkeit und einem erheblichen Rückgang der RAM-Kosten schnell an Popularität.
2. Datenintegration: Verschiedene Datenintegrationstechnologien wie ETL (Extract, Transform, Load), Echtzeit-Datenreplikation, Bulk-Load-Verarbeitung, Datentransformation, Datenqualität usw. werden verwendet, um Daten aus Quellsystemen zu sammeln und so zu modifizieren dass es für den schnellen analytischen Verbrauch bereit ist.
3. Metadaten: Sie beschreiben die Datensätze in Ihrem Data Warehouse mit Quelle, Verwendung, Werten und anderen Merkmalen. Es gibt geschäftliche Metadaten, die Ihren Daten Bedeutung verleihen, und technische Metadaten, die erklären, wie Sie auf Daten zugreifen, z. B. wo sie gespeichert und wie sie organisiert sind.
4. Data Warehouse-Zugriffstools: Benutzer können mit Daten in Ihrem Data Warehouse interagieren, indem sie Zugriffstools wie Abfrage- und Berichtstools, Anwendungsentwicklungstools, Data-Mining-Tools, OLAP-Tools usw. verwenden.