Przykładowa mapa drogowa budowania hurtowni danych
Opublikowany: 2018-03-30Hurtownia danych, technika konsolidacji wszystkich danych organizacyjnych w jednym miejscu, zapewniająca łatwiejszy dostęp i lepszą analitykę, to marzenie każdego interesariusza biznesowego. Jednak założenie hurtowni danych jest bardzo złożonym zadaniem i nawet przed podjęciem pierwszych kroków powinieneś być absolutnie pewien odpowiedzi na te dwa pytania:
- Cele Twojej organizacji
- Twój szczegółowy plan budowy hurtowni danych
Każde z tych pytań, jeśli pozostanie bez odpowiedzi, może na dłuższą metę sporo kosztować Twoją organizację. Jest to stosunkowo nowsza technologia i jeśli nie będziesz świadomy specyficznych potrzeb i wymagań swojej organizacji, stworzysz wiele możliwości dla błędów. Błędy te mogą sprawić, że Twój magazyn będzie bardzo niedokładny. Co gorsza, błędna hurtownia danych jest gorsza niż brak danych w ogóle, a nieplanowana strategia może wyrządzić ci więcej złego niż dobrego.
Ponieważ istnieją różne podejścia do tworzenia hurtowni danych, a każde z nich zależy od wielkości i potrzeb organizacji, nie jest możliwe stworzenie planu uniwersalnego dla wszystkich.
Powiedziawszy to, spróbujmy opracować przykładowy plan działania, który pomoże Ci opracować solidną i wydajną hurtownię danych dla Twojej organizacji:
Spis treści
Konfigurowanie hurtowni danych
Hurtownia danych jest niezwykle pomocna podczas organizowania dużych ilości danych w celu wydajnego pobierania i analizowania. Z tego samego powodu należy zachować szczególną ostrożność, aby zapewnić szybki dostęp do danych. Jednym z podejść do projektowania systemu jest zastosowanie modelowania wymiarowego – metody, która umożliwia wydajne i szybkie przeszukiwanie i badanie dużych ilości danych. Ponieważ większość danych znajdujących się w hurtowniach danych ma charakter historyczny i stabilny – w pewnym sensie nie zmienia się to często, nie ma potrzeby stosowania powtarzalnych metod tworzenia kopii zapasowych. Zamiast tego, po dodaniu jakichkolwiek danych, można wykonać kopię zapasową całej hurtowni jednocześnie – zamiast rutynowego tworzenia kopii zapasowych.
Narzędzia hurtowni danych można ogólnie podzielić na cztery kategorie:
- Narzędzia do ekstrakcji,
- Narzędzia do zarządzania tabelami,
- Narzędzia do zarządzania zapytaniami oraz
- Narzędzia integralności danych.
Każde z tych narzędzi jest niezwykle przydatne na różnych etapach rozwoju Hurtowni Danych. Badania z Twojej strony pomogą Ci lepiej zrozumieć te narzędzia i pozwolą Ci wybrać te, które odpowiadają Twoim potrzebom.
Kluczowe koncepcje hurtowni danych: przegląd
Teraz spójrzmy na przykładową mapę drogową, która pomoże Ci zbudować solidniejszy i bardziej wnikliwy magazyn dla Twojej organizacji:
Oceń swoje cele
Pierwszym krokiem w tworzeniu hurtowni danych Twojej organizacji jest ocena Twoich celów. Wspomnieliśmy o tym wcześniej, ale nie możemy tego wystarczająco podkreślić. Większość organizacji traci cenne spostrzeżenia tylko dlatego, że brakuje im jasnego obrazu celów, wymagań i celów firmy. Na przykład, jeśli jesteś firmą, która szuka swojego pierwszego znaczącego przełomu, możesz chcieć zaangażować swoich klientów w budowanie relacji – musisz więc zastosować inne podejście niż organizacja, która ma ugruntowaną pozycję i teraz chce korzystać z hurtowni danych w celu usprawnienia ich działania. Wdrożenie własnej hurtowni danych jest dużym krokiem dla każdej organizacji i powinno być wykonywane tylko po dołożeniu należytej staranności z Twojej strony.
Analizuj aktualne systemy technologiczne
Zadając swoim klientom i interesariuszom biznesowym wskazane pytania, możesz zebrać informacje na temat działania obecnego systemu technicznego, wyzwań, przed którymi stoi, oraz możliwych ulepszeń. Co więcej, mogą nawet dowiedzieć się, jak odpowiedni jest ich obecny stos technologii – w ten sposób skutecznie decydując, czy należy go zachować, czy wymienić. Różne działy Twojej organizacji mogą się do tego przyczynić, dostarczając raporty i informacje zwrotne.
Najczęstsze przykłady eksploracji danych
Modelowanie informacji
Model informacyjny to reprezentacja danych Twojej organizacji. Jest koncepcyjny i pozwala na sformułowanie pomysłów na to, jakie procesy biznesowe muszą być ze sobą powiązane i jak je połączyć. Hurtownia danych będzie ostatecznie zbiorem skorelowanych struktur, dlatego ważne jest, aby skonceptualizować wskaźniki, które muszą być ze sobą powiązane i stworzyć metody najwyższej wydajności – to jest tak zwane modelowanie informacji. Najprostszym sposobem zaprojektowania wydajnego modelu informacyjnego jest zebranie kluczowych wskaźników wydajności w tabelach faktów i powiązanie ich z różnymi wymiarami, takimi jak klienci, pracownicy, produkty i tym podobne.

Ucz się kursów nauki o danych z najlepszych światowych uniwersytetów. Zdobywaj programy Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.
Projektowanie magazynu i śledzenie danych
Po zebraniu wglądu w organizację i przygotowaniu wydajnego modelu informacji, nadszedł czas, aby przenieść dane do hurtowni i śledzić ich wydajność. W fazie projektowania istotne jest zaplanowanie sposobu łączenia wszystkich danych z różnych baz danych, aby informacje mogły być połączone, gdy ładujemy je do naszych tabel hurtowni danych. Narzędzia ETL mogą być czasochłonne i kosztowne, a ich pomyślne wdrożenie może wymagać ekspertów. Dlatego ważne jest, aby znać odpowiednie narzędzia we właściwym czasie – i wybrać najbardziej opłacalną dostępną opcję. Hurtownia danych zajmuje znaczną ilość miejsca do przechowywania, więc musisz zaplanować, jak archiwizować dane w miarę upływu czasu. Jednym ze sposobów, aby to zrobić, jest utrzymywanie systemu przechowywania danych o potrójnej granulacji (porozmawiamy o tym za chwilę). Jednak problem z granulacją polega na tym, że ziarno danych będzie się odraczać w czasie. Dlatego powinieneś zaprojektować swój system tak, aby różna ziarnistość była spójna z określoną strukturą danych.
Zrealizuj plan
Teraz, gdy już opracowałeś swój plan i połączyłeś ze sobą elementy danych, nadszedł czas na wdrożenie strategii. Wdrożenie hurtowni danych to wielki krok i istnieje realna podstawa do planowania projektu. Projekt powinien być podzielony na kawałki i należy go brać po kawałku. Zaleca się zdefiniowanie fazy zakończenia dla każdego fragmentu zadania i ostateczne zestawienie wszystkich bitów po zakończeniu. Dzięki takiemu systematycznemu i przemyślanemu wdrożeniu Twoja hurtownia danych będzie działać znacznie wydajniej i dostarczy bardzo potrzebnych informacji na etapie analizy danych.
Co to jest magazynowanie danych i eksploracja danych
Aktualizacje
Twoja hurtownia danych jest przygotowana na próbę czasu i szczegółowości. Musi pozostać spójny przez długi czas i na wielu poziomach szczegółowości. W fazie projektowania konfiguracji możesz wybrać różne plany pamięci masowej, które są powiązane z nie powtarzającą się aktualizacją. Na przykład kierownik działu IT może skonfigurować dzienne, tygodniowe lub miesięczne systemy przechowywania ziarna. W zbożu dziennym dane mogą być przechowywane w oryginalnym formacie, w którym zostały zebrane, mogą być przechowywane przez 2-3 lata, po czym należy je podsumować i przenieść do zboża tygodniowego. Teraz dane mogą pozostać w tygodniowej strukturze zbożowej przez kolejne 3-5 lat, po czym zostaną przeniesione do miesięcznej struktury zbożowej.
Postępowanie zgodnie z wyżej wymienioną mapą drogową zapewni, że jesteś na właściwym torze przed długim wyścigiem, który nadchodzi. Jeśli masz jakieś pytania, możesz je umieścić w komentarzach poniżej.
Co to jest hurtownia danych?
Hurtownia danych to rodzaj systemu zarządzania danymi, który ma na celu ułatwienie i wspomaganie działań związanych z analizą i analizą biznesową.
Hurtownie danych umożliwiają wykonywanie logicznych zapytań, tworzenie niezawodnych modeli prognozowania i wykrywanie ważnych trendów w Twojej firmie. v
Jak długo trwa budowa hurtowni danych?
Czas jest powszechnym problemem hurtowni danych i business intelligence na rynku. Chociaż liczby są dyskusyjne, trzymajmy się tradycyjnego zrozumienia, że hurtownia danych często potrzebuje dużo czasu, aby zobaczyć wyniki.
Czas poświęcony na skonfigurowanie analiz jest po prostu zbyt duży. Czas potrzebny na zbudowanie hurtowni danych może wynosić od 12 do 24 miesięcy. Jednak jest to całkowicie warte zachodu, ponieważ udane projekty hurtowni danych mogą całkowicie zmienić procesy i wizję organizacji. Mogą rzucić światło na problemy, utorować drogę do nowych perspektyw i pomóc pracownikom na wszystkich poziomach poprawić ich codzienne życie zawodowe.
Jakie są niektóre z najważniejszych cech hurtowni danych?
Niektóre z podstawowych elementów typowej Hurtowni Danych to:
1. Centralna baza danych: podstawą hurtowni danych jest baza danych. Były to konwencjonalne relacyjne bazy danych, z których można było korzystać lokalnie lub w chmurze. Jednak bazy danych in-memory szybko zyskują na popularności w wyniku Big Data, konieczności zapewnienia rzeczywistej szybkości w czasie rzeczywistym oraz znacznego spadku kosztów pamięci RAM.
2. Integracja danych: Różne technologie integracji danych, takie jak ETL (wyodrębnianie, przekształcanie, ładowanie), replikacja danych w czasie rzeczywistym, przetwarzanie zbiorcze, transformacja danych, jakość danych itp. są wykorzystywane do zbierania danych z systemów źródłowych i ich modyfikowania w taki sposób że jest gotowy do szybkiej analitycznej konsumpcji.
3. Metadane : wyszczególnia zestawy danych w źródle, użyciu, wartościach i innych cechach hurtowni danych. Istnieją metadane biznesowe, które nadają znaczenie Twoim danym, oraz metadane techniczne, które wyjaśniają, jak uzyskać dostęp do danych, na przykład gdzie są przechowywane i jak są zorganizowane.
4. Narzędzia dostępu do hurtowni danych: użytkownicy mogą wchodzić w interakcje z danymi w hurtowni danych za pomocą narzędzi dostępu, takich jak narzędzia do zapytań i raportowania, narzędzia do tworzenia aplikacji, narzędzia do eksploracji danych, narzędzia OLAP itp.