Kluczowe koncepcje hurtowni danych: przegląd
Opublikowany: 2018-03-20W ciągu ostatnich kilku dekad nastąpiła rewolucja w zakresie technologii opartych na chmurze. Technologie te umożliwiają organizacjom bezproblemowe przechowywanie i pobieranie danych o klientach, produktach i pracownikach. Dane te można następnie wykorzystać do zebrania praktycznych spostrzeżeń i przeniesienia organizacji na wyższe poziomy.
Podczas gdy Big Data i Analytics zajmują się działaniami wykonywanymi na danych PO ich pobraniu, koncepcja hurtowni danych koncentruje się na sposobie przechowywania danych w chmurze. Wiele globalnych organizacji przyjęło koncepcję hurtowni danych, aby uporządkować swoje dane, które są przesyłane strumieniowo z centrów operacyjnych i oddziałów korporacyjnych na całym świecie.
Pojęcie hurtowni danych było nieobecne do czasu boomu Big Data. Wcześniej wszystkie organizacje korzystały z OLTP (operacyjnych baz danych), które nadają się do zarządzania, śledzenia i analizowania codziennych czynności, ale żałośnie zawodzą, jeśli chodzi o radzenie sobie z historycznymi zestawami danych, które mogą obejmować terabajty. System OLTP jest jedynie modelem relacyjnej bazy danych, który działa na zasadzie relacji encji. Chociaż nadal są używane, OLTP powoli zanikają z powodu kolosalnych ilości danych w dzisiejszych organizacjach.
Wpisz: Hurtownia danych!
Spis treści
Co to jest hurtownia danych?
Koncepcja hurtowni danych umożliwia organizacjom gromadzenie, przechowywanie i dostarczanie danych wspierających podejmowanie decyzji. Pojęcie hurtowni danych jest szerokie, a hurtownia danych jest jednym z artefaktów powstających w procesie magazynowania.
Termin „Hurtownia Danych” został ukuty przez Williama (Billa) H. Inmona w 1990 roku. Według Inmona, hurtownia danych jest jedynie zorientowanym podmiotowo, zintegrowanym, zmiennym w czasie i nieulotnym zbiorem danych wspierających decyzje kierownictwa -robić postęp.
Kim jest analityk danych, analityk danych i inżynier danych?
OLTP, o którym mówiliśmy wcześniej, podlega częstym zmianom (prawie codziennie). Do tego stopnia, że dyrektor biznesowy nie jest w stanie przeanalizować wcześniejszych opinii o produktach lub skarg z powodu braku danych historycznych.
Hurtownia danych natomiast dostarcza skonsolidowane dane w widoku wielowymiarowym. Zapewnia również narzędzia OLAP (Online Analytical Processing) – które są niezwykle pomocne, gdy przejdziesz do analizy przechowywanych danych. Hurtownia danych, w przeciwieństwie do OLTP, obsługuje również operacje, takie jak eksploracja danych, klasyfikacja, klastrowanie i analiza predykcyjna. Z tych wszystkich powodów i nie tylko, koncepcja hurtowni danych stała się integralną częścią każdej organizacji.
Czym nie jest hurtownia danych?
Ludzie stosunkowo nowi w koncepcji hurtowni danych często mylą „hurtownię danych” z „bazą danych”. Wyjaśnijmy jednak ten punkt, zanim przejdziemy dalej – hurtownia danych to nie tylko baza danych, ale coś więcej. Zawiera kopię danych operacyjnych, które są zbierane z wielu źródeł danych i są przydatne podczas podejmowania strategicznych decyzji.
Niektórzy uważają również, że hurtownia danych zawiera TYLKO dane historyczne. Jednak jest to dalekie od prawdy. Hurtownia danych może zawierać dane historyczne, a także dane analityczne i raportowe. Dane transakcyjne zarządzane w magazynach danych nie są jednak przechowywane w magazynie. Celem korzystania z hurtowni danych jest analizowanie danych historycznych i bezproblemowe uzyskiwanie praktycznych informacji.
Czym u licha jest paradoks Simpsona? Jak to wpływa na dane?
Znaczenie hurtowni danych
Do tej pory jesteśmy na tej samej stronie, jeśli chodzi o koncepcję hurtowni danych, potrzebę jej i zobaczyliśmy znaczące różnice między hurtownią danych a OLTP. Przyjrzyjmy się teraz znaczeniu koncepcji hurtowni danych:
Zapewnia spójność danych
Hurtownie danych przechowują dane z różnych źródeł w wielu formatach. Dlatego są zaprogramowane do stosowania metod ETL, aby zapewnić ogólną spójność danych. Spójność sprawia, że hurtownie danych są idealnym narzędziem dla korporacyjnych decydentów do analizowania i udostępniania spostrzeżeń dotyczących danych współpracownikom na całym świecie. Standaryzacja i formatowanie danych zmniejsza również ryzyko błędów podczas analizy danych; zapewniając w ten sposób ogólną lepszą dokładność.
Ułatwiaj podejmowanie lepszych decyzji
„Najpierw dane, potem teorie”. Hurtownia danych umożliwia organizacjom łatwe przechowywanie i pobieranie danych, zapewniając w ten sposób lepsze teorie i strategie dotyczące tych danych. Hurtownia danych jest również znacznie szybsza, jeśli chodzi o dostęp do różnych zestawów danych i ułatwia uzyskiwanie praktycznych spostrzeżeń.

Popraw swoje wyniki finansowe
Hurtownia danych pomaga w usprawnieniu ogólnych operacji dowolnej organizacji, umożliwiając zainteresowanym stronom zapoznanie się z ich danymi historycznymi. To ostatecznie umożliwia liderom biznesowym szybkie śledzenie przeszłych działań ich organizacji i ocenę udanych (lub nieudanych) strategii. Dzięki temu menedżerowie mogą zobaczyć, gdzie mogą dostosować swoje podejście, aby obniżyć koszty, zmaksymalizować wydajność i zwiększyć sprzedaż, aby poprawić wyniki finansowe.
Kilka kluczowych terminologii związanych z pojęciem hurtowni danych i wokół niej:
Metadane
Metadane to w zasadzie tylko dane o danych. Na przykład, jeśli mówimy o książce, jej indeks może służyć jako metadane dotyczące treści książki. Innymi słowy, metadane można rozumieć jako podsumowanie pełnych danych.
W przypadku hurtowni danych metadane możemy zdefiniować jako −
- Mapa drogowa do hurtowni danych.
- Katalog, który pomaga systemowi wspomagania decyzji w lokalizacji zawartości hurtowni danych.
Kostka danych
Kostka danych jest definiowana przez wymiary i fakty i pomaga nam reprezentować dane w więcej niż jednym wymiarze. Wymiary to nic innego jak jednostki, o których organizacja przechowuje ewidencję. Służy głównie do przechowywania danych do celów sprawozdawczych. Każdy wymiar kostki reprezentuje pewną charakterystykę bazy danych, na przykład sprzedaż dzienną, miesięczną lub roczną. Dane zawarte w kostce danych umożliwiają przeanalizowanie prawie wszystkich liczb dla praktycznie każdego klienta, agenta sprzedaży, produktu i wielu innych. W ten sposób kostka danych może idealnie pomóc w ustaleniu trendów i analizie wydajności.
Zdobądź certyfikat nauk o danych z najlepszych światowych uniwersytetów. Dołącz do naszych programów Executive PG, Advanced Certificate Programs lub Masters, aby przyspieszyć swoją karierę.
Data Mart
Data mart może być rozumiany jako repozytorium danych zbudowane w celu obsługi określonej części organizacji. Baza danych zawiera jeden podzbiór danych całej organizacji, który jest cenny dla określonej grupy osób. Na przykład zbiorcza baza danych zaprojektowana specjalnie dla zespołu marketingowego może zawierać tylko dane związane z towarami, klientami i sprzedażą. Marmy danych są ograniczone do badanych podmiotów.
hurtowni danych wraz z ważnymi pojęciami i technologiami. Jeśli uznasz to za interesujące, zalecamy szczegółowe zapoznanie się z tym tematem poprzez manipulowanie pojęciami eksploracji danych, analizy danych i nie tylko. Podróż jest długa, a hurtownia danych to dopiero początek.
Jeśli masz jakiekolwiek wątpliwości lub pytania, daj nam znać w komentarzach poniżej!
Dlaczego firma powinna korzystać z hurtowni danych?
Nowoczesne systemy hurtowni danych upraszczają czasochłonne zadania związane z projektowaniem, budowaniem i wdrażaniem hurtowni danych, aby sprostać szybko zmieniającym się potrzebom firmy. W rezultacie wiele firm korzysta z rozwiązań hurtowni danych do pozyskiwania informacji. Ulepszona analiza danych, większe przychody i zdolność do bardziej strategicznego konkurowania na rynku to zalety posiadania hurtowni danych. Aby osiągnąć te korzyści, narzędzia hurtowni danych wykorzystują różne powiązane technologie, takie jak dane ustrukturyzowane i nieustrukturyzowane, oprogramowanie ETL i eksploracja danych.
Niektóre kluczowe zalety hurtowni danych obejmują:
1. Pozwala na wgląd historyczny
2. Poprawia jakość i spójność danych
3. Zwiększa produktywność
4. Analiza danych może być wydajniejsza i szybsza
5. Zwiększa przychody
6. Współdziała zarówno z systemami lokalnymi, jak i chmurowymi
Jakie jest najlepsze narzędzie do hurtowni danych?
Wiele firm polega dziś na narzędziach do hurtowni danych. Wybór odpowiedniego rozwiązania do zarządzania i utrzymania hurtowni danych, a także znalezienie takiego, które dokładnie odpowiada celom i ograniczeniom biznesowym, może być trudne.
Oto przegląd niektórych narzędzi do hurtowni danych, których firmy mogą używać do wydobywania przydatnych danych ze swoich hurtowni danych:
1. Amazon Redshift : Amazon Redshift to narzędzie hurtowni danych, które umożliwia badanie danych za pomocą istniejących narzędzi Business Intelligence za pomocą prostych zapytań SQL. Wykorzystuje obliczenia o wysokiej wydajności, wykonywanie równoległe, jednolitą optymalizację zapytań i pamięć kolumnową do uruchamiania zaawansowanych zapytań analitycznych. Domyślnie Amazon Redshift szyfruje swoje dane w spoczynku.
2. Google BigQuery : Google BigQuery to bezserwerowe, opłacalne i wysoce skalowalne narzędzie do hurtowni danych, które obejmuje uczenie maszynowe i wykorzystuje silnik analizy biznesowej. Analizuje petabajty danych z dużą szybkością przy użyciu języka ANSI SQL, zapewnia wgląd i rozwiązania z danych w chmurach dzięki elastycznej architekturze, a także może przechowywać i wysyłać zapytania do ogromnych zestawów danych w ekonomiczny i wydajny sposób.
3. Microsoft Azure: Microsoft Azure to narzędzie do magazynowania danych, które łączy ponad 200 produktów i usług w chmurze, które pomaga projektować, uruchamiać i zarządzać wysoce skalowalnymi aplikacjami w różnych sieciach chmurowych. Pomaga we wdrażaniu maszyn wirtualnych Windows i Linux w różnych środowiskach chmurowych i hybrydowych.