Un exemplu de foaie de parcurs pentru construirea depozitului dvs. de date
Publicat: 2018-03-30Depozitarea datelor, o tehnică de consolidare a tuturor datelor dumneavoastră organizaționale într-un singur loc pentru un acces mai ușor și o analiză mai bună, este visul oricărei părți interesate de afaceri. Cu toate acestea, configurarea unui depozit de date este o sarcină semnificativ complexă și chiar înainte de a face primii pași, ar trebui să fii absolut sigur de răspunsul la aceste două întrebări:
- Obiectivele organizației dvs
- Foaia de parcurs detaliată pentru construirea unui depozit de date
Oricare dintre aceste întrebări, dacă rămâne fără răspuns, poate costa mult organizația dumneavoastră pe termen lung. Este o tehnologie relativ mai nouă și veți crea o mulțime de posibilități pentru erori dacă nu sunteți conștient de nevoile și cerințele specifice ale organizației dvs. Aceste erori vă pot face depozitul extrem de inexact. Mai rău este că un depozit de date eronat este mai rău decât să nu aibă deloc date și o strategie neplanificată ar putea ajunge să-ți facă mai mult rău decât bine.
Deoarece există abordări diferite pentru dezvoltarea depozitelor de date și fiecare depinde de dimensiunea și nevoile organizațiilor, nu este posibil să se creeze un plan care să se potrivească tuturor.
Acestea fiind spuse, haideți să încercăm să stabilim un exemplu de foaie de parcurs care vă va ajuta să dezvoltați un depozit de date robust și eficient pentru organizația dvs.:
Cuprins
Configurarea unui depozit de date
Data Warehouse este extrem de util atunci când organizați cantități mari de date pentru a le prelua și analiza eficient. Din același motiv, ar trebui să se acorde o atenție deosebită pentru a se asigura că datele sunt accesibile rapid. O abordare a proiectării sistemului este utilizarea modelării dimensionale – o metodă care permite ca volume mari de date să fie interogate și examinate în mod eficient și rapid. Deoarece majoritatea datelor prezente în depozitele de date sunt istorice și stabile – într-un anumit sens, nu se schimbă frecvent, nu este nevoie să folosiți metode de backup repetitive. În schimb, odată ce orice date sunt adăugate, întregul depozit poate fi făcut o copie de rezervă dintr-o dată – în loc să se facă copii de rezervă în mod obișnuit.
Instrumentele de depozitare a datelor pot fi clasificate în general în patru categorii:
- Instrumente de extracție,
- Instrumente de gestionare a tabelelor,
- Instrumente de gestionare a interogărilor și
- Instrumente de integritate a datelor.
Fiecare dintre aceste instrumente este extrem de util în diferite stadii de dezvoltare a Data Warehouse. Cercetarea din partea dvs. vă va ajuta să înțelegeți mai multe despre aceste instrumente și vă va permite să le alegeți pe cele care se potrivesc nevoilor dvs.
Concepte cheie ale depozitării datelor: o prezentare generală
Acum, să ne uităm la un exemplu de foaie de parcurs care vă va ajuta să construiți un depozit mai solid și mai perspicace pentru organizația dvs.:
Evaluează-ți obiectivele
Primul pas în configurarea depozitului de date al organizației dvs. este să vă evaluați obiectivele. Am menționat acest lucru mai devreme, dar nu putem sublinia acest lucru suficient. Majoritatea organizațiilor pierd din informații valoroase doar pentru că le lipsește o imagine clară a obiectivelor, cerințelor și obiectivelor companiei lor. De exemplu, dacă sunteți o companie care caută prima descoperire semnificativă, s-ar putea să doriți să vă implicați clienții în construirea unei relații - deci, va trebui să urmați o abordare diferită față de o organizație care este bine stabilită și acum dorește să folosească depozit de date pentru îmbunătățirea operațiunilor lor. Aducerea unui depozit de date în interior este un pas mare pentru orice organizație și ar trebui să fie efectuată numai după o anumită diligență din partea dvs.
Analizați sistemele tehnologice actuale
Adresându-le clienților și părților interesate de afaceri, puteți aduna informații despre modul în care sistemul dumneavoastră tehnic actual funcționează, provocările cu care se confruntă și îmbunătățirile posibile. În plus, ei pot afla chiar cât de potrivite este tehnologia lor actuală – decizând astfel eficient dacă urmează să fie păstrată sau înlocuită. Diverse departamente ale organizației dvs. pot contribui la aceasta prin furnizarea de rapoarte și feedback.
Cele mai comune exemple de data mining
Modelarea informației
Un model de informații este o reprezentare a datelor organizației dvs. Este conceptual și vă permite să vă formați idei despre ce procese de afaceri trebuie să fie interconectate și despre cum să le conectați. Depozitul de date va fi în cele din urmă o colecție de structuri corelate, așa că este important să conceptualizezi indicatorii care trebuie să fie conectați împreună și să creăm metode de performanță de top - aceasta este ceea ce se numește modelarea informațiilor. Cea mai simplă modalitate de a proiecta un model informațional eficient este prin adunarea indicatorilor cheie de performanță în tabele de fapte și relaționarea acestora cu diferite dimensiuni, cum ar fi clienți, angajați, produse și altele.

Învață cursuri de știință a datelor de la cele mai bune universități din lume. Câștigă programe Executive PG, programe avansate de certificat sau programe de master pentru a-ți accelera cariera.
Proiectarea depozitului si urmarirea datelor
Odată ce ați adunat informații despre organizația dvs. și ați pregătit un model de informații eficient, acum vine momentul să vă mutați datele în depozit și să urmăriți performanța acestora. În timpul fazei de proiectare, este esențial să planificăm cum să legăm toate datele din diferite baze de date, astfel încât informațiile să poată fi interconectate atunci când le încărcăm în tabelele noastre de depozit de date. Instrumentele ETL pot consuma destul de mult timp și bani și ar putea necesita experți pentru a le implementa cu succes. Prin urmare, este important să cunoașteți instrumentele potrivite la momentul potrivit și să alegeți cea mai rentabilă opțiune disponibilă pentru dvs. Un depozit de date consumă o cantitate semnificativă de spațiu de stocare, așa că trebuie să planificați cum să arhivați datele pe măsură ce trece timpul. O modalitate de a face acest lucru este păstrarea unui sistem de stocare a datelor cu granularitate triplă (vom vorbi mai multe despre asta peste ceva timp). Cu toate acestea, problema cu granularitatea este că granulele de date vor amâna pe o perioadă. Deci, ar trebui să vă proiectați sistemul astfel încât granularitatea diferită să fie în concordanță cu o structură de date specifică.
Implementați planul
Acum că ți-ai dezvoltat planul și ai legat bucățile de date, este timpul să-ți implementezi strategia. Implementarea Data Warehouse este o mișcare mare și există o bază viabilă pentru programarea proiectului. Proiectul ar trebui să fie împărțit în bucăți și ar trebui să fie preluat câte o bucată la un moment dat. Este recomandat să definiți o fază de finalizare pentru fiecare bucată a sarcinii și, în final, să colaționați toți biții după finalizare. Cu o astfel de implementare sistematică și gândită, depozitul dvs. de date va funcționa mult mai eficient și va oferi informațiile atât de necesare necesare în timpul fazei de analiză a datelor.
Ce este ce înseamnă depozitarea datelor și mineritul de date
Actualizări
Depozitul dvs. de date este setat să reziste testelor timpului și granularității. Trebuie să rămână consistent pentru perioade lungi de timp și la multe niveluri de granularitate. În faza de proiectare a configurației, puteți opta pentru diferite planuri de stocare care se leagă de actualizarea nerepetitivă. De exemplu, un manager IT poate configura sisteme zilnice, săptămânale sau lunare de depozitare a cerealelor. În boabele zilnice, datele pot fi stocate în formatul original în care au fost colectate pot fi păstrate timp de 2-3 ani, după care trebuie rezumate și mutate în boabele săptămânale. Acum, datele pot rămâne în structura săptămânală a cerealelor pentru următorii 3-5 ani, după care vor fi mutate în structura lunară a cerealelor.
Urmărirea foii de parcurs menționată mai sus vă va asigura că sunteți pe drumul cel bun pentru cursa lungă care urmează. Dacă ați avut întrebări, nu ezitați să le trimiteți în comentariile de mai jos.
Ce este un depozit de date?
Un depozit de date este un fel de sistem de management al datelor conceput pentru a facilita și asista activitățile de business intelligence și analiză.
Depozitele de date vă permit să executați interogări logice, să creați modele de prognoză fiabile și să identificați tendințe importante în cadrul companiei dvs. v
Cât timp durează construirea unui depozit de date?
Timpul este o problemă obișnuită cu privire la depozitarea datelor și la business intelligence pe piață. Deși cifrele sunt discutabile, să rămânem la înțelegerea tradițională conform căreia Data Warehousing are adesea nevoie de mult timp pentru a vedea rezultate.
Investiția de timp necesară pentru a configura analiza este pur și simplu prea mare. Timpul necesar pentru a construi un depozit de date poate varia de la 12 la 24 de luni. Dar, merită total, deoarece proiectele de succes de depozit de date pot transforma complet procesele și viziunea unei organizații. Ei au capacitatea de a arunca lumină asupra problemelor, de a deschide calea către noi perspective și de a ajuta angajații de la toate nivelurile să își îmbunătățească viața profesională de zi cu zi.
Care sunt unele dintre cele mai importante caracteristici ale unui depozit de date?
Unele dintre componentele de bază ale unui depozit de date tipic sunt:
1. Baza de date centrală: piatra de temelie a depozitului dumneavoastră de date este o bază de date. Acestea erau baze de date relaționale convenționale care puteau fi folosite on-premise sau în cloud. Cu toate acestea, bazele de date în memorie câștigă rapid popularitate ca urmare a Big Data, a necesității unei viteze adevărate în timp real și a unei scăderi substanțiale a costului RAM.
2. Integrarea datelor: Diferite tehnologii de integrare a datelor, cum ar fi ETL (Extract, Transform, Load), replicarea datelor în timp real, procesarea încărcării în vrac, transformarea datelor, calitatea datelor etc. sunt utilizate pentru a colecta date din sistemele sursă și pentru a le modifica astfel că este gata pentru consum analitic rapid.
3. Metadate: Detaliază seturile de date din sursa depozitului de date, utilizarea, valorile și alte caracteristici. Există metadatele de afaceri, care oferă semnificație datelor tale și metadate tehnice, care explică cum să accesezi datele, cum ar fi locul în care sunt stocate și cum sunt organizate.
4. Instrumente de acces la depozitul de date: utilizatorii pot interacționa cu datele din depozitul dvs. de date folosind instrumente de acces, cum ar fi instrumente de interogare și raportare, instrumente de dezvoltare a aplicațiilor, instrumente de extragere a datelor, instrumente OLAP etc.