Una tabella di marcia di esempio per la creazione del tuo data warehouse
Pubblicato: 2018-03-30Il data warehousing, una tecnica per consolidare tutti i dati dell'organizzazione in un unico posto per un accesso più facile e una migliore analisi, è il sogno di ogni stakeholder aziendale. Tuttavia, la creazione di un data warehouse è un'attività notevolmente complessa e, anche prima di muovere i primi passi, dovresti essere assolutamente sicuro della risposta a queste due domande:
- Gli obiettivi della tua organizzazione
- La tua roadmap dettagliata per la creazione di un data warehouse
Ognuna di queste domande, se lasciata senza risposta, può costare molto alla tua organizzazione a lungo termine. È una tecnologia relativamente più recente e creerai un ampio margine di errore se non sei a conoscenza delle esigenze e dei requisiti specifici della tua organizzazione. Questi errori possono rendere il tuo magazzino estremamente impreciso. Quel che è peggio è che un data warehouse errato è peggio che non avere affatto dati e una strategia non pianificata potrebbe finire per farti più male che bene.
Poiché esistono approcci diversi allo sviluppo dei data warehouse e ciascuno dipende dalle dimensioni e dalle esigenze delle organizzazioni, non è possibile creare un piano valido per tutti.
Detto questo, proviamo a definire una tabella di marcia di esempio che ti aiuterà a sviluppare un data warehouse solido ed efficiente per la tua organizzazione:
Sommario
Allestimento di un Data Warehouse
Data Warehouse è estremamente utile quando si organizzano grandi quantità di dati da recuperare e analizzare in modo efficiente. Per lo stesso motivo, occorre prestare la massima attenzione per garantire che i dati siano rapidamente accessibili. Un approccio alla progettazione del sistema consiste nell'utilizzare la modellazione dimensionale, un metodo che consente di interrogare ed esaminare in modo efficiente e rapido grandi volumi di dati. Poiché la maggior parte dei dati presenti nei data warehouse sono storici e stabili, in un certo senso non cambiano frequentemente, non è quasi necessario utilizzare metodi di backup ripetitivi. Al contrario, una volta aggiunti i dati, è possibile eseguire il backup dell'intero magazzino in una volta, invece di eseguire il backup di routine.
Gli strumenti di data warehousing possono essere classificati in quattro categorie:
- Strumenti di estrazione,
- Strumenti di gestione delle tabelle,
- Strumenti di gestione delle query e
- Strumenti per l'integrità dei dati.
Ognuno di questi strumenti è estremamente utile nelle diverse fasi di sviluppo del Data Warehouse. La ricerca da parte tua ti aiuterà a capire di più su questi strumenti e ti consentirà di scegliere quelli più adatti alle tue esigenze.
Concetti chiave del data warehousing: una panoramica
Ora, diamo un'occhiata a una tabella di marcia di esempio che ti aiuterà a creare un magazzino più solido e approfondito per la tua organizzazione:
Valuta i tuoi obiettivi
Il primo passo per configurare il data warehouse della tua organizzazione è valutare i tuoi obiettivi. Ne abbiamo parlato prima, ma non possiamo sottolinearlo abbastanza. La maggior parte delle organizzazioni perde informazioni preziose solo perché non dispone di un quadro chiaro degli obiettivi, dei requisiti e degli obiettivi della propria azienda. Ad esempio, se sei un'azienda alla ricerca della tua prima svolta significativa, potresti voler coinvolgere i tuoi clienti nella creazione di rapporti, quindi dovrai seguire un approccio diverso rispetto a un'organizzazione ben consolidata e che ora desidera utilizzare il data warehouse per migliorare le proprie operazioni. Portare un data warehouse all'interno dell'azienda è un grande passo per qualsiasi organizzazione e dovrebbe essere eseguito solo dopo una due diligence da parte tua.
Analizzare gli attuali sistemi tecnologici
Facendo domande mirate ai tuoi clienti e agli stakeholder aziendali, puoi raccogliere informazioni sulle prestazioni del tuo attuale sistema tecnico, sulle sfide che deve affrontare e sui miglioramenti possibili. Inoltre, possono persino scoprire quanto sia adatto il loro attuale stack tecnologico, decidendo così in modo efficiente se mantenerlo o sostituirlo. Vari dipartimenti della tua organizzazione possono contribuire a ciò fornendo report e feedback.
Esempi più comuni di data mining
Modellazione delle informazioni
Un modello informativo è una rappresentazione dei dati della tua organizzazione. È concettuale e consente di creare idee su quali processi aziendali devono essere correlati e su come collegarli. Il data warehouse sarà in definitiva una raccolta di strutture correlate, quindi è importante concettualizzare gli indicatori che devono essere collegati tra loro e creare metodi di prestazioni ottimali: questo è ciò che è noto come modellazione delle informazioni. Il modo più semplice per progettare un modello informativo efficiente è raccogliere gli indicatori chiave di prestazione in tabelle dei fatti e metterli in relazione a varie dimensioni come clienti, dipendenti, prodotti e simili.

Impara i corsi di scienza dei dati dalle migliori università del mondo. Guadagna programmi Executive PG, programmi di certificazione avanzati o programmi di master per accelerare la tua carriera.
Progettazione del magazzino e tracciabilità dei dati
Dopo aver raccolto informazioni dettagliate sulla tua organizzazione e preparato un modello informativo efficiente, ora arriva il momento di spostare i tuoi dati nel magazzino e tenere traccia delle prestazioni degli stessi. Durante la fase di progettazione, è essenziale pianificare come collegare tutti i dati da diversi database in modo che le informazioni possano essere interconnesse quando le carichiamo nelle nostre tabelle di data warehouse. Gli strumenti ETL possono richiedere molto tempo e denaro e potrebbero richiedere esperti per implementarli con successo. Quindi, è importante conoscere gli strumenti giusti al momento giusto e scegliere l'opzione più conveniente a tua disposizione. Un data warehouse consuma una quantità significativa di spazio di archiviazione, quindi è necessario pianificare come archiviare i dati col passare del tempo. Un modo per farlo è mantenere un sistema di archiviazione dei dati a tripla granularità (ne parleremo di più tra poco). Tuttavia, il problema con la granularità è che la granularità dei dati differirà in un periodo. Quindi, dovresti progettare il tuo sistema in modo tale che la diversa granularità sia coerente con una struttura di dati specifica.
Implementa il piano
Ora che hai sviluppato il tuo piano e collegato i dati insieme, è tempo di implementare la tua strategia. L'implementazione di Data Warehouse è una grande mossa e c'è una base praticabile per la pianificazione del progetto. Il progetto dovrebbe essere suddiviso in blocchi e dovrebbe essere ripreso un pezzo alla volta. Si consiglia di definire una fase di completamento per ogni blocco dell'attività e infine di raccogliere tutti i bit al completamento. Con un'implementazione così sistematica e ponderata, il tuo Data Warehouse funzionerà in modo molto più efficiente e fornirà le informazioni necessarie durante la fase di analisi dei dati.
Che cos'è il data warehousing e il data mining
Aggiornamenti
Il tuo data warehouse è impostato per resistere alle prove del tempo e della granularità. Deve rimanere coerente per lunghi periodi di tempo ea molti livelli di granularità. Nella fase di progettazione dell'installazione, puoi optare per vari piani di archiviazione che si legano all'aggiornamento non ripetitivo. Ad esempio, un responsabile IT può configurare un sistema di stoccaggio del grano giornaliero, settimanale o mensile. Nella granella giornaliera, i dati possono essere memorizzati nel formato originale in cui sono stati raccolti, possono essere conservati per 2-3 anni, dopodiché devono essere riepilogati e spostati nella granella settimanale. Ora, i dati possono rimanere nella struttura del grano settimanale per i prossimi 3-5 anni, dopodiché verranno spostati nella struttura del grano mensile.
Seguire la tabella di marcia sopra menzionata ti assicurerà di essere sulla strada giusta per la lunga gara che verrà. Se hai domande, sentiti libero di lasciarle nei commenti qui sotto.
Che cos'è un Data Warehouse?
Un data warehouse è una sorta di sistema di gestione dei dati progettato per facilitare e assistere le attività di business intelligence e analisi.
I data warehouse ti consentono di eseguire query logiche, creare modelli di previsione affidabili e individuare tendenze importanti nella tua azienda. v
Quanto tempo ci vuole per costruire un Data Warehouse?
Il tempo è una lamentela comune per quanto riguarda il data warehousing e la business intelligence nel mercato. Sebbene i numeri siano discutibili, atteniamoci alla tradizionale comprensione che il data warehousing spesso ha bisogno di molto tempo per vedere i risultati.
L'investimento di tempo necessario per impostare l'analisi è semplicemente troppo grande. Il tempo impiegato per costruire un Data warehouse può variare da 12 a 24 mesi. Ma ne vale assolutamente la pena, poiché i progetti di data warehouse di successo possono trasformare completamente i processi e la visione di un'organizzazione. Hanno la capacità di far luce su problemi, aprire la strada a nuove prospettive e aiutare i dipendenti a tutti i livelli a migliorare la loro vita lavorativa quotidiana.
Quali sono alcune delle caratteristiche più importanti di un Data warehouse?
Alcuni dei componenti di base di un tipico Data Warehouse sono:
1. Database centrale: la pietra angolare del tuo data warehouse è un database. Si trattava di database relazionali convenzionali che potevano essere utilizzati in sede o nel cloud. Tuttavia, i database in-memory stanno rapidamente guadagnando popolarità a causa dei Big Data, della necessità di una velocità reale in tempo reale e di una sostanziale riduzione del costo della RAM.
2. Integrazione dei dati: varie tecnologie di integrazione dei dati, come ETL (Extract, Transform, Load), replica dei dati in tempo reale, elaborazione del carico di massa, trasformazione dei dati, qualità dei dati, ecc. Vengono utilizzate per raccogliere dati dai sistemi di origine e modificarli in modo che sia pronto per un consumo analitico rapido.
3. Metadati: dettaglia i set di dati nell'origine, l'utilizzo, i valori e altre caratteristiche del tuo data warehouse. Esistono metadati aziendali, che danno significato ai tuoi dati, e metadati tecnici, che spiegano come accedere ai dati, ad esempio dove sono archiviati e come sono organizzati.
4. Strumenti di accesso al data warehouse: gli utenti possono interagire con i dati nel data warehouse utilizzando strumenti di accesso come strumenti di query e reporting, strumenti di sviluppo di applicazioni, strumenti di data mining, strumenti OLAP, ecc.