Piccoli dati, grandi opportunità

Pubblicato: 2022-03-11

Sintesi

Cosa sono i big data?
  • "Big data" è una misura soggettiva che descrive set di dati così grandi da non poter essere gestiti e analizzati dai tipici strumenti software di database.
  • Questi insiemi vengono invece analizzati computazionalmente per rivelare modelli, tendenze e associazioni, soprattutto per quanto riguarda il comportamento umano e le interazioni.
  • I big data e l'analisi sono diventati mainstream con l'avvento di Internet, dell'eCommerce, dei social media e dell'interconnessione dei dispositivi, tutti fattori che hanno contribuito all'aumento sostanziale del volume di dati analizzabili necessari affinché i big data diventino una realtà.
  • Gartner e IBM decostruiscono i big data nelle Quattro Vs: Volume , Velocity , Variety e Veracity , ciascuna parte costitutiva richiesta per trasformare i big data in valore monetizzabile.
Cosa sono i piccoli dati?
  • I piccoli dati, anch'essi una misura soggettiva, sono definiti come set di dati sufficientemente piccoli in volume e formato da renderli accessibili, informativi, utilizzabili e comprensibili dalle persone senza l'uso di sistemi e macchine complessi per l'analisi.
  • I piccoli dati non si sono affermati come categoria a sé stante fino all'emergere dei big data, e rappresentano quindi un derivato di questi ultimi.
  • Le piccole imprese che prendono in considerazione una strategia di analisi dovrebbero inizialmente concentrarsi sull'utilizzo di piccoli dati per generare informazioni utili sui propri clienti prima di passare ad applicazioni di big data per analisi più prescrittive e predittive.
Definisci l'analisi dei dati.
  • L'analisi dei dati è la disciplina di lunga data in cui statistici e data scientist altamente qualificati analizzano set di campioni statisticamente significativi (cioè di grandi dimensioni) utilizzando sofisticati programmi software per identificare modelli e tendenze. Questa analisi consente di ottenere informazioni utili per prendere decisioni migliori, principalmente sulle interazioni con i clienti.
  • Negli ultimi anni, il software che consente questo lavoro è diventato più accessibile, potente e facile da usare, consentendo così al citizen data scientist di emergere e iniziare a intraprendere progetti che in precedenza erano il dominio di specialisti tecnici altamente qualificati.

introduzione

Dati e analisi sono diventati rapidamente le parole d'ordine del giorno nel mondo degli affari. Sarebbe difficile decifrare un diario senza qualche riferimento alle aziende lungimiranti che "utilizzano in modo intelligente i dati" per raccogliere informazioni sul comportamento dei clienti, condurre analisi dei rischi o gestire in modo più efficiente la propria infrastruttura. Le grandi aziende ricche di dati, in particolare quelle della varietà regolamentata, sono state impegnate per anni in processi decisionali basati sui dati, esemplificato al meglio dal pioniere dell'analisi dei dati da parte di Capital One per comprendere meglio i propri clienti, approfondimenti successivamente utilizzati per lanciare soluzioni iper-mirate ed estremamente campagne di marketing di grande impatto che hanno portato al suo successo travolgente.

Ma nonostante gli inizi di nicchia, l'utilizzo dei dati è diventato rapidamente mainstream. Esistono oggi poche ragioni credibili per una determinata azienda, indipendentemente dalle dimensioni e dalla manodopera, per non avere l'analisi come processo/capacità core business. Le obiezioni tradizionali come costi, risorse e competenze non tagliano più la senape. Al contrario, i dati generati internamente stanno rapidamente diventando un asset strategico onnipresente sfruttato come qualsiasi altro, da aziende competitive che cercano di rimanere competitive.

Questo articolo cerca di introdurre rapidamente i suoi lettori al mondo dei dati e dell'analisi, guidandoti attraverso le dinamiche di mercato, gli strumenti, i giocatori e le soluzioni uniche per entrambi, prima di dedicare la seconda metà a una guida pratica all'implementazione e a un framework per le piccole imprese.

Una guida per esperti sia ai grandi che ai piccoli dati

Con l'avvento di Internet e con esso l'eCommerce, i social media e l'interconnessione dei dispositivi è arrivata un'esplosione nel volume di dati disponibili a livello globale e analizzabili per coloro che possiedono gli strumenti per sfruttarli. Ogni tweet, post, Mi piace, scorrimento a sinistra, scorrimento a destra, doppio tocco, recensione, testo e transazione: ciascuno è un dato utilizzabile per mappare le nostre impronte digitali che raccontano chi siamo, come prendiamo decisioni, dove e perché. Questi dati, opportunamente definiti "big data" per la vastità, la profondità e la complessità della sua forma, hanno sbloccato un mare di possibilità nell'analisi prescrittiva e predittiva, rendendo possibile l'iper personalizzazione di tanti dei prodotti che consumiamo quotidianamente.

Formalmente, i big data descrivono grandi set di dati che possono essere analizzati computazionalmente per rivelare modelli, tendenze e associazioni, il più delle volte correlati al comportamento umano e alle interazioni. Affinché i dati possano essere definiti "grandi", l'insieme/banca deve essere così grande da richiedere metodi di dati avanzati e sistemi complessi per estrarne valore.

In un rapporto di ricerca del 2001, il Gruppo META (ora Gartner) ha inquadrato i big data in tre dimensioni denominate le Tre V dei dati. Questi sono i seguenti: Volume (quantità), Velocità (velocità di generazione/trasmissione) e Varietà (gamma di tipo e sorgente). Queste tre V sono state successivamente ampliate in Quattro V da IBM, per includere la veridicità (qualità/integrità) dei dati come dimensione finale richiesta per acquisire il valore.

Grafico 1: Le quattro controparti dei big data

...ma probabilmente avevi già sentito parlare di big data. I piccoli dati, d'altra parte, sono una sottoclasse di dati ritenuti sufficientemente modesti da renderli accessibili, informativi e fruibili dalle persone, senza la necessità di strumenti analitici eccessivamente complessi. Ridotto al meglio dall'ex consulente McKinsey Allen Bonde, "I big data riguardano le macchine, mentre i piccoli dati riguardano le persone", in particolare, intuizioni significative organizzate e confezionate per la derivazione di cause, modelli e i motivi "perché" delle persone.

Analisi basata su SaaS

Parallelamente all'aumento della disponibilità e dell'utilità dei dati, è emersa l'emergere di un settore di analisi autonomo. Un tempo ritrovo esclusivo di statistici, data scientist e analisti di livello Master e PhD, l'analisi si è evoluta in un settore di piattaforme SaaS (Software-as-a-Service) self-service (SaaS) funzionalmente robuste ma a basso costo che consentono anche la maggior parte novizio degli utenti per estrarre valore dai propri dati. Le aziende più piccole che in precedenza non avevano le competenze o i budget necessari per eseguire questo tipo di analisi ora competono su un piano di parità con le loro controparti con risorse migliori e stanno stabilendo moti difendibili nei loro mercati.

Oltre ai vantaggi in termini di costi del modello SaaS, una ricerca del Gruppo Aberdeen, una società di ricerca su tecnologia e servizi, dimostra che le organizzazioni che adottano strumenti SaaS hanno il doppio dei dipendenti che utilizzano istintivamente i dati per prendere decisioni e raggiungere i propri obiettivi di ROI 40% più veloce di quelli che non lo fanno. Per la maggior parte delle aziende, i report di email marketing, Google Analytics e altri strumenti di analisi basati sul Web di terze parti sono già in uso attivo, oltre ai report generati internamente dai sistemi di contabilità, marketing, ERP e CRM e utilizzati come meccanismo principale per monetizzare i loro piccoli dati.

Inoltre, sebbene sia un mercato ampio e in crescita la cui misurazione precisa può essere difficile, IDC stima che il mercato mondiale degli strumenti di business intelligence e analisi a quasi 14 miliardi di dollari nel 2017, con una crescita dell'11,7% anno su anno, con Forrester Research , una società di ricerche di mercato globale, che prevede un CAGR del 15% fino al 2021.

Dati sulla quota di mercato

Non sorprende che il mercato degli strumenti e delle soluzioni di analisi sia dominato dalla vecchia guardia delle società di software, come SAP, IBM, Oracle e Microsoft. A partire dal 2015, SAP ha guidato il mercato con una quota di mercato del 10% e $ 1,2 miliardi di ricavi da prodotti di analisi e business intelligence (BI); SAS Institute era il numero due, con una quota del 9%; IBM, terza con l'8%, e Oracle e Microsoft al quarto e quinto posto, rispettivamente, con 7% e 5%. È interessante notare che la quota di mercato dei cinque maggiori fornitori è diminuita a causa della crescita superiore al mercato di startup sostenute da capitale di rischio come Sentiment Strategies, Tableau e Teradata, suggerendo che gran parte della crescita futura del settore sarà generata da società più piccole, aziende più veloci e agili.

Grafico 2: principali fornitori di analisi dei dati negli Stati Uniti, quota di mercato per società

Una guida all'implementazione dell'analisi dei dati per le piccole aziende

Al livello più alto possibile, una cultura incentrata sui dati offre al management una maggiore sicurezza di essere in grado di prendere le migliori decisioni possibili, spesso e in modo coerente, lavorando dalla stessa versione della verità, trasparente e quantificabile. Dopotutto, la maggior parte di noi ha assistito a sessioni in cui i dirigenti in guerra hanno avanzato/difeso argomentazioni diverse appoggiandosi a diverse fonti aneddotiche, modelli di fatti e interpretazioni, mettendo rapidamente in discussione l'integrità degli input e quindi degli output. Pertanto, la prima decisione che deve essere presa da una determinata piccola impresa che cerca di percorrere la strada dell'analisi dei dati è se detta azienda cerca veramente di diventare un'organizzazione basata sui dati.

Una volta presa questa decisione dall'alto verso il basso, è necessario stabilire un quadro per ottimizzare il potenziale e l'utilità della nuova priorità strategica. Per iniziare, è necessario porre diverse domande. Il primo, quali sono gli obiettivi a breve ea lungo termine di una determinata azienda, progetto, iniziativa o dipartimento? In secondo luogo, chi dovrebbe essere responsabile dello sforzo e dei suoi risultati? Terzo, quali problemi specifici l'azienda, il progetto, l'iniziativa o il dipartimento cercano di risolvere con i dati? E quarto, quali strumenti dovrebbero essere usati per guidare l'iniziativa?

Una volta che queste domande hanno avuto risposta, il passo successivo è formulare un piano di esecuzione tangibile che, con un po' di pianificazione, struttura organizzativa, direzione dall'alto verso il basso ed entusiasmo dal basso verso l'alto, posizionerà l'organizzazione a portata di mano per generare risultati reali e misurabili risultati in modo più coerente rispetto al passato. Il diagramma seguente è progettato per fornire un quadro per considerare i vari elementi di un semplice approccio di analisi dei dati.

Grafico 3: elementi di riepilogo, dimensioni e considerazioni su un approccio di analisi dei dati

Alla questione degli obiettivi

Questa è la prima domanda importante da chiarire. Ad alto livello, l'obiettivo principale di qualsiasi azienda che cerchi di sfruttare i propri dati è sviluppare un processo sistematico per prendere decisioni aziendali valide, un processo che sia coerente e ripetibile e che produca risultati misurabilmente migliori. A questo punto, è importante notare che diventare una solida organizzazione orientata ai dati è un viaggio e non una destinazione e, in quanto tale, il "buy-in" dall'alto e il consenso dal basso sono importanti passaggi fondamentali che si riveleranno critici all'adozione di massa e al pieno utilizzo delle risorse analitiche. Dopo aver ottenuto il buy-in, un passo successivo collaudato è organizzare strategicamente alcune "vincite rapide" per aumentare la soglia di eccitazione e coinvolgimento necessari per portare a compimento questo processo. Creazione del consenso, adesione e vincite rapide ottenute, sia la ricerca che le mie esperienze dettano un approccio di implementazione che presuppone la struttura, la sequenza e le considerazioni seguenti:

Inizia con l'analisi descrittiva, un semplice dashboard visivo che evidenzia le prestazioni aziendali utilizzando i dati transazionali esistenti per trarre conclusioni che in precedenza si erano rivelate inconcludenti senza dati quantificabili. Successivamente, sviluppa funzionalità di drill-down all'interno della tua dashboard, condividendo approfondimenti, risultati delle prestazioni e istruzioni di auto-aiuto in modo strategico e con i giusti colleghi/influencer organizzativi. Questo avvierà sia il processo di divulgazione ai loro subordinati che la cultura dell'affidamento dei dati che cerchi di coltivare.

Fase due: passare a capacità di analisi predittiva più sofisticate, utilizzando risorse tecniche interne o con l'aiuto di fornitori di terze parti. Queste capacità predittive uniscono fonti di dati interne ed esterne per rispondere meglio a specifiche domande aziendali come "Qual è la probabilità che un cliente diserti?" o "I clienti che acquistano x, in genere acquistano anche y" e forniscono informazioni reali. informazioni temporali sulle prestazioni dipartimentali o di una determinata iniziativa. Le "fonti di dati esterne" in questo caso includono dati sui social media, dati sulla forza vendita o dati sull'esperienza utente, che forniscono tutti fonti di informazioni dettagliate e statisticamente significative, in cui i dati interni sono ancora troppo limitati per essere sfruttabili da soli.

La terza fase consiste nel passare all'analisi prescrittiva avanzata che aiuta a determinare l'azione appropriata per guidare/prevenire il comportamento di consumatori, aziende, concorrenti, dipendenti o fornitori sullo sfondo dei dati storici. Va notato però che questa fase inizia solitamente a segnare il passaggio dai piccoli dati ai grandi; eppure, è un passaggio necessario che dovrebbe essere incorporato nel processo decisionale a livello aziendale per garantire i massimi livelli di integrità input-output e coerenza nel processo decisionale.

Grafico 4: Framework per l'identificazione degli obiettivi e degli obiettivi da parte di un'organizzazione in grado di analisi

Visione approfondita delle diverse fasi dell'analisi

Analisi descrittiva – Dashboard

È assodato che ciò che viene misurato viene gestito e quindi, sviluppando un'unica verità deterministica dei dati, i leader all'interno di un'organizzazione sono in grado di prendere decisioni più solide e unificate. I dashboard sono il punto di partenza di tali viaggi di analisi e l'illustrazione visiva della verità deterministica dei dati di un'azienda. Naturalmente, ciò che è rilevante per un gruppo può essere privo di significato per un altro, quindi si dovrebbe tenere in debita considerazione lo scopo o il tema di una determinata dashboard, quali informazioni dovrebbero essere incluse, chi è il pubblico del recettore rilevante per il suo contenuto e quale domanda/problema è che detto gruppo sta cercando di rispondere/risolvere.

Grafico 5: dashboard di analisi delle vendite di esempio

Grafico 6: dashboard di analisi di esempio per l'eCommerce

Cruscotti ben progettati guidano il processo decisionale piuttosto che presentare semplicemente informazioni storiche e concentrano in modo efficace l'attenzione sulle tendenze e sui modelli ricorrenti (sia positivi che negativi) illustrando con precisione i parametri vitali di un'azienda. Dashboard più sofisticati forniscono funzionalità di drill-down che consentono ai leader di arrivare alle cause profonde di un problema diagnosticato con annotazioni e funzionalità di condivisione che consentono una visualizzazione più dinamica e in tempo reale.

Analisi predittiva: fusione di dati, esplorazione e query

Una volta completato il processo del dashboard, l'aspirante organizzazione basata sui dati potrebbe iniziare a diventare più ambiziosa. Per questo, un tipico passo successivo è "utilizzare dati voluminosi e vari per eseguire analisi più avanzate e fornire ulteriore dimensione al dominio decisionale". Unendo i dati specifici dell'azienda ulteriormente arricchiti con quelli di terze parti, che vanno da fornitori verticali specifici come Experian, Acxiom e D&B a social media o fornitori di dati di vendita come Facebook, Twitter e Salesforce, l'azienda in questione può esplorare più ampi, insiemi più ampi, più vari e statisticamente significativi per nuove e migliori informazioni sulle prestazioni dell'azienda e sul comportamento dei clienti.

Analisi prescrittiva: distribuzione di analisi nei processi aziendali

Le aziende di livello aziendale con esigenze diverse in termini di dati, clienti, normative e problemi/problemi aziendali specifici e con budget e competenze interne diversi avranno probabilmente fornitori di tecnologia che soddisfano le loro esigenze più specifiche. Operano su una scala in cui la capacità di rendere operativa l'analisi nei loro processi e flussi di lavoro aziendali diventa più importante ed economica. Spesso, queste aziende si trovano in settori regolamentati in cui devono essere in grado di dimostrare di disporre di trattamenti equi e ripetibili in atto.

I prestatori non mostrano pregiudizi nelle loro politiche di prestito, sia per sesso, reddito o razza.

Alla questione della responsabilità

Una cosa è determinare un'azione specifica e un'altra è implementarla. Deve esserci una connessione tra diagnosi, prescrizione e decisione e un individuo/gruppo responsabile del risultato desiderato. È qui che il ruolo dello sponsor esecutivo diventa importante.

Sia nelle piccole che nelle grandi aziende, il suddetto sponsor esecutivo, il campione nominato dell'arricchimento dei dati e de facto chief data officer, è un individuo, solitamente CEO, CFO o CMO all'inizio, già ricco di dati e analisi, in sintonia con il tipo di problemi risolti meglio dai dati, o almeno un credente nel potenziale trasformativo dell'analisi dei dati.

Oltre a questo protagonista, il processo in genere richiede anche un campione secondario più pratico, soprattutto quando l'azienda inizia a passare dall'analisi descrittiva a quella predittiva. Tradizionalmente, questa persona era un data scientist internamente formato tecnicamente, ma più recentemente ha assunto la forma di un appassionato di tecnologia, spesso indicato come il citizen data scientist. Questo individuo in genere si auto-seleziona: un fantino sedicente di fogli di calcolo con il giusto equilibrio tra curiosità intellettuale e destrezza, ma disposto a vivere nelle erbacce dell'implementazione. In molti casi, questo individuo è in anticipo rispetto al management nel riconoscere il potenziale di impatto che un processo formale di analisi dei dati può creare presso la propria azienda, ma semplicemente non ha lo status o la credibilità necessari per vendere la propria visione.

Alla questione del problema aziendale

Ogni azienda di successo e in fallimento ha la sua serie unica di sfide affrontabili solo mediante l'appropriata combinazione di risorse, processi e capacità specifiche. Detto questo, i tipi di sfide aziendali più adatte a essere affrontate dai dati possono, il più delle volte, essere ridotte, classificate e affrontate utilizzando il quadro illustrato nel grafico 7.

Inoltre, nel corso degli anni sono state elaborate alcune linee guida/parametri aneddotici, che ottimizzano ulteriormente le possibilità non solo di identificare il giusto tipo di problemi da affrontare con i dati, ma anche le loro possibilità di essere risolti con successo. Queste linee guida/parametri sono i seguenti: in primo luogo, scegliere domande semplici e chiare le cui implicazioni sono molto importanti; secondo, nel cercare risposte dai dati, puntare alla praticità della soluzione piuttosto che alla perfezione di una risposta accademica; terzo, tenere a mente la natura e la base di conoscenze del pubblico destinatario nel fornire la diagnosi e la soluzione; e, infine, selezionare solo problemi misurabili e quantificabili con dati e soluzioni già esistenti che possono, in egual misura, essere tracciati.

Grafico 7: Quadro per l'identificazione del problema aziendale da risolvere

Alla questione degli strumenti e dei metodi giusti

L'ultima delle nostre quattro domande quadro originali, per quanto riguarda la costruzione di un'organizzazione orientata ai dati sostenibile, riguarda la selezione di strumenti, metodi o piattaforme. Per questo, in primo luogo, affermerò che gli strumenti di analisi dei dati si sono evoluti considerevolmente negli ultimi anni, con vari pro e contro per l'utente aziendale. I vantaggi includono un sostanziale calo dei costi associati al noleggio di tali strumenti e un aumento dell'elenco delle funzionalità e della complessità delle opzioni disponibili poiché sono passate da strumenti specifici per funzioni a piattaforme con funzionalità sovrapposte. Inoltre, i fornitori SaaS offrono prove gratuite, anche se con restrizioni sul volume e sul tipo di dati; ai nuovi utenti viene offerta l'opportunità di prendere una decisione di acquisto informata dopo aver testato più piattaforme.

Il principale svantaggio di queste piattaforme è che, nel tentativo di rimanere competitivi tra loro, i fornitori hanno innovato in modo così aggressivo verso la complessità che le loro offerte ora si avvicinano alla saturazione delle funzionalità con offerte che vanno oltre l'utilità degli utenti aziendali medi. Lo sfortunato risultato è la sopraffazione dell'utente inesperto, rendendo più difficile ottenere le "vincite rapide" discusse in precedenza e riducendo così la probabilità che la cultura dei dati prenda piede in una determinata azienda.

Fortunatamente, sono disponibili molte risorse per assistere i potenziali utenti, valutare e confrontare soluzioni di business intelligence concorrenti, sebbene una certa conoscenza delle principali capacità comuni sia utile per valutarle rispetto alle esigenze e priorità specifiche di un'azienda. Alcune di queste funzionalità includono: numero e ambito delle connessioni dati, disponibilità di dashboard preassemblati, funzionalità di drill-down, pubblicazione e condivisione, integrazione con funzionalità di software per la fusione e l'esplorazione dei dati, potenziale di scalabilità (su parametri sia di volume che di varietà), numero e l'accuratezza degli approcci di modellazione e le basi di riferimento dei clienti per settore specifico. Sebbene sia certamente semplice nel suo riassunto, il grafico 7 sopra illustra alcuni fornitori chiave che operano in varie categorie (descrittive, predittive, prescrittive).

Piccoli dati, grandi opportunità

Nonostante i suoi inizi di nicchia, è chiaro che l'analisi dei dati e il mercato degli strumenti di analisi basati su SaaS si sono evoluti considerevolmente negli ultimi anni, a tutto vantaggio del citizen data scientist e della loro azienda. Big data, small data, strumenti self-service: ciascuno di essi è ormai sufficientemente mainstream da giustificare la sua considerazione come competenza fondamentale anche delle aziende meno tecniche. Detto diversamente, con così tanti dati utili e utilizzabili generati e i costi degli strumenti self-service che si spostano inversamente alle funzionalità e alle capacità offerte, continueranno a esistere poche ragioni anche per le piccole imprese per non iniziare a sfruttare i dati in una certa capacità.

Questo articolo avrebbe dovuto illustrare che, con un po' di pianificazione, definizione degli obiettivi e selezione dei clienti, anche la tua startup può iniziare a livellare il campo di gioco competitivo con i titani del settore che hai deciso di distruggere, sbloccando nel frattempo un enorme valore economico per te e i tuoi stakeholder. Hai solo bisogno di iniziare; quindi vai avanti, inizia!