Primer per gli investimenti AI: gettare le basi (Parte I)

Pubblicato: 2022-03-11

Sintesi

Cos'è l'IA?
  • L'intelligenza artificiale (AI), può essere semplicemente spiegata come l'intelligenza dimostrata dalle macchine, in contrasto con l'intelligenza naturale mostrata dagli esseri umani e da altri animali.
  • L'apprendimento automatico è un sottoinsieme di tecniche utilizzate nell'IA e l'apprendimento profondo è un sottoinsieme di tecniche utilizzate nell'apprendimento automatico.
  • Ci sono state tre ondate significative di sviluppo dell'IA. Il primo negli anni '50 e '60, il secondo negli anni '80 e '90 e il terzo è iniziato un decennio fa e ha guadagnato importanza dal 2016 (AlphaGo).
Cosa ha di speciale questa ondata di IA?
  • Questa ondata di intelligenza artificiale è guidata dalla crescita e dalla popolarità del deep learning.
  • Sebbene le tecniche di deep learning siano in circolazione dagli anni '60, la potenza di calcolo e i dati richiesti non erano sufficientemente avanzati per supportare l'applicazione commerciale di massa fino agli ultimi anni.
  • Il motivo per cui il deep learning è così eccitante è che, in poche parole, il deep learning consente prestazioni molto più potenti rispetto ad altri algoritmi di apprendimento.
Componenti chiave di applicazioni AI di successo.
  • Le applicazioni di intelligenza artificiale devono risolvere un problema ben definito (specifico) e desiderabile (mirando ai punti critici dei clienti urgenti e chiari). Riconoscimento facciale, traduzione automatica, auto senza conducente, ottimizzazione dei motori di ricerca, sono tutti problemi desiderabili ben definiti. Tuttavia, la mancanza di problemi desiderabili ben definiti è il motivo per cui è difficile produrre, ad esempio, un robot per la pulizia generale della casa.
  • Gli algoritmi di apprendimento automatico richiedono l'accesso a dati puliti e ben etichettati. Questo esercizio di raccolta dei dati può essere difficile o facile, a seconda dell'applicazione commerciale che stai sviluppando.
  • Un'azienda di intelligenza artificiale deve sviluppare algoritmi robusti e scalabili. Per raggiungere questo obiettivo, ci sono tre elementi indispensabili: una grande quantità di dati ben etichettati, il talento giusto e la fiducia che il deep learning sia la tecnologia corretta per risolvere il problema.
  • Le applicazioni AI di successo richiedono molta potenza di calcolo. Più avanzato è l'algoritmo di intelligenza artificiale (ad es. reti neurali di deep learning), maggiore è la potenza di calcolo richiesta, più costosa sarà l'operazione.

Negli ultimi anni, il mondo ha assistito a un'esplosione di interesse per l'Intelligenza Artificiale (AI). Un concetto un tempo confinato principalmente al genere Sci-Fi, l'IA è diventata parte della nostra vita quotidiana. Ne leggiamo continuamente nei notiziari, vediamo video di robot dall'aspetto spaventoso che ballano sulle note di Uptown Funk e sentiamo come le applicazioni di intelligenza artificiale si insinuano anche nelle sfere più inaspettate della nostra vita quotidiana. Ma è un clamore?

Potrebbe essere. Secondo l'Hype Cycle for Emerging Technologies di Gartner, le tendenze dell'IA democratizzata, tra cui AI PaaS (platform as a service), Intelligenza generale artificiale, Guida autonoma, Deep Learning, sono tutte in vari punti della curva, con le reti neurali profonde che si trovano al culmine di aspettative gonfiate. Tuttavia, stiamo già beneficiando dell'IA ogni giorno. Da Siri a Cortana ad Alexa, ora possiamo conversare con assistenti intelligenti. Dal motore di ricerca basato sull'intelligenza artificiale di Google ai filtri di Instagram, ora godiamo della comodità di risposte rapide e più pertinenti alle nostre esigenze. In Cina, dove l'innovazione dell'IA è fiorente, aziende come la tecnologia di riconoscimento facciale di Face++ stanno potenziando l'autenticazione ID istantanea per le banche, mentre app come TikTok inviano brevi video a milioni di adolescenti (facendo di fatto suscitando notevoli polemiche).

Grafico che mostra il ciclo di hype per le tecnologie emergenti nel 2018.

Personalmente credo che, sebbene ci siano sicuramente alcune aspettative e attività troppo pubblicizzate, l'IA è il futuro . Ho fondato la mia startup di intelligenza artificiale in fase iniziale per cogliere questa opportunità irripetibile di partecipare alla rivoluzione tecnologica. In qualità di ex investitore VC, sono anche costantemente alla ricerca di opportunità di investimento nell'IA. Pertanto, credo che, nonostante l'innegabile rumore che circonda lo spazio, anche l'enorme aumento degli investimenti nell'IA sia giustificato.

Ma con questo in mente, mi sorprende che, in particolare tra la comunità degli investitori, ci sia ancora un grande divario nella comprensione. Gli investitori sono desiderosi di mettere soldi al lavoro, ma spesso mancano di importanti conoscenze di base che, a mio avviso, sono necessarie per essere un investitore efficace in questo spazio. Lo scopo di questo articolo è, quindi, condividere e fornire alcuni contesti e informazioni utili per coloro che sono interessati a investire in questo entusiasmante campo. Data l'ampiezza dell'argomento in questione, ho diviso i miei pensieri in due parti, la prima volta a discutere alcuni elementi essenziali che è necessario conoscere per iniziare il viaggio dell'IA: una sorta di 101. La seconda parte di questa serie sarà più pratica e approfondirà l'argomento su come valutare gli investimenti nell'IA e i diversi modi di investire.

NB Questo post non vuole essere tecnico. Si rivolge agli investitori e alla più ampia comunità finanziaria, e quindi ai lettori non tecnici.

Cos'è l'IA?

In realtà ci sono molte definizioni di IA, quindi quando mi viene chiesto di definirla, spesso per impostazione predefinita uso la buona vecchia Wikipedia, che, per un pubblico non tecnico, penso fornisca una definizione soddisfacente:

L'intelligenza artificiale (AI), a volte chiamata intelligenza artificiale, è l'intelligenza dimostrata dalle macchine, in contrasto con l'intelligenza naturale mostrata dall'uomo e da altri animali.

In altre parole, qualsiasi intelligenza non naturale è intelligenza "artificiale", indipendentemente da come è stata raggiunta. Le tecniche utilizzate per ottenere l'IA includono regole if-then, logica, alberi decisionali, regressioni e machine learning, incluso il deep learning. Uno dei miei strumenti preferiti e divertenti per spiegare come funziona l'IA è questo video su come un computer impara a giocare a Super Mario.

Quando parli di IA, sentirai invariabilmente questi tre termini chiave: IA, machine learning e deep learning. A volte sono usati in modo intercambiabile, ma sono diversi. In poche parole, l'apprendimento automatico è un sottoinsieme di tecniche utilizzate nell'IA. Il deep learning è un sottoinsieme di tecniche utilizzate nell'apprendimento automatico .

Il blog Nvidia fa un bel lavoro nel riassumere la relazione tra i tre termini. Fornisce inoltre una pratica panoramica delle tre ondate di sviluppo dell'IA. La prima ondata di intelligenza artificiale risale agli anni '50 e '60 e ha visto alcune delle prime pietre miliari importanti come quando l'IBM 701 ha vinto la partita di dama sul maestro di dama Robert Nealey. Negli anni '80 e '90, Deep Blue ha battuto il maestro umano Kasparov a scacchi. Nel marzo 2016, AlphaGo ha battuto il giocatore numero 1 di Go Lee Sedol. Ogni volta che l'IA ha battuto i maestri umani nei giochi, ha innescato una nuova fase di clamore per l'IA. Poi, poiché la tecnologia non è in grado di fornire applicazioni che soddisfino le aspettative del pubblico, il clamore dell'IA si trasformerebbe in inverno dell'IA, con investimenti ridotti e sovvenzioni per la ricerca.

Grafico che mostra le diverse fasi di sviluppo dell'IA.

Come accennato in precedenza, l'apprendimento automatico è un sottoinsieme dell'IA. Secondo Nvidia, l'apprendimento automatico nella sua forma più elementare è "la pratica di utilizzare algoritmi per analizzare i dati, imparare da essi e quindi fare una determinazione o una previsione su qualcosa nel mondo. Quindi, anziché codificare manualmente le routine del software con una serie specifica di istruzioni per eseguire un'attività particolare, la macchina viene "addestrata" utilizzando grandi quantità di dati e algoritmi che le danno la possibilità di imparare come eseguire l'attività". Un esempio molto comune di machine learning è il filtro antispam. Il filtro antispam di Google è in grado di riconoscere lo spam identificando parole chiave come "Principe", "Nigeria" e "orologio di lusso". Può anche continuare ad “imparare” dalla classificazione manuale dello spam degli utenti. Ad esempio, un'e-mail con il messaggio "invia $ 1000 per ottenere questo esclusivo farmaco antitumorale sul seguente conto bancario" è stata persa dal filtro antispam di Google. Una volta che un utente lo etichetta come spam, Gmail analizza tutte le parole chiave in quella particolare email e "impara" a trattare le email contenenti le parole combinate di "$ 1000", "droga" e "conto bancario" come spam in futuro. Esistono molti modelli matematici impiegati dai professionisti per eseguire l'apprendimento automatico, ad esempio regressioni, logistica, reti bayesiane, clustering.

Cosa ha di speciale questa ondata di IA?

Questa ondata di intelligenza artificiale è guidata dalla popolarità del deep learning . In quanto sottoinsieme dell'apprendimento automatico, il deep learning non è stato inventato di recente. Infatti, secondo Wikipedia, "il primo algoritmo di apprendimento generale e funzionante per perceptron supervisionati, profondi, feedforward e multistrato è stato pubblicato da Alexey Ivakhnenko e Lapa nel 1965". Tuttavia, poiché la potenza di calcolo e i dati non erano sufficientemente avanzati per supportare l'applicazione commerciale di massa delle tecniche di deep learning, non ha guadagnato popolarità fino al 2006, quando Geoffrey Hinton et al hanno pubblicato il loro articolo fondamentale, "A Fast Learning Algorithm for Deep Belief Reti. Nonostante l'inverno dell'IA degli anni '90 e la prima metà degli anni 2000, alcuni studiosi, inclusi i tre guru accademici del deep learning, Geoffrey Hinton, Yann LeCun e Yoshua Bengio, continuano a lavorare sul deep learning in campo accademico. La rapida scoperta della potenza di calcolo, ad esempio il cloud computing e le GPU, insieme alla disponibilità di big data attraverso l'economia digitale, hanno reso possibile l'implementazione di algoritmi di deep learning nell'ultimo decennio. Ad esempio, la ricerca sulle auto a guida autonoma di Google è iniziata nel 2009.

Tecnicamente il deep learning può essere definito come “una classe di algoritmi di machine learning che:

  • utilizzare una cascata di più livelli di unità di elaborazione non lineari per l'estrazione e la trasformazione delle caratteristiche. Ogni livello successivo utilizza l'output del livello precedente come input.
  • apprendere in modo supervisionato (es. classificazione) e/o non supervisionato (es. analisi di pattern).
  • apprendere più livelli di rappresentazioni che corrispondono a diversi livelli di astrazione; i livelli formano una gerarchia di concetti”.

La chiave è "strati multipli", rispetto al tradizionale machine learning. Ad esempio, come distingueresti un gatto da un cane? Se dovessi utilizzare l'apprendimento automatico, potresti estrarre alcune caratteristiche comuni sia al cane che al gatto, come due orecchie, una faccia pelosa, la distanza tra occhi e naso e bocca, ecc. E potresti ottenere un risultato dicendo l'immagine è 50% cane, 50% gatto - non molto utile. Usando il deep learning, tuttavia, non sai nemmeno quali sono le caratteristiche distintive di un gatto rispetto a un cane, ma la macchina, attraverso più livelli di creazione di nuove funzionalità e centinaia (o migliaia) di modelli statistici, fornirebbe una maggiore output accurato - es. 90% cane, 10% gatto. I due grafici seguenti illustrano come una rete neurale "apprenda" e la differenza tra il classico machine learning e le reti neurali.

Grafici che illustrano come una rete neurale apprende e la differenza tra l'apprendimento automatico classico e le reti neurali.

I lettori potrebbero essere lasciati a grattarsi la testa dopo aver letto quanto sopra, e giustamente. Ma tornando al nostro scopo originale: dal punto di vista di un investitore, cosa c'è di così speciale nel deep learning? Si potrebbe rispondere a questa domanda con varie spiegazioni tecniche ulteriormente complicate, ma in parole povere, il grafico in basso a sinistra fa un ottimo lavoro nel renderlo davvero chiaro: il deep learning consente prestazioni molto più potenti rispetto ad altri algoritmi di apprendimento. Prendi l'esempio del riconoscimento vocale come dettagliato dal blog Microsoft (grafico in basso a destra): il tasso di errore di riconoscimento vocale originale del 1988 era del 60-70%, mentre il nuovo sistema Microsoft che utilizzava il deep learning era solo del 6,3% nel 2014.

Immagine con due grafici che mostrano i dati relativi al deep learning e al progresso storico dei tassi di errore delle parole nel riconoscimento vocale.

Componenti chiave di applicazioni AI di successo

Credo che ci siano 4 componenti chiave per il successo di un prodotto di machine learning (incluso il deep learning): problemi desiderabili ben definiti, dati, algoritmi e potenza di calcolo .

Innanzitutto, l'applicazione di intelligenza artificiale deve risolvere un problema ben definito (specifico) e desiderabile (rivolgendosi ai punti critici dei clienti urgenti e chiari) . Pensa ai diversi giochi a cui è stato insegnato a giocare al computer sulle 3 diverse ondate di intelligenza artificiale: dama, scacchi, Go. Erano problemi molto ben definiti e quindi più facili da risolvere per un computer. Riconoscimento facciale, traduzione automatica, auto senza conducente, ottimizzazione dei motori di ricerca, sono tutti problemi desiderabili ben definiti. Tuttavia, la mancanza di problemi desiderabili ben definiti è il motivo per cui è così difficile produrre, ad esempio, un robot per la pulizia generale della casa. Semplici compiti domestici, come raccogliere le tazze e mettere la biancheria nel cesto, richiedono la risoluzione di troppi problemi. Ad esempio, richiede che la macchina identifichi quali oggetti devono essere raccolti (tazze, biancheria sporca e non pulita, ecc.), dove andare e come raggiungerli (evitare gli ostacoli in casa e raggiungere la posizione), maneggiando ogni oggetto con la potenza desiderata in modo che non rompa la tazza o il bucato, ecc.

In secondo luogo, lo sviluppo di un algoritmo di apprendimento automatico richiede l'accesso a dati puliti e ben etichettati . Questo perché questi algoritmi sono costruiti alimentando a diversi modelli statistici una grande quantità di dati che sono ben etichettati, per stabilire le necessarie relazioni predittive. Questo esercizio di raccolta dei dati può essere difficile o facile, a seconda dell'applicazione commerciale che stai sviluppando. Ad esempio, per raccogliere i dati necessari per sviluppare l'algoritmo di visione artificiale per i campi di uva da vino, la mia startup aveva bisogno di immagini di campi provenienti da luoghi diversi con varietà diverse e stagioni ancora più difficili, diverse. Con ogni stagione di un anno, ci vorranno anni per ottenere prodotti soddisfacenti. Al contrario, se si desidera sviluppare un buon algoritmo di riconoscimento facciale in Cina, per raccogliere ad esempio 10 milioni di immagini, è sufficiente installare una telecamera in una strada trafficata a Pechino per una settimana e completare l'attività. Un altro esempio potrebbe essere l'aggregatore di notizie personalizzate n. 1 basato sull'intelligenza artificiale in Cina, Toutiao, che apprende le tue preferenze personali sulle notizie e ti mostra solo le notizie più rilevanti per te. La raccolta dei dati, in questo caso, è ancora una volta molto più semplice, ad esempio il numero di articoli che leggi in ciascuna categoria di notizie, la quantità di tempo che dedichi a ciascun articolo, ecc.

In terzo luogo, un'azienda di intelligenza artificiale deve sviluppare algoritmi robusti e scalabili . Per raggiungere questo obiettivo, ci sono tre elementi indispensabili: una grande quantità di dati ben etichettati (come discusso sopra), il talento giusto e la fiducia che il deep learning sia la tecnologia corretta per risolvere il problema. Il business dell'IA deve avere il talento giusto per sviluppare gli algoritmi necessari, ma questi sono altamente specializzati, costosi e rari. Ad esempio, quando stavo cercando di assumere per la mia startup, ho scoperto che, come minimo, avevo bisogno di data scientist (di solito dottorandi) per sviluppare prototipi di algoritmi, ingegneri per progettare framework, programmatori (TensorFlow, Python, C++ ecc.) per programmare in programmi scalabili e persone che li mettano insieme (product manager, UX, UI, ecc.).

Un'altra considerazione è la potenza di calcolo . Come mai? Perché le reti neurali di deep learning richiedono molto più calcolo rispetto agli altri metodi di intelligenza artificiale. Ad esempio, per lo stesso compito di identificare un cane in un'immagine, addestrare il modello utilizzando un algoritmo di apprendimento non profondo potrebbe richiedere, ad esempio, 10 modelli statistici con un set di dati di 1 GB. Il modello delle reti neurali profonde potrebbe richiedere, ad esempio, 1000 modelli statistici che attraversano un set di dati di 100 GB. I risultati sono migliori usando le reti, ma la potenza di calcolo richiesta è di gran lunga maggiore. Di conseguenza, questi modelli richiedono non solo un computer (come quello che facciamo sul nostro personal computer), ma elaborazione distribuita con ciascuna GPU che gestisce, ad esempio, il 5% del calcolo, in modo che 20 GPU insieme possano gestire il volume di calcolo richiesto. Questo, a sua volta, significa dover costruire i propri server cluster GPU o affittare la potenza di calcolo da piattaforme come AWS. La potenza di calcolo del cloud computing o dei propri server è costosa, anche se in tutta onestà il costo unitario dell'elaborazione dovrebbe diminuire continuamente (secondo la legge di Moore).

Conclusione

Molti credono che questo sia il momento migliore per vedere le scoperte e le startup dell'IA, perché la digitalizzazione di molti settori e Internet dei consumatori rende disponibile una grande quantità di dati digitali raccolti in modo mirato e organizzati in modo pulito. Lo sviluppo della GPU di Nvidia e dell'FPGA di Intel rende molto più economico e veloce condurre i calcoli necessari. L'attuale ondata di innovazione dell'IA è quindi guidata da importanti progressi nell'apprendimento profondo .

Ma affinché un'applicazione di intelligenza artificiale abbia successo, sono necessari un problema desiderabile ben definito, dati, algoritmo e una potenza di calcolo significativa. Per i dirigenti che leggono questo articolo considerando l'utilizzo dell'IA per potenziare la propria attività, si applicano anche i quattro componenti chiave sopra menzionati.

Come puoi saperne di più sull'IA? Ci sono molti libri, seminari, corsi Coursera, documenti di ricerca e organizzazioni come Deep Learning per conoscere l'IA. Poiché il focus di questo articolo è per gli investitori che vogliono conoscere le basi dell'IA, non ho toccato molti degli argomenti caldi dell'IA come il potenziale dell'IA come minaccia, le prospettive future del settore, gli investimenti nell'IA, i professionisti e contro di diversi algoritmi (ad es. CNN), prototipazione e ridimensionamento, principali linguaggi di programmazione, ecc. Nella parte 2 di questa serie, analizzerò come valutare le società di intelligenza artificiale dal punto di vista dell'investitore.