AI Investment Primer: Punerea bazei (Partea I)

Publicat: 2022-03-11

Rezumat

Ce este AI?

Inteligența artificială (IA) poate fi explicată pur și simplu ca inteligență demonstrată de mașini, în contrast cu inteligența naturală afișată de oameni și alte animale.
Învățarea automată este un subset de tehnici utilizate în AI, iar învățarea profundă este un subset de tehnici utilizate în învățarea automată.
Au existat trei valuri semnificative de dezvoltare a AI. Primul în anii 50 și 60, al doilea în anii 80 și 90, iar al treilea a început în urmă cu un deceniu și a câștigat proeminență din 2016 (AlphaGo).

Ce este special la acest val de AI?

Acest val de IA este condus de creșterea și popularitatea învățării profunde.
În timp ce tehnicile de învățare profundă există încă din anii 60, puterea de calcul și datele necesare nu au fost suficient de avansate pentru a susține aplicarea comercială în masă până în ultimii câțiva ani.
Motivul pentru care învățarea profundă este atât de interesantă este că, simplu spus, învățarea profundă permite performanțe mult mai puternice decât alți algoritmi de învățare.

Componentele cheie ale aplicațiilor AI de succes.

Aplicațiile de inteligență artificială trebuie să rezolve o problemă bine definită (specifică) și dezirabilă (vizând punctele critice urgente și clare ale clienților). Recunoașterea facială, traducerea automată, mașinile fără șofer, optimizarea motoarelor de căutare sunt toate probleme de dorit bine definite. Cu toate acestea, lipsa unor probleme bine definite de dorit este motivul pentru care este dificil să se producă, de exemplu, un robot general de curățare a casei.
Algoritmii de învățare automată necesită acces la date curate și bine etichetate. Acest exercițiu de colectare a datelor poate fi dificil sau ușor, în funcție de aplicația comercială pe care o dezvoltați.
O afacere AI trebuie să dezvolte algoritmi robusti și scalabili. Pentru a realiza acest lucru, există trei elemente obligatorii: o cantitate mare de date bine etichetate, talentul potrivit și încrederea că învățarea profundă este tehnologia corectă pentru a rezolva problema.
Aplicațiile AI de succes necesită multă putere de calcul. Cu cât algoritmul de inteligență artificială este mai avansat (de exemplu, rețele neuronale de învățare profundă), cu atât este nevoie de mai multă putere de calcul, cu atât operația este mai costisitoare.

În ultimii ani, lumea a fost martoră la o explozie de interes în jurul Inteligenței Artificiale (AI). Un concept cândva limitat în primul rând la genul Sci-Fi, AI a devenit parte din viața noastră de zi cu zi. Citim despre asta tot timpul în știri, vedem videoclipuri cu roboți cu aspect înfricoșător care dansează pe melodia Uptown Funk și auzim despre cum aplicațiile AI se strecoară chiar și în cele mai neașteptate sfere ale vieții noastre de zi cu zi. Dar este un hype?

Ar putea fi. Conform Hype Cycle for Emerging Technologies de la Gartner, tendințele IA democratizate, inclusiv AI PaaS (platformă ca serviciu), inteligența generală artificială, conducerea autonomă, învățarea profundă, sunt toate în diferite puncte ale curbei, cu rețele neuronale profunde fiind în vârful așteptări umflate. Cu toate acestea, beneficiem deja de AI în fiecare zi. De la Siri la Cortana la Alexa, acum putem conversa cu asistenți inteligenți. De la motorul de căutare bazat pe inteligență artificială de la Google până la filtrele Instagram, acum ne bucurăm de confortul unor răspunsuri rapide și mai relevante la nevoile noastre. În China, unde inovația AI prosperă, companii precum tehnologia de recunoaștere facială de la Face++ alimentează autentificarea instantanee a ID-ului pentru bănci, în timp ce aplicații precum TikTok transmit videoclipuri scurte către milioane de adolescenți (de fapt, provocând controverse considerabile în acest sens).

Grafic care arată ciclul de hype pentru tehnologiile emergente în 2018.

Personal cred că, deși există cu siguranță niște așteptări și afaceri exagerate, AI este viitorul . Mi-am înființat propriul startup AI în stadiu incipient pentru a captura această oportunitate o dată în viață de a participa la revoluția tehnologiei. În calitate de fost investitor VC, caut în mod constant oportunități de investiții în IA. Prin urmare, cred că, în ciuda zgomotului incontestabil din jurul spațiului, creșterea uriașă a investițiilor în inteligență artificială este, de asemenea, justificată.

Dar având în vedere acest lucru, mă surprinde faptul că, în special în rândul comunității investiționale, există încă un decalaj mare în înțelegere. Investitorii sunt dornici să pună bani la lucru, dar adesea le lipsesc cunoștințele de bază importante care, în opinia mea, sunt necesare pentru a fi un investitor eficient în acest spațiu. Scopul acestui articol este, prin urmare, de a împărtăși și de a oferi un context și informații utile pentru cei interesați să investească în acest domeniu interesant. Având în vedere amploarea subiectului la îndemână, mi-am împărțit gândurile în două părți, prima menită să discute câteva elemente esențiale pe care trebuie să le cunoașteți pentru a începe călătoria AI - un fel de 101. A doua parte a acestei serii va fi mai practică și va aprofunda subiectul cum să evaluăm investițiile AI și diferitele moduri de a investi.

NB Această postare nu este menită să fie tehnică. Se adresează investitorilor și comunității financiare mai largi și, prin urmare, cititorilor non-tehnici.

Ce este AI?

Există, de fapt, multe definiții ale inteligenței artificiale, așa că atunci când mi se cere să o definesc, deseori folosesc în mod implicit Wikipedia vechea, care, pentru publicul non-tehnic, cred că oferă o definiție satisfăcătoare:

Inteligența artificială (IA), numită uneori inteligență mașină, este inteligența demonstrată de mașini, în contrast cu inteligența naturală afișată de oameni și alte animale.

Cu alte cuvinte, orice inteligență non-naturală este inteligență „artificială”, indiferent de modul în care este obținută. Tehnicile utilizate pentru realizarea AI includ reguli dacă-atunci, logica, arbori de decizie, regresii și învățarea automată, inclusiv învățarea profundă. Unul dintre instrumentele mele preferate și distractive pentru a explica cum funcționează AI este acest videoclip despre modul în care un computer învață să joace Super Mario.

Când vorbiți despre AI, veți auzi invariabil acești trei termeni cheie: AI, învățare automată și învățare profundă. Uneori sunt folosite interschimbabil, dar sunt diferite. Mai simplu spus, învățarea automată este un subset de tehnici utilizate în AI. Învățarea profundă este un subset de tehnici utilizate în învățarea automată .

Blogul Nvidia face o treabă bună de a rezuma relația dintre cei trei termeni. De asemenea, oferă o imagine de ansamblu utilă a celor trei valuri de dezvoltare a AI. Primul val de IA a fost în anii 50 și 60 și a văzut unele dintre primele etape majore, cum ar fi atunci când IBM 701 a câștigat jocul de dame în fața maestrului de dame Robert Nealey. În anii 80 și 90, Deep Blue l-a învins pe maestrul uman Kasparov la șah. În martie 2016, AlphaGo l-a învins pe jucătorul numărul 1 Go, Lee Sedol. De fiecare dată când AI i-a învins pe maeștri umani în jocuri, a declanșat o nouă etapă de hype pentru AI. Apoi, deoarece tehnologia nu ar putea furniza aplicații care să răspundă așteptărilor publicului, hype-ul AI s-ar transforma în iarnă AI, cu investiții și granturi de cercetare diminuate.

Grafic care arată diferitele faze ale dezvoltării AI.

După cum am menționat anterior, învățarea automată este un subset al AI. Potrivit Nvidia, învățarea automată este „practica de a utiliza algoritmi pentru a analiza datele, a învăța din acestea și apoi a face o determinare sau o predicție despre ceva din lume. Deci, în loc să codifice manual rutine software cu un set specific de instrucțiuni pentru a îndeplini o anumită sarcină, mașina este „antrenată” folosind cantități mari de date și algoritmi care îi oferă capacitatea de a învăța cum să îndeplinească sarcina.” Un exemplu foarte comun de învățare automată este filtrul de spam. Filtrul de spam al Google poate recunoaște spam-ul identificând cuvinte de declanșare precum „Prinț”, „Nigeria” și „ceas de lux”. De asemenea, poate continua să „învețe” din clasificarea manuală a spam-ului de către utilizatori. De exemplu, un e-mail cu mesajul „trimiteți 1000 USD pentru a primi acest medicament exclusiv împotriva cancerului în următorul cont bancar” a fost omis de filtrul de spam al Google. Odată ce un utilizator îl etichetează ca spam, Gmail analizează toate cuvintele cheie din acel e-mail specific și „învață” să trateze e-mailurile care conțin cuvintele combinate „1000 USD”, „medicament” și „cont bancar” ca spam în viitor. Există multe modele matematice folosite de profesioniști pentru a face învățarea automată, de exemplu regresii, logistică, rețele bayesiene, clustering.

Ce este special la acest val de AI?

Acest val de IA este condus de popularitatea învățării profunde . Ca un subset al învățării automate, învățarea profundă nu a fost inventată recent. De fapt, conform Wikipedia, „primul algoritm de învățare general, de lucru pentru perceptroni multistrat supravegheați, profund, cu feedforward, a fost publicat de Alexey Ivakhnenko și Lapa în 1965”. Cu toate acestea, deoarece puterea de calcul și datele nu au fost suficient de avansate pentru a sprijini aplicarea comercială în masă a tehnicilor de învățare profundă, nu a câștigat popularitate până în 2006, când Geoffrey Hinton și colab. au publicat lucrarea lor fundamentală, „A Fast Learning Algorithm for Deep Belief Plase.” În ciuda iernii AI a anilor 90 și a primei jumătăți a anilor 2000, câțiva savanți, inclusiv cei trei guru academicieni ai învățării profunde, Geoffrey Hinton, Yann LeCun și Yoshua Bengio, continuă să lucreze la învățarea profundă în domeniul academic. Descoperirea rapidă a puterii de calcul, de exemplu, cloud computing și GPU, împreună cu disponibilitatea datelor mari prin economia digitală, au făcut posibilă implementarea algoritmilor de învățare profundă în ultimul deceniu. De exemplu, cercetarea Google a mașinilor autonome a început în 2009.

Tehnic vorbind, învățarea profundă poate fi definită ca „o clasă de algoritmi de învățare automată care:

utilizați o cascadă de mai multe straturi de unități de procesare neliniare pentru extragerea și transformarea caracteristicilor. Fiecare strat succesiv folosește ieșirea din stratul anterior ca intrare.
învățați în mod supravegheat (de exemplu, clasificare) și/sau nesupravegheat (de exemplu, analiza modelului).
învață mai multe niveluri de reprezentări care corespund diferitelor niveluri de abstractizare; nivelurile formează o ierarhie de concepte.”

Cheia este „straturi multiple”, în comparație cu învățarea automată tradițională. De exemplu, cum ați deosebi o pisică de un câine? Dacă ar fi să utilizați învățarea automată, ați putea extrage câteva caracteristici comune atât câinelui, cât și pisicilor, cum ar fi două urechi, o față blănoasă, distanța dintre ochi și nas și gură etc. Și ați putea obține un rezultat care spune poza este 50% câine, 50% pisică - nu foarte util. Folosind învățarea profundă, totuși, nici măcar nu știi care sunt trăsăturile distinctive ale unei pisici față de un câine, dar mașina, prin mai multe straturi de creare de noi caracteristici și sute (sau mii) de modele statistice, ar oferi o mai mare măsură. ieșire precisă - de exemplu 90% câine, 10% pisică. Cele două diagrame de mai jos ilustrează modul în care o rețea neuronală „învață” și diferența dintre învățarea automată clasică și rețelele neuronale.

Diagrame care ilustrează modul în care o rețea neuronală învață și diferența dintre învățarea automată clasică și rețelele neuronale.

Cititorii ar putea fi lăsați să se scarpină după ce au citit cele de mai sus și pe bună dreptate. Dar revenind la scopul nostru inițial: din punctul de vedere al unui investitor, ce este atât de special la deep learning? S-ar putea răspunde la această întrebare cu mai multe explicații tehnice complicate, dar, într-adevăr, simplu spus, graficul de mai jos din stânga face o treabă grozavă de a face cu adevărat clar: învățarea profundă permite performanțe mult mai puternice decât alți algoritmi de învățare. Luați exemplul recunoașterii vorbirii, așa cum este detaliat de blogul Microsoft (graficul de mai jos din dreapta): rata inițială a erorilor de recunoaștere a vorbirii din 1988 a fost de 60-70%, în timp ce noul sistem Microsoft care folosea învățarea profundă a fost de doar 6,3% în 2014.

Imagine cu două grafice care arată date privind învățarea profundă și progresul istoric al ratelor de eroare a cuvintelor de recunoaștere a vorbirii.

Componentele cheie ale aplicațiilor AI de succes

Cred că există 4 componente cheie pentru succesul unui produs de învățare automată (inclusiv învățarea profundă): probleme de dorit bine definite, date, algoritm(i) și puterea de calcul .

În primul rând, aplicația AI trebuie să rezolve o problemă bine definită (specifică) și dezirabilă (vizând punctele dureroase ale clienților urgente și clare) . Gândiți-vă la diferitele jocuri pe care computerul a fost învățat să le joace în cele 3 valuri diferite de AI: damă, șah, Go. Erau probleme foarte bine definite și, prin urmare, mai ușor de rezolvat pentru un computer. Recunoașterea facială, traducerea automată, mașinile fără șofer, optimizarea motoarelor de căutare sunt toate probleme de dorit bine definite. Cu toate acestea, lipsa unor probleme dezirabile bine definite este motivul pentru care este atât de dificil să se producă, de exemplu, un robot de curățare generală a casei. Sarcinile casnice simple, de exemplu colectarea paharelor și punerea rufelor în coș, necesită rezolvarea prea multor probleme. De exemplu, necesită ca mașina să identifice ce obiecte trebuie să fie ridicate (cești, rufe murdare și rufe nu curate etc.), unde să meargă și cum să meargă acolo (evitați obstacolele din gospodărie și călătoriți la locul dorit). locație), manevrând fiecare obiect cu puterea dorită pentru a nu sparge ceașca sau rufele etc.

În al doilea rând, dezvoltarea unui algoritm de învățare automată necesită acces la date curate și bine etichetate . Acest lucru se datorează faptului că acești algoritmi sunt construiți prin alimentarea diferitelor modele statistice cu o cantitate mare de date care sunt bine etichetate, pentru a stabili relațiile predictive necesare. Acest exercițiu de colectare a datelor poate fi dificil sau ușor, în funcție de aplicația comercială pe care o dezvoltați. De exemplu, pentru a colecta datele necesare pentru a dezvolta algoritmul de viziune computerizată pentru câmpurile de struguri de vin, startup-ul meu avea nevoie de imagini de câmp din diferite locații, cu diferite soiuri și mai dificil încă - diferite anotimpuri. Fiindcă fiecare sezon fiind de un an, va dura ani pentru a obține produse satisfăcătoare. În schimb, dacă doriți să dezvoltați un algoritm bun de recunoaștere facială în China, pentru a colecta de exemplu 10 milioane de imagini, trebuie doar să instalați o cameră pe o stradă aglomerată din Beijing timp de o săptămână și sarcina finalizată. Un alt exemplu ar fi agregatorul de știri personalizat #1 din China, Toutiao, care află despre preferințele tale personale de știri și îți arată doar cele mai relevante știri pentru tine. Colectarea datelor, în acest caz, este din nou mult mai ușoară, de exemplu, numărul de articole pe care le citești în fiecare categorie de știri, timpul petrecut pentru fiecare articol etc.

În al treilea rând, o afacere AI trebuie să dezvolte algoritmi robusti și scalabili . Pentru a realiza acest lucru, există trei elemente obligatorii: o cantitate mare de date bine etichetate (după cum am discutat mai sus), talentul potrivit și încrederea că învățarea profundă este tehnologia corectă pentru a rezolva problema. Afacerile cu inteligență artificială trebuie să aibă talentul potrivit pentru a dezvolta algoritmii necesari, dar aceștia sunt foarte specializați, scumpi și rare. De exemplu, când căutam să angajez pentru startup-ul meu, am descoperit că, cel puțin, aveam nevoie de oameni de știință în date (de obicei doctori) care să dezvolte prototipuri de algoritm, ingineri care să proiecteze cadre, programatori (TensorFlow, Python, C++ etc.) pentru a codifica în programe scalabile și oameni care să le pună împreună (manager de produs, UX, UI etc.).

Un alt aspect este puterea de calcul . De ce? Deoarece rețelele neuronale de învățare profundă necesită mult mai mult calcul decât celelalte metode AI. De exemplu, pentru aceeași sarcină de identificare a unui câine într-o imagine, antrenamentul modelului folosind algoritm de învățare non-profundă ar putea avea nevoie, să zicem, de 10 modele statistice, având în vedere un set de date de 1 GB. Modelul rețelelor neuronale profunde ar putea avea nevoie, să zicem, de 1000 de modele statistice care rulează printr-un set de date de 100 GB. Rezultatele sunt mai bune folosind rețele, dar puterea de calcul necesară este mult mai mare. Drept urmare, aceste modele necesită nu doar un computer (cum ar fi ceea ce facem pe computerul nostru personal), ci calcul distribuit cu fiecare GPU care gestionează, să zicem, 5% din calcul, astfel încât 20 de GPU-uri împreună să poată gestiona volumul de calcul necesar. Aceasta, la rândul său, înseamnă că trebuie să vă construiți propriile servere de cluster GPU sau să închiriați puterea de calcul de la platforme precum AWS. Puterea de calcul fie din cloud computing, fie din propriile servere este costisitoare, deși, în mod echitabil, costul unitar al calculului ar trebui să scadă continuu (conform legii lui Moore).

Concluzie

Mulți cred că acum este cel mai bun moment pentru a vedea descoperiri și startup-uri în domeniul inteligenței artificiale, deoarece digitalizarea multor industrii și internetul pentru consumatori face disponibile o cantitate mare de date digitale colectate intenționat, organizate în mod curat. Dezvoltarea GPU-ului Nvidia și a FPGA-ului Intel face ca efectuarea calculelor necesare este mult mai ieftină și mai rapidă. Valul actual de inovare AI este, prin urmare, condus de progrese importante în învățarea profundă .

Dar pentru ca o aplicație AI să aibă succes, este nevoie de o problemă bine definită, de date, de un algoritm și de o putere de calcul semnificativă. Pentru directorii care citesc acest articol și iau în considerare utilizarea AI pentru a-și împuternici afacerea, se aplică și cele patru componente cheie menționate mai sus.

Cum poți afla mai multe despre AI? Există o mulțime de cărți, seminarii, cursuri Coursera, lucrări de cercetare și organizații precum Deep Learning pentru a afla despre AI. Deoarece acest articol se concentrează pe investitorii care doresc să cunoască elementele de bază ale AI, nu am atins multe dintre subiectele fierbinți ale AI, cum ar fi potențialul AI ca amenințare, perspectivele de viitor ale industriei, investițiile AI, profesioniștii. și dezavantajele diferiților algoritmi (de ex. CNN), prototipare vs scalare, limbaje majore de programare etc. În partea a 2-a a acestei serii, voi aprofunda cum să evaluez companiile AI din perspectiva investitorilor.