Introduction à l'investissement dans l'IA : Jeter les bases (Partie I)
Publié: 2022-03-11Résumé
Qu'est-ce que l'IA ?
- L'intelligence artificielle (IA) peut être expliquée simplement comme l'intelligence démontrée par les machines, contrairement à l'intelligence naturelle affichée par les humains et les autres animaux.
- L'apprentissage automatique est un sous-ensemble de techniques utilisées dans l'IA, et l'apprentissage en profondeur est un sous-ensemble de techniques utilisées dans l'apprentissage automatique.
- Il y a eu trois vagues importantes de développement de l'IA. Le premier dans les années 50 et 60, le second dans les années 80 et 90, et le troisième a commencé il y a une décennie et a pris de l'importance depuis 2016 (AlphaGo).
Quelle est la particularité de cette vague d'IA ?
- Cette vague d'IA est portée par la croissance et la popularité de l'apprentissage en profondeur.
- Alors que les techniques d'apprentissage en profondeur existent depuis les années 60, la puissance de calcul et les données requises n'étaient pas suffisamment avancées pour prendre en charge des applications commerciales de masse jusqu'à ces dernières années.
- La raison pour laquelle l'apprentissage en profondeur est si excitant est que, tout simplement, l'apprentissage en profondeur permet des performances beaucoup plus puissantes que les autres algorithmes d'apprentissage.
Composants clés des applications d'IA réussies.
- Les applications d'IA doivent résoudre un problème bien défini (spécifique) et souhaitable (ciblant les problèmes urgents et clairs des clients). La reconnaissance faciale, la traduction automatique, les voitures sans conducteur, l'optimisation des moteurs de recherche sont tous des problèmes souhaitables bien définis. Cependant, le manque de problèmes souhaitables bien définis est la raison pour laquelle il est difficile de produire, par exemple, un robot de nettoyage général.
- Les algorithmes d'apprentissage automatique nécessitent un accès à des données propres et bien étiquetées. Cet exercice de collecte de données peut être difficile ou facile, selon l'application commerciale que vous développez.
- Une entreprise d'IA doit développer des algorithmes robustes et évolutifs. Pour y parvenir, il y a trois éléments indispensables : une grande quantité de données bien étiquetées, le bon talent et la certitude que l'apprentissage en profondeur est la bonne technologie pour résoudre le problème.
- Les applications d'IA réussies nécessitent beaucoup de puissance de calcul. Plus l'algorithme d'intelligence artificielle est avancé (par exemple, les réseaux de neurones d'apprentissage en profondeur), plus la puissance de calcul requise est importante, plus l'opération à accomplir est coûteuse.
Au cours des dernières années, le monde a été témoin d'une explosion d'intérêt pour l'intelligence artificielle (IA). Un concept autrefois confiné principalement au genre Sci-Fi, l'IA fait désormais partie de notre vie quotidienne. Nous lisons tout le temps à ce sujet dans les actualités, voyons des vidéos de robots effrayants dansant sur l'air d' Uptown Funk et entendons parler de la façon dont les applications d'IA se glissent dans les sphères les plus inattendues de notre vie quotidienne. Mais est-ce un battage médiatique?
Il pourrait être. Selon le Hype Cycle for Emerging Technologies de Gartner, les tendances de l'IA démocratisée, notamment l'IA PaaS (plate-forme en tant que service), l'intelligence artificielle générale, la conduite autonome, l'apprentissage en profondeur, se situent toutes à différents points de la courbe, les réseaux de neurones profonds étant au sommet de attentes gonflées. Cependant, nous bénéficions déjà tous les jours de l'IA. De Siri à Cortana en passant par Alexa, nous pouvons désormais converser avec des assistants intelligents. Du moteur de recherche alimenté par l'IA de Google aux filtres Instagram, nous bénéficions désormais de la commodité de réponses rapides et plus pertinentes à nos besoins. En Chine, où l'innovation en matière d'intelligence artificielle est en plein essor, des entreprises telles que la technologie de reconnaissance faciale de Face++ alimentent l'authentification instantanée de l'identité pour les banques, tandis que des applications telles que TikTok diffusent de courtes vidéos à des millions d'adolescents (ce qui suscite en fait une controverse considérable).
Je crois personnellement que bien qu'il y ait certainement des attentes et des entreprises exagérées, l' IA est l'avenir . J'ai fondé ma propre start-up d'intelligence artificielle pour saisir cette opportunité unique de participer à la révolution technologique. En tant qu'ancien investisseur en capital-risque, je suis également constamment à la recherche d'opportunités d'investissement dans l'IA. Je pense donc que, malgré le bruit indéniable qui entoure l'espace, l'énorme augmentation des investissements dans l'IA est également justifiée.
Mais dans cet esprit, je suis surpris que, en particulier parmi la communauté des investisseurs, il y ait encore un grand écart de compréhension. Les investisseurs sont désireux de faire travailler l'argent, mais ils manquent souvent de connaissances de base importantes qui, à mon avis, sont nécessaires pour être un investisseur efficace dans cet espace. Le but de cet article est donc de partager et de fournir un contexte et des informations utiles à ceux qui souhaitent investir dans ce domaine passionnant. Compte tenu de l'ampleur du sujet à traiter, j'ai divisé mes réflexions en deux parties, la première visant à discuter de quelques éléments essentiels qu'il faut connaître pour se lancer dans l'aventure de l'IA - une sorte de 101. La deuxième partie de cette série sera plus pratique et approfondira le sujet de l'évaluation des investissements en IA et des différentes façons d'investir.
NB Cet article ne se veut pas technique. Il s'adresse aux investisseurs et à la communauté financière au sens large, et donc aux lecteurs non techniques.
Qu'est-ce que l'IA ?
Il existe en fait de nombreuses définitions de l'IA, donc quand on me demande de la définir, je me base souvent par défaut sur le bon vieux Wikipédia, qui, pour un public non technique, fournit, je pense, une définition satisfaisante :
L'intelligence artificielle (IA), parfois appelée intelligence artificielle, est l'intelligence démontrée par les machines, contrairement à l'intelligence naturelle dont font preuve les humains et les autres animaux.
En d'autres termes, toute intelligence non naturelle est une intelligence "artificielle", quelle que soit la manière dont elle est obtenue. Les techniques utilisées pour réaliser l'IA comprennent les règles si-alors, la logique, les arbres de décision, les régressions et l'apprentissage automatique, y compris l'apprentissage en profondeur. L'un de mes outils préférés et amusants pour expliquer le fonctionnement de l'IA est cette vidéo sur la façon dont un ordinateur apprend à jouer à Super Mario.
Lorsque vous parlez d'IA, vous entendrez invariablement ces trois termes clés : IA, apprentissage automatique et apprentissage en profondeur. Ils sont parfois utilisés de manière interchangeable, mais ils sont différents. En termes simples, l'apprentissage automatique est un sous-ensemble de techniques utilisées dans l'IA. L'apprentissage en profondeur est un sous-ensemble de techniques utilisées dans l'apprentissage automatique .
Le blog Nvidia fait un bon travail en résumant la relation entre les trois termes. Il fournit également un aperçu pratique des trois vagues de développement de l'IA. La première vague d'IA a eu lieu dans les années 50 et 60 et a vu certains des premiers jalons majeurs, comme lorsque l'IBM 701 a remporté le jeu de dames contre le maître des dames Robert Nealey. Dans les années 80 et 90, Deep Blue a battu le maître humain Kasparov aux échecs. En mars 2016, AlphaGo a battu le joueur n ° 1 Go Lee Sedol. Chaque fois que l'IA battait les maîtres humains dans les jeux, cela déclenchait une nouvelle étape de battage médiatique pour l'IA. Ensuite, comme la technologie ne pouvait pas fournir d'applications à la hauteur des attentes du public, le battage médiatique de l'IA se transformerait en hiver de l'IA, avec des investissements et des subventions de recherche en baisse.
Comme mentionné précédemment, l'apprentissage automatique est un sous-ensemble de l'IA. Selon Nvidia, l'apprentissage automatique dans sa forme la plus élémentaire est «la pratique consistant à utiliser des algorithmes pour analyser des données, en tirer des leçons, puis faire une détermination ou une prédiction sur quelque chose dans le monde. Ainsi, plutôt que de coder manuellement des routines logicielles avec un ensemble spécifique d'instructions pour accomplir une tâche particulière, la machine est "formée" à l'aide de grandes quantités de données et d'algorithmes qui lui permettent d'apprendre à effectuer la tâche. Un exemple très courant d'apprentissage automatique est le filtre anti-spam. Le filtre anti-spam de Google peut reconnaître le spam en identifiant des mots déclencheurs tels que "Prince", "Nigeria" et "montre de luxe". Il peut également continuer à « apprendre » de la classification manuelle des spams par les utilisateurs. Par exemple, un e-mail contenant le message « Envoyez 1 000 $ pour obtenir ce médicament anticancéreux exclusif sur le compte bancaire suivant » n'a pas été détecté par le filtre anti-spam de Google. Une fois qu'un utilisateur l'a qualifié de spam, Gmail analyse tous les mots-clés de cet e-mail particulier et "apprend" à traiter les e-mails contenant les mots combinés "1 000 $", "drogue" et "compte bancaire" comme du spam à l'avenir. Il existe de nombreux modèles mathématiques utilisés par les professionnels pour faire de l'apprentissage automatique, par exemple les régressions, la logistique, les réseaux bayésiens, le clustering.
Quelle est la particularité de cette vague d'IA ?
Cette vague d'IA est portée par la popularité de l'apprentissage en profondeur . En tant que sous-ensemble de l'apprentissage automatique, l'apprentissage en profondeur n'a pas été inventé récemment. En fait, selon Wikipedia, "le premier algorithme d'apprentissage général et fonctionnel pour les perceptrons multicouches supervisés, profonds, à anticipation a été publié par Alexey Ivakhnenko et Lapa en 1965". Cependant, comme la puissance de calcul et les données n'étaient pas suffisamment avancées pour prendre en charge l'application commerciale de masse des techniques d'apprentissage en profondeur, elles n'ont gagné en popularité qu'en 2006, lorsque Geoffrey Hinton et al ont publié leur article fondateur, "A Fast Learning Algorithm for Deep Belief". Filets. Malgré l'hiver de l'IA des années 90 et la première moitié des années 2000, quelques chercheurs, dont les trois gourous académiques de l'apprentissage en profondeur, Geoffrey Hinton, Yann LeCun et Yoshua Bengio, continuent de travailler sur l'apprentissage en profondeur dans le domaine universitaire. La percée rapide de la puissance de calcul, par exemple, le cloud computing et les GPU, associée à la disponibilité des mégadonnées grâce à l'économie numérique, ont rendu possible la mise en œuvre d'algorithmes d'apprentissage en profondeur au cours de la dernière décennie. Par exemple, la recherche sur les voitures autonomes de Google a commencé en 2009.

Techniquement parlant, l'apprentissage en profondeur peut être défini comme « une classe d'algorithmes d'apprentissage automatique qui :
- utiliser une cascade de plusieurs couches d'unités de traitement non linéaires pour l'extraction et la transformation de caractéristiques. Chaque couche successive utilise la sortie de la couche précédente comme entrée.
- apprendre de manière supervisée (par exemple, classification) et/ou non supervisée (par exemple, analyse de modèles).
- apprendre plusieurs niveaux de représentations qui correspondent à différents niveaux d'abstraction ; les niveaux forment une hiérarchie de concepts.
La clé est « plusieurs couches », par rapport à l'apprentissage automatique traditionnel. Par exemple, comment distingueriez-vous un chat d'un chien ? Si vous deviez utiliser l'apprentissage automatique, vous pourriez extraire quelques caractéristiques communes aux chiens et aux chats, telles que deux oreilles, un visage poilu, la distance entre les yeux, le nez et la bouche, etc. Et vous pourriez obtenir un résultat disant l'image est 50% chien, 50% chat - pas très utile. En utilisant l'apprentissage en profondeur, cependant, vous ne savez même pas quelles sont les caractéristiques distinctives d'un chat par rapport à un chien, mais la machine, à travers plusieurs couches de création de nouvelles fonctionnalités et des centaines (ou des milliers) de modèles statistiques, fournirait un plus sortie précise - par exemple 90% chien, 10% chat. Les deux graphiques ci-dessous illustrent comment un réseau de neurones "apprend" et la différence entre l'apprentissage automatique classique et les réseaux de neurones.
Les lecteurs pourraient se gratter la tête après avoir lu ce qui précède, et à juste titre. Mais revenons à notre objectif initial : du point de vue d'un investisseur, qu'y a-t-il de si spécial dans l'apprentissage en profondeur ? On pourrait répondre à cette question avec diverses explications techniques plus compliquées, mais en termes simples, le graphique ci-dessous à gauche fait un excellent travail pour le rendre vraiment clair : l'apprentissage en profondeur permet des performances beaucoup plus puissantes que les autres algorithmes d'apprentissage. Prenons l'exemple de la reconnaissance vocale telle que détaillée par le blog de Microsoft (graphique ci-dessous à droite) : le taux d'erreur de reconnaissance vocale d'origine en 1988 était de 60 à 70 %, tandis que le nouveau système Microsoft utilisant l'apprentissage en profondeur n'était que de 6,3 % en 2014.
Composants clés des applications d'IA réussies
Je pense que le succès d'un produit d'apprentissage automatique (y compris l'apprentissage en profondeur) repose sur 4 éléments clés : des problèmes souhaitables bien définis, les données, le ou les algorithmes et la puissance de calcul .
Avant tout, l'application d'IA doit résoudre un problème bien défini (spécifique) et souhaitable (ciblant les problèmes urgents et clairs des clients) . Pensez aux différents jeux auxquels l'ordinateur a appris à jouer au cours des 3 différentes vagues d'IA : dames, échecs, Go. Il s'agissait de problèmes très bien définis et donc plus faciles à résoudre pour un ordinateur. La reconnaissance faciale, la traduction automatique, les voitures sans conducteur, l'optimisation des moteurs de recherche sont tous des problèmes souhaitables bien définis. Cependant, le manque de problèmes souhaitables bien définis est la raison pour laquelle il est si difficile de produire, par exemple, un robot de nettoyage domestique général. De simples tâches ménagères, par exemple ramasser les tasses et mettre le linge dans le panier, nécessitent de résoudre trop de problèmes. Par exemple, il faut que la machine identifie quels objets doivent être ramassés (gobelets, linge sale et non propre, etc.), où aller et comment s'y rendre (éviter les obstacles dans le ménage et se rendre à l'endroit souhaité emplacement), manipulant chaque objet avec la puissance souhaitée pour ne pas casser la tasse ou le linge, etc.
Deuxièmement, le développement d'un algorithme d'apprentissage automatique nécessite l'accès à des données propres et bien étiquetées . En effet, ces algorithmes sont construits en alimentant différents modèles statistiques d'une grande quantité de données bien étiquetées, pour établir les relations prédictives nécessaires. Cet exercice de collecte de données peut être difficile ou facile, selon l'application commerciale que vous développez. Par exemple, pour collecter les données nécessaires au développement d'un algorithme de vision par ordinateur pour les champs de raisins de cuve, ma startup avait besoin d'images de champs de différents endroits avec différentes variétés et plus difficiles encore - différentes saisons. Chaque saison étant d'un an, il faudra des années pour obtenir des produits satisfaisants. En revanche, si vous souhaitez développer un bon algorithme de reconnaissance faciale en Chine, pour collecter par exemple 10 millions d'images, il vous suffit d'installer une caméra dans une rue animée de Pékin pendant une semaine et la tâche est terminée. Un autre exemple serait l'agrégateur d'actualités personnalisées n° 1 basé sur l'IA en Chine, Toutiao, qui apprend vos préférences personnelles en matière d'actualités et ne vous montre que les actualités les plus pertinentes pour vous. La collecte de données, dans ce cas, est à nouveau beaucoup plus facile, par exemple le nombre d'articles que vous lisez dans chaque catégorie d'actualités, le temps que vous passez sur chaque article, etc.
Troisièmement, une entreprise d'IA doit développer des algorithmes robustes et évolutifs . Pour y parvenir, il y a trois éléments indispensables : une grande quantité de données bien étiquetées (comme indiqué ci-dessus), le bon talent et la certitude que l'apprentissage en profondeur est la bonne technologie pour résoudre le problème. Les entreprises d'IA doivent avoir les bons talents pour développer les algorithmes nécessaires, mais ceux-ci sont hautement spécialisés, coûteux et rares. Par exemple, lorsque je cherchais à embaucher pour ma startup, j'ai découvert qu'il me fallait au minimum des scientifiques des données (généralement des docteurs) pour développer des prototypes d'algorithmes, des ingénieurs pour concevoir des frameworks, des programmeurs (TensorFlow, Python, C++, etc.) pour coder. en programmes évolutifs, et des personnes pour les mettre en place (chef de produit, UX, UI, etc.).
Une autre considération est la puissance de calcul . Pourquoi? Parce que les réseaux de neurones d'apprentissage en profondeur nécessitent beaucoup plus de calculs que les autres méthodes d'IA. Par exemple, pour la même tâche d'identification d'un chien dans une image, la formation du modèle à l'aide d'un algorithme d'apprentissage non profond peut nécessiter, disons, 10 modèles statistiques avec un ensemble de données de 1 Go. Le modèle de réseaux de neurones profonds pourrait nécessiter, par exemple, 1 000 modèles statistiques s'exécutant sur un ensemble de données de 100 Go. Les résultats sont meilleurs avec les réseaux, mais la puissance de calcul requise est beaucoup plus importante. En conséquence, ces modèles nécessitent non seulement un ordinateur (comme ce que nous faisons sur notre ordinateur personnel), mais un calcul distribué avec chaque GPU gérant, disons, 5% du calcul, de sorte que 20 GPU peuvent gérer ensemble le volume de calcul requis. Cela, à son tour, signifie devoir créer vos propres serveurs de cluster GPU ou louer la puissance de calcul de plates-formes telles qu'AWS. La puissance de calcul du cloud computing ou de vos propres serveurs est coûteuse, même si, en toute honnêteté, le coût unitaire de l'informatique devrait diminuer continuellement (conformément à la loi de Moore).
Conclusion
Beaucoup pensent que c'est maintenant le meilleur moment pour voir les percées et les startups de l'IA, car la numérisation de nombreuses industries et de l'Internet grand public rend disponible une grande quantité de données numériques collectées à dessein et organisées de manière propre. Le développement du GPU de Nvidia et du FPGA d'Intel rend beaucoup moins cher et plus rapide d'effectuer les calculs nécessaires. La vague d'innovation actuelle de l'IA est donc portée par des avancées importantes en matière d'apprentissage en profondeur .
Mais pour qu'une application d'IA réussisse, il faut un problème souhaitable bien défini, des données, un algorithme et une puissance de calcul importante. Pour les cadres qui lisent cet article et envisagent d'utiliser l'IA pour renforcer leur entreprise, les quatre éléments clés mentionnés ci-dessus s'appliquent également.
Comment en savoir plus sur l'IA ? Il existe de nombreux livres, séminaires, cours Coursera, documents de recherche et organisations telles que Deep Learning pour en savoir plus sur l'IA. Étant donné que cet article est destiné aux investisseurs qui souhaitent connaître les bases de l'IA, je n'ai pas abordé de nombreux sujets d'actualité sur l'IA tels que le potentiel de l'IA en tant que menace, les perspectives d'avenir de l'industrie, les investissements dans l'IA, les avantages et les inconvénients de différents algorithmes (par exemple, CNN), le prototypage par rapport à la mise à l'échelle, les principaux langages de programmation, etc. Dans la partie 2 de cette série, j'examinerai comment évaluer les entreprises d'IA du point de vue des investisseurs.