Comment fonctionne l'apprentissage automatique - Un guide facile
Publié: 2019-07-31Netflix et Amazon sont devenus très bons dans leur jeu – ils semblent toujours savoir quel contenu ou produit vous aimeriez voir / acheter. N'aimez-vous pas tout simplement voir tout ce qui est déjà organisé selon vos goûts et vos préférences ?
Alors que la plupart d'entre nous connaissent la sauce secrète derrière l'astucieux moteur de recommandation de Netflix et Amazon (Machine Learning, bien sûr !), combien d'entre nous connaissent les mécanismes internes du Machine Learning ?
Pour faire simple – Comment fonctionne le Machine Learning ?
Essentiellement, l'apprentissage automatique est une technique d'analyse de données (un sous-ensemble de l'IA) qui vise à « apprendre » de l'expérience et à permettre aux machines d'effectuer des tâches nécessitant de l'intelligence. Les algorithmes d'apprentissage automatique appliquent des méthodes de calcul pour extraire des informations et apprendre directement à partir des données sans être explicitement programmés pour cela (ne pas dépendre d'une équation prédéterminée).
L'anatomie des systèmes d'apprentissage automatique
Tous les systèmes de ML peuvent être désintégrés en trois parties :

- Modèle - le composant qui traite des identifications, c'est-à-dire des prédictions.
- Paramètres - fait référence aux facteurs utilisés par le modèle pour prendre ses décisions (prédictions).
- Apprenant - le composant qui ajuste les paramètres (et dans son ensemble, le modèle) en tenant compte des différences dans les prédictions par rapport au résultat réel.
Types d'apprentissage automatique
Maintenant que vous êtes familiarisé avec les composants de base des systèmes ML, il est temps d'examiner les différentes façons dont ils « apprennent ».
Enseignement supervisé
Dans l'apprentissage supervisé, un modèle est explicitement formé sur la façon de mapper l'entrée à la sortie. Un algorithme d'apprentissage supervisé prend un ensemble reconnu de données d'entrée ainsi que des réponses connues (sortie) à ces données et forme le modèle pour générer des prédictions raisonnables en réponse à de nouvelles données d'entrée.
L'apprentissage supervisé utilise deux approches pour développer des modèles prédictifs -
- Classification – Comme son nom l'indique, cette technique classe les données d'entrée dans différentes catégories en les étiquetant. Il est utilisé pour prédire des réponses discrètes (par exemple, si une cellule cancéreuse est bénigne ou maligne). L'imagerie médicale, la reconnaissance vocale et la notation de crédit sont trois cas d'utilisation populaires de la classification.
- Régression - Cette technique est utilisée pour prédire les réponses continues en identifiant les modèles dans les données d'entrée. Par exemple, les fluctuations de température ou de temps. La régression est utilisée pour prévoir la météo, la charge électrique et le trading algorithmique.
Apprentissage non supervisé
L'approche d'apprentissage non supervisé utilise des données non étiquetées et cherche à démêler les modèles cachés qu'elles contiennent. Ainsi, la technique tire des conclusions à partir d'ensembles de données constitués de données d'entrée dépourvues de réponses étiquetées.
- Clustering - L'une des méthodes d'apprentissage non supervisées les plus courantes, le clustering est une technique d'analyse de données exploratoire qui catégorise les données en «clusters» sans aucune information connue sur les informations d'identification du cluster. La reconnaissance d'objets et l'analyse de séquences de gènes sont deux exemples de regroupement.
- Réduction de la dimensionnalité - La réduction de la dimensionnalité nettoie les données d'entrée de toutes les informations redondantes et ne conserve que les parties essentielles. Ainsi, non seulement les données deviennent propres, mais leur taille est également réduite, occupant ainsi moins d'espace de stockage.
Apprentissage par renforcement
L'apprentissage par renforcement vise à construire des modèles auto-entretenus et auto-apprenants qui peuvent apprendre et s'améliorer par essais et erreurs. Dans le processus d'apprentissage (formation), si l'algorithme peut effectuer avec succès des actions spécifiques, des signaux de récompense sont déclenchés. Les signaux de récompense fonctionnent comme des lumières de guidage pour les algorithmes. Il existe deux signaux de récompense :

- Un signal positif est déclenché pour encourager et poursuivre une séquence d'action particulière.
- Un signal négatif est une pénalité pour une mauvaise action particulière. Il exige la correction de l'erreur avant d'aller plus loin dans le processus de formation.
L'apprentissage par renforcement est largement utilisé dans les jeux vidéo. C'est aussi le mécanisme derrière les voitures autonomes.
À l'intérieur de la fonction "apprentissage" des algorithmes ML
Derrière les fonctionnements des algorithmes ML et la façon dont ils apprennent par l'expérience, il existe trois principes communs.
Apprendre une fonction
La première étape du processus d'apprentissage est celle où les algorithmes ML apprennent la fonction cible (f) qui mappe le mieux la variable d'entrée (X) à la variable de sortie (Y). Alors,
Y = f(X).
Ici, la forme de la fonction cible (f) est inconnue, d'où la modélisation prédictive.
Dans cette phase d'apprentissage général, l'algorithme ML apprend à faire des prédictions futures (Y) basées sur les nouvelles variables d'entrée (X). Naturellement, le processus n'est pas exempt d'erreur. Ici, l'erreur (e) existe indépendamment des données d'entrée (X). Alors,
Y = f(X) + e
Étant donné que l'erreur (e) peut ne pas avoir suffisamment d'attributs pour caractériser au mieux le scénario de mappage de X à Y, elle est appelée erreur irréductible - quelle que soit la qualité de l'algorithme pour estimer la fonction cible (f), vous ne pouvez pas réduire l'erreur ( e).
Faire des prédictions et apprendre à les améliorer
Dans le point précédent, nous avons compris comment un algorithme ML apprend une fonction cible (f). Et nous savons déjà que notre seul et unique objectif ici est de trouver le meilleur moyen possible de mapper Y à partir de X. En d'autres termes, nous devons trouver le moyen le plus précis de mapper l'entrée à la sortie.
Il y aura des erreurs (e), oui, mais l'algorithme doit continuer à essayer de comprendre à quelle distance il se trouve de la sortie souhaitée (Y) et comment l'atteindre. Dans ce processus, il ajustera continuellement les paramètres ou les valeurs d'entrée (X) pour mieux correspondre à la sortie (Y). Cela se poursuivra jusqu'à ce qu'il atteigne un degré élevé de ressemblance et de précision avec le modèle de sortie souhaité.
Comment apprendre l'apprentissage automatique - étape par étapeL'approche d'apprentissage « Gradient Descent »
Il est peut-être vrai que nous avons réussi à créer des machines « intelligentes », mais leur rythme d'apprentissage diffère – les machines ont tendance à être lentes. Ils croient au processus d'apprentissage de la "descente graduelle" - vous ne faites pas le saut d'un coup, mais vous faites des pas de bébé et descendez lentement du sommet (la métaphore ici est celle de la descente d'une montagne).

En descendant une montagne, vous ne sautez pas, ne courez pas et ne vous précipitez pas d'un seul coup ; au lieu de cela, vous prenez des mesures mesurées et calculées pour descendre au fond en toute sécurité et éviter les accidents.
Les algorithmes ML utilisent cette approche - ils continuent de s'adapter aux paramètres changeants (imaginez à nouveau le terrain accidenté et inexploré d'une montagne) pour obtenir finalement le résultat souhaité.
De conclure…
L'objectif fondamental de tous les algorithmes d'apprentissage automatique est de développer un modèle prédictif qui se généralise le mieux à des données d'entrée spécifiques. Étant donné que les algorithmes et les systèmes ML s'entraînent eux-mêmes à travers différents types d'entrées/variables/paramètres, il est impératif de disposer d'un vaste pool de données. Cela permet aux algorithmes ML d'interagir avec différents types de données pour apprendre leur comportement et produire les résultats souhaités.
Nous espérons qu'avec cet article nous pourrons démystifier pour vous le fonctionnement du Machine Learning !