Tutoriel sur le réseau de neurones : guide étape par étape pour les débutants

Publié: 2019-11-20

Dans le domaine de l'apprentissage automatique, il existe de nombreux concepts intéressants. Ici, dans ce didacticiel sur les réseaux de neurones, nous discuterons de l'un des concepts fondamentaux des réseaux de neurones. Cet article vous aidera à comprendre le fonctionnement de ces réseaux en expliquant la théorie qui les sous-tend.

Après avoir terminé ce didacticiel sur les réseaux de neurones artificiels, vous découvrirez :

  • Qu'est-ce qu'un réseau de neurones ?
  • Comment fonctionne un réseau de neurones ?
  • Quels sont les types de réseaux de neurones ?

Table des matières

Que sont les réseaux de neurones ?

Un réseau de neurones est un système conçu pour agir comme un cerveau humain. C'est assez simple mais répandu dans notre vie de tous les jours.

Une définition complexe serait qu'un réseau de neurones est un modèle de calcul qui a une architecture de réseau. Cette architecture est constituée de neurones artificiels. Cette structure a des paramètres spécifiques à travers lesquels on peut la modifier pour effectuer certaines tâches.

Ils ont des propriétés d'approximation étendues. Cela signifie qu'ils peuvent approximer une fonction à n'importe quel niveau de précision, quelle que soit sa dimension. Les réseaux de neurones trouvent de nombreuses applications dans des domaines où les ordinateurs traditionnels ne fonctionnent pas très bien. De Siri à Google Maps, les réseaux de neurones sont présents partout où l'intelligence artificielle est utilisée.

Ils sont une partie essentielle des opérations d'intelligence artificielle. Les réseaux de neurones s'inspirent du cerveau humain et leur structure est donc similaire à celle-ci également.

Comment fonctionne un réseau de neurones ?

Un réseau de neurones comporte plusieurs couches. Chaque couche remplit une fonction spécifique, et plus le réseau est complexe, plus les couches sont nombreuses. C'est pourquoi un réseau de neurones est aussi appelé perceptron multicouche.

La forme la plus pure d'un réseau de neurones comporte trois couches :

  1. La couche d'entrée
  2. La couche cachée
  3. La couche de sortie

Comme leurs noms l'indiquent, chacune de ces couches a un but précis. Ces couches sont constituées de nœuds. Il peut y avoir plusieurs couches cachées dans un réseau de neurones selon les exigences. La couche d'entrée capte les signaux d'entrée et les transfère à la couche suivante. Il recueille les données du monde extérieur.

La couche cachée effectue toutes les tâches de calcul en arrière-plan. Un réseau peut même n'avoir aucune couche cachée. Cependant, un réseau neuronal a au moins une couche cachée. La couche de sortie transmet le résultat final du calcul de la couche cachée.

Comme d'autres applications d'apprentissage automatique, vous devrez également former un réseau de neurones avec certaines données de formation, avant de lui fournir un problème particulier. Mais avant d'approfondir la manière dont un réseau de neurones résout un problème, vous devez d'abord connaître le fonctionnement des couches de perceptron :

Comment fonctionnent les couches Perceptron ?

Un réseau de neurones est composé de plusieurs couches de perceptron ; c'est pourquoi il porte le nom de "perceptron multicouche". Ces couches sont également appelées couches cachées de couches denses. Ils sont constitués de nombreux neutrons perceptrons. Ils sont l'unité principale qui travaille ensemble pour former une couche de perceptron. Ces neurones reçoivent des informations dans l'ensemble des entrées. Vous combinez ces entrées numériques avec un biais et un groupe de pondérations, ce qui produit alors une sortie unique.

Pour le calcul, chaque neurone considère les poids et les biais. Ensuite, la fonction de combinaison utilise le poids et le biais pour donner une sortie (entrée modifiée). Cela fonctionne à travers l'équation suivante:

combinaison = biais + pondérations * entrées

Après cela, la fonction d'activation produit la sortie avec l'équation suivante :

sortie = activation(combinaison)

Cette fonction détermine le type de rôle joué par le réseau neuronal. Ils forment les couches du réseau. Voici les fonctions d'activation courantes :

La fonction linéaire

Dans cette fonction, la sortie n'est que la combinaison du neurone :

activation = combinaison

La fonction tangente hyperbolique

C'est la fonction d'activation la plus populaire parmi les réseaux de neurones. C'est une fonction sigmoïde, et elle est comprise entre -1 et +1 :

activation = tanh(combinaison)

La fonction logistique

La fonction logistique est assez similaire à la fonction tangente hyperbolique car c'est aussi une sorte de fonction sigmoïde. Cependant, il est différent car il est compris entre 0 et 1 :

activation = 1 1 + e -combinaison

La fonction d'unité linéaire rectifiée

Tout comme la fonction tangente hyperbolique, la fonction d'unité linéaire rectifiée est également répandue. Un autre nom pour la fonction d'unité linéaire rectifiée est ReLU. ReLU est égal à la combinaison lorsqu'elle est égale ou supérieure à zéro, et il est négatif si la combinaison est inférieure à zéro (négatif).

Alors, comment fonctionne exactement un réseau de neurones ?

Maintenant que vous savez ce qui se cache derrière un réseau de neurones et comment il fonctionne, nous pouvons nous concentrer sur le fonctionnement d'un réseau de neurones.

Voici comment cela fonctionne:

  1. Les informations sont introduites dans la couche d'entrée qui les transfère à la couche cachée
  2. Les interconnexions entre les deux couches attribuent des poids à chaque entrée de manière aléatoire
  3. Un biais ajouté à chaque entrée après que les poids ont été multipliés avec eux individuellement
  4. La somme pondérée est transférée à la fonction d'activation
  5. La fonction d'activation détermine les nœuds à déclencher pour l'extraction de fonctionnalités
  6. Le modèle applique une fonction d'application à la couche de sortie pour fournir la sortie
  7. Les pondérations sont ajustées et la sortie est rétropropagée pour minimiser les erreurs

Le modèle utilise une fonction de coût pour réduire le taux d'erreur. Vous devrez changer les poids avec différents modèles d'entraînement.

  1. Le modèle compare la sortie avec le résultat original
  2. Il répète le processus pour améliorer la précision

Le modèle ajuste les pondérations à chaque itération pour améliorer la précision de la sortie.

Rejoignez le cours d'intelligence artificielle en ligne des meilleures universités du monde - Masters, Executive Post Graduate Programs et Advanced Certificate Program in ML & AI pour accélérer votre carrière.

Types de réseaux de neurones

1) Réseau neuronal récurrent (RNN)

Dans ce réseau, la sortie d'une couche est enregistrée et retransférée vers l'entrée. De cette façon, les nœuds d'une couche particulière se souviennent de certaines informations sur les étapes passées. La combinaison de la couche d'entrée est le produit de la somme des pondérations et des caractéristiques. Le processus de réseau neuronal récurrent commence dans les couches cachées.

Ici, chaque nœud se souvient de certaines des informations de son étape précédente. Le modèle conserve certaines informations de chaque itération, qu'il peut utiliser ultérieurement. Le système s'auto-apprend lorsque son résultat est erroné. Il utilise ensuite ces informations pour augmenter la précision de sa prédiction en rétropropagation. L'application la plus populaire de RNN est la technologie de synthèse vocale.

2) Réseau de neurones convolutionnels (CNN)

Ce réseau est constitué d'une ou plusieurs couches convolutionnelles. La couche convolutive présente dans ce réseau applique une fonction convolutive sur l'entrée avant de la transférer à la couche suivante. De ce fait, le réseau a moins de paramètres, mais il devient plus profond. Les CNN sont largement utilisés dans le traitement du langage naturel et la reconnaissance d'images.

3) Réseau de neurones à fonction de base radiale (RBFNN)

Ce réseau de neurones utilise une fonction de base radiale. Cette fonction considère la distance d'un point au centre. Ces réseaux se composent de deux couches. La couche masquée combine les entités avec la fonction de base radiale et transfère la sortie à la couche suivante.

La couche suivante effectue la même chose en utilisant la sortie de la couche précédente. Les réseaux de neurones à fonction de base radiale sont utilisés dans les systèmes électriques.

4) Réseau de neurones à anticipation (FNN)

C'est la forme la plus pure d'un réseau de neurones artificiels. Dans ce réseau, les données se déplacent dans une seule direction, c'est-à-dire de la couche d'entrée vers la couche de sortie. Dans ce réseau, la couche de sortie reçoit la somme des produits des entrées et leurs poids. Il n'y a pas de rétro-propagation dans ce réseau de neurones. Ces réseaux peuvent avoir plusieurs ou aucune couche cachée. Celles-ci sont plus faciles à entretenir et trouvent une application dans la reconnaissance faciale.

5) Réseau neuronal modulaire

Ce réseau possède plusieurs réseaux qui fonctionnent indépendamment. Ils effectuent tous des tâches spécifiques, mais ils n'interagissent pas les uns avec les autres pendant le processus de calcul.

De cette façon, un réseau neuronal modulaire peut effectuer une tâche très complexe avec une efficacité beaucoup plus élevée. Ces réseaux sont plus difficiles à entretenir que les réseaux plus simples (tels que FNN), mais ils fournissent également des résultats plus rapides pour les tâches complexes.

En savoir plus sur les réseaux de neurones

C'est tout dans notre tutoriel sur les réseaux de neurones. Vous devez avoir vu la variété de tâches que ces réseaux peuvent effectuer. Ils sont utilisés dans presque toutes les technologies que nous utilisons quotidiennement. Si vous souhaitez en savoir plus sur les réseaux de neurones, vous pouvez consulter notre catalogue de cours sur l'intelligence artificielle et l'apprentissage automatique.

Vous pouvez consulter notre programme Executive PG en Machine Learning & AI , qui propose des ateliers pratiques, un mentor individuel de l'industrie, 12 études de cas et missions, le statut d'ancien IIIT-B, et plus encore.

Comment fonctionne un réseau de neurones ?

La couche d'entrée reçoit les données et les transmet à la couche cachée. Des poids sont attribués à chaque entrée au hasard par les liens entre les deux couches. Une fois les poids multipliés avec eux individuellement, un biais est appliqué à chaque entrée. A la fonction d'activation, le total pondéré est transmis. Pour l'extraction de caractéristiques, la fonction d'activation décide quels nœuds doivent être déclenchés. Pour fournir la sortie, le modèle utilise une fonction d'application sur la couche de sortie. Pour réduire les erreurs, les poids sont modifiés et la sortie est rétropropagée.

Qu'est-ce qu'un réseau de neurones récurrent ?

La sortie d'une couche est stockée et renvoyée à l'entrée de ce réseau. Par conséquent, les nœuds d'une couche spécifique conservent certaines informations sur les actions précédentes. Le total des pondérations et des caractéristiques détermine la combinaison de la couche d'entrée. Les couches cachées sont là où le processus basé sur rnn commence. Ici, chaque nœud se souvient d'une partie des informations de l'étape précédente. Le modèle enregistre certaines données de chaque itération afin qu'elles puissent être utilisées ultérieurement. Lorsque le résultat du système est incorrect, il s'auto-apprend. Il utilise ensuite ces connaissances pour optimiser la précision de ses prévisions de rétropropagation. La technologie de synthèse vocale est l'application la plus courante de RNN.

Comment fonctionne le perceptron multicouche ?

Le nom « perceptron multicouche » vient du fait qu'un réseau de neurones est composé de plusieurs couches de perceptron. Ces couches sont également appelées couches denses avec couches cachées. Ils sont composés d'un grand nombre de neutrons perceptrons. Ce sont les blocs de construction de base qui composent une couche de perceptron. Les informations contenues dans la collection d'entrées atteignent ces neurones. Ces entrées numériques sont combinées avec un biais ainsi qu'un groupe de poids pour produire une sortie unique.