Modèle de réseau de neurones : brève introduction, glossaire et rétropropagation
Publié: 2020-05-22Si vous êtes un passionné de génie logiciel et que vous essayez de comprendre le fonctionnement des réseaux de neurones, vous êtes au bon endroit.
Dans ce guide, nous aiderons les débutants à apprendre la signification des réseaux de neurones, à découvrir ce qu'est un modèle de réseau de neurones et à étendre leurs connaissances à de nouveaux domaines du domaine.
Table des matières
Qu'est-ce qu'un réseau de neurones ?
Avant d'entrer dans la terminologie informatique, comprenons l'existence des réseaux de neurones dans notre vie quotidienne.
Le terme "neural" vient de "neurone", qui est le terme utilisé pour une seule cellule nerveuse. C'est vrai - un réseau de neurones signifie essentiellement un réseau de neurones qui effectuent des actions simples et dans notre vie quotidienne.
La reconnaissance de formes, la détection d'objets et l'intelligence sont un aspect majeur des problèmes auxquels nous sommes confrontés chaque jour. Bien qu'elles soient exécutées avec une telle facilité que nous ne nous en rendons même pas compte, la vérité est que ces réactions sont difficiles à automatiser.
Exemple:

- Enfants mémorisant à quoi ressemble une pomme
- Un animal reconnaissant sa mère ou son propriétaire
- Percevoir si quelque chose est chaud ou froid
Nos réseaux de neurones effectuent ces calculs compliqués.
Les humains ont maintenant été en mesure de construire un système de calcul qui peut fonctionner d'une manière similaire à notre système nerveux. Ceux-ci sont appelés réseaux de neurones artificiels (ANN).
Alors que nous utilisions initialement les ANN pour exécuter des fonctions simples, l'augmentation de la puissance de calcul nous a maintenant permis de construire une architecture de réseau de neurones assez puissante pour résoudre des problèmes de plus en plus compliqués.
Découvrons ANN en profondeur dans la section suivante.
Lire : Tutoriel de détection d'objets TensorFlow pour les débutants
Qu'est-ce qu'un modèle de réseau neuronal artificiel ?
Un réseau neuronal multicouche entièrement connecté contenant une couche d'entrée, des couches cachées et une couche de sortie est appelé réseau neuronal artificiel ou ANN.
L'image ci-dessous représente un ANN.
La source
Si vous regardez attentivement, vous remarquerez que chaque nœud d'une couche est connecté à chaque nœud de la couche voisine.
Au fur et à mesure que vous augmentez le nombre de couches cachées, le réseau devient plus profond.
Voyons à quoi ressemble un nœud individuel dans la sortie ou la couche cachée.
La source
Comme vous pouvez le voir, le nœud reçoit de nombreuses entrées. Il additionne tous les poids et les transmet en sortie, via une fonction d'activation non linéaire.
Cette sortie du nœud devient l'entrée du nœud dans la couche suivante.
Une chose importante à noter ici est que le signal se déplacera toujours de gauche à droite. Une fois que tous les nœuds ont suivi la procédure, la sortie finale sera donnée.
Voici à quoi ressemble l'équation d'un nœud.
La source
Dans l'équation ci-dessus, b est le biais. C'est l'entrée de tous les nœuds et porte toujours la valeur 1.
Le biais aide à déplacer le résultat de la fonction d'activation vers la gauche ou vers la droite.
Glossaire du modèle de réseau neuronal artificiel
Examinons les termes de base que vous devez connaître lorsqu'il s'agit d'un modèle de réseau neuronal artificiel.
Contributions
Les données introduites en premier dans le réseau de neurones à partir de la source sont appelées l'entrée. Son objectif est de fournir au réseau des données pour prendre une décision ou une prédiction sur les informations qui y sont introduites. Le modèle de réseau neuronal accepte généralement des ensembles de valeurs réelles d'entrées et doit être introduit dans un neurone de la couche d'entrée.
Ensemble d'entraînement
Les entrées pour lesquelles vous connaissez déjà les sorties correctes sont appelées ensembles d'apprentissage. Ceux-ci sont utilisés pour aider le réseau neuronal à s'entraîner et à mémoriser le résultat pour l'ensemble d'entrées donné.

Les sorties
Chaque réseau de neurones génère une sortie sous forme de prédiction ou de décision concernant les données qui y sont introduites. Cette sortie se présente sous la forme d'un ensemble de valeurs réelles ou de décisions booléennes. Seuls les neurones de la couche de sortie génèrent la valeur de sortie.
Neurone
Aussi connu sous le nom de perceptron, un neurone est l'unité de base d'un réseau de neurones. Il accepte une valeur d'entrée et génère une sortie basée sur celle-ci.
Comme indiqué précédemment, chaque neurone reçoit une partie de l'entrée et la transmet via la fonction d'activation non linéaire au nœud de la couche suivante. Ces fonctions d'activation peuvent être TanH, sigmoïde ou ReLu. La caractéristique non linéaire de ces fonctions aide à former le réseau.
Espace poids
Chaque neurone a un poids numérique. Lorsqu'il fournit une entrée à une autre note, son poids est totalisé avec les autres pour générer une sortie. En apportant de petites modifications à ces poids, les réseaux de neurones sont entraînés. Le réglage fin des pondérations aide à déterminer l'ensemble correct de pondérations et de biais qui générerait le meilleur résultat. C'est là qu'intervient la rétropropagation.

Qu'est-ce que la rétropropagation dans un modèle de réseau neuronal ?
L'un des moyens de découvrir avec succès les petits changements qui doivent être apportés aux poids pour minimiser la perte de l'ensemble du réseau est la rétropropagation.
- Dans un premier temps, les activations doivent se propager vers le haut ou vers l'avant.
- Maintenant, les dérivées de la fonction de coût doivent être propagées dans le sens descendant ou inverse.
De cette façon, vous pourrez déterminer la dérivée partielle des coûts par rapport à chaque pondération. Vous pouvez ensuite calculer le coût qui serait réduit en faisant les ajustements.
Conclusion
De nombreux ingénieurs en logiciel ne recommandent pas le modèle de réseau de neurones, car ils estiment qu'il est plutôt inefficace, étant donné que plusieurs itérations sont nécessaires pour trouver la solution la plus rentable.
Cependant, de nombreux nouveaux algorithmes, tels que les réseaux de capsules de Hinton, le réseau de neurones à capsules, nécessitent beaucoup moins d'instances d'ajustements pour atteindre un modèle précis. Et donc, le réseautage neuronal a sûrement beaucoup de portée à l'avenir.
Si vous souhaitez en savoir plus sur l'apprentissage automatique, consultez le diplôme PG en apprentissage automatique et IA de IIIT-B & upGrad, conçu pour les professionnels en activité et offrant plus de 450 heures de formation rigoureuse, plus de 30 études de cas et missions, IIIT- Statut B Alumni, plus de 5 projets de synthèse pratiques et aide à l'emploi avec les meilleures entreprises.
Pourquoi avez-vous besoin d'étudier les mathématiques pour l'intelligence artificielle?
Contrairement à ce que beaucoup d'entre nous pensent, l'intelligence artificielle est fortement dépendante des mathématiques. Tout le concept d'enseigner aux machines à penser et à agir comme les êtres humains est basé sur des concepts qui appartiennent à différentes branches des mathématiques, comme les probabilités et les statistiques, pour n'en nommer que quelques-uns. La science des données s'accompagne également de ses fondements liés à divers concepts mathématiques, du calcul, de l'algèbre linéaire et de la théorie des jeux aux régressions avancées, aux classifications, aux statistiques, aux probabilités, à la descente de gradient, etc. De solides bases en mathématiques sont essentielles pour développer une compréhension efficace des concepts de l'IA, ce qui vous aidera à bâtir une carrière réussie dans ce domaine.
Le réseau de neurones est-il un algorithme d'apprentissage automatique ?
Les réseaux de neurones artificiels ou simplement les réseaux de neurones peuvent être définis comme un ensemble d'algorithmes d'apprentissage automatique conçus pour ressembler au cerveau humain et créés pour la reconnaissance avancée des formes. Les réseaux de neurones sont conçus pour identifier des modèles numériques dans des vecteurs dans lesquels toutes les données accumulées sont traduites. En détectant des modèles dans des données non structurées ou imprécises, les réseaux de neurones aident à classer et à former des clusters pour un stockage et une gestion des données améliorés. Les données sensorielles transmises aux réseaux de neurones sont interprétées via une perception machine qui étiquette ou regroupe les données d'entrée.
Pourquoi la rétropropagation est-elle nécessaire dans les réseaux de neurones ?
Dans le domaine des réseaux de neurones artificiels, la méthode de rétropropagation fait en fait référence à la rétropropagation des erreurs. Il s'agit d'une technique standardisée utilisée pour former des réseaux de neurones artificiels et qui se fait par itérations. La rétropropagation est utilisée pour affiner les poids d'un réseau de neurones artificiels, aider à minimiser les erreurs et rendre le système plus précis et fiable. Cette méthode fonctionne rapidement et peut également être programmée simplement. C'est une technique flexible; il n'a pas besoin de connaissances préalables sur le réseau de neurones. Il n'implique aucun paramètre supplémentaire mais ne règle que les nombres introduits dans le système.