Qu'est-ce que l'apprentissage profond géométrique ?

Publié: 2020-12-22

Les algorithmes d'apprentissage en profondeur tels que les réseaux de neurones récurrents (RNN) et les réseaux de neurones convolutifs (CNN) ont fait un travail important dans la résolution de problèmes de divers domaines tels que la reconnaissance vocale, la vision par ordinateur et bien d'autres au cours des dernières années. Bien que les résultats aient été d'une grande précision, ils ont surtout fonctionné sur des données euclidiennes.

Mais lorsqu'il s'agit de la science des réseaux, de la physique, de la biologie, de l'infographie et des systèmes de recommandation, nous devons traiter des données non euclidiennes, c'est-à-dire des variétés et des graphes. L'apprentissage profond géométrique traite de ces données non euclidiennes avec un sens des techniques d'apprentissage profond dans leur ensemble pour les données multiples ou structurées en graphes.

Table des matières

Qu'est-ce que l'apprentissage profond géométrique ?

Au cours des dernières années, nous avons constaté des progrès significatifs dans le domaine de l'apprentissage en profondeur et de l'apprentissage automatique. La puissance des ordinateurs augmente rapidement et les données disponibles sont combinées avec les algorithmes qui ont été développés dans les années 1980-1990 pour leurs nouvelles applications.

S'il y a un domaine qui a beaucoup bénéficié de ce développement, c'est l'apprentissage de la représentation. L'apprentissage des représentations fait partie de l'apprentissage supervisé et est également appelé apprentissage des fonctionnalités. L'apprentissage des fonctionnalités remplace directement l'ingénierie des fonctionnalités dans de nombreuses applications. Pour votre information, l'ingénierie des fonctionnalités est un domaine qui traite du développement de descripteurs et de fonctionnalités pour effectuer d'autres tâches d'apprentissage automatique.

L'un des meilleurs exemples est l'utilisation des réseaux de neurones convolutifs (CNN) pour la détection d'objets, la classification d'images et l'obtention d'une grande précision, établissant ainsi une référence pour les autres algorithmes conventionnels. ImageNet a organisé un concours en 2012 et a surpassé un SOTA largement basé sur l'ingénierie des fonctionnalités.

Entrons maintenant dans la compréhension du domaine ayant une origine similaire et un avenir florissant, l'apprentissage profond géométrique.

Le terme apprentissage profond géométrique a été nommé pour la première fois par Bronstein et al. dans leur article publié en 2017, le titre de l'article était, "Geometric Deep Learning : aller au-delà des données euclidiennes".

C'est un titre fort qui indique que l'apprentissage profond géométrique est capable d'employer l'apprentissage profond même sur des données non euclidiennes. Les données non euclidiennes sont un ensemble de données qui ne peuvent pas tenir dans un espace à deux dimensions.

Généralement, une spécialisation graphique ou un maillage très poussé dans le domaine de l'infographie pour visualiser les données non euclidiennes.

Le chiffre de gauche indique la distance géodésique et celui de droite la distance euclidienne. Le maillage dans la figure ci-dessus est le visage d'une personne. Maintenant, à travers le maillage, la distance de surface la plus courte est la distance géodésique entre deux points de repère. Alors que la distance calculée entre deux points de repère à l'aide d'une ligne droite est la distance euclidienne.

La distance géodésique est le principal avantage de représenter n'importe quel maillage sous une forme non euclidienne car elle est plus conséquente pour les tâches qui y sont effectuées. Ce n'est pas que nous ne pouvons pas transformer les données non euclidiennes en données euclidiennes de manière inhérente, mais ce qui se passe, c'est qu'il y a un coût élevé à perdre la performance et l'efficacité.

Un exemple principal et important de données non euclidiennes serait un graphique. Un graphe est une telle structure de données qui se compose d'entités ou de nœuds qui sont connectés aux relations ou aux arêtes. Un graphique peut être utilisé pour modéliser presque tout et n'importe quoi.

Eh bien, vous n'avez pas besoin de comprendre la théorie des graphes, il vous suffit d'en lire un peu pour pouvoir utiliser les bibliothèques de logiciels nécessaires au processus. Vous devez avoir une connaissance de base claire de l'apprentissage en profondeur géométrique pour une introduction exceptionnelle au graphe et à sa théorie fondamentale.

Pour les données à utiliser pour résoudre le problème basé sur le deep learning géométrique, si vous reconnaissez déjà les instances réalisables en fonction des données dont vous avez besoin de disposer, ou au contraire ; alors c'est le meilleur des cas.

Lire : Réseau de neurones convulsionnels

Raisonnement statistique

Ce que nous voulons comprendre, c'est ce qui diffère le raisonnement inductif et le raisonnement déductif. En matière de raisonnement déductif, les termes généraux sont utilisés pour arriver à une conclusion spécifique ou pour faire une affirmation particulière. Combinons ces deux assertions pour former un exemple.

"Toutes les filles ont obtenu 10/10 au test" et "Taylor est une fille" signifie finalement que "Taylor a obtenu 10/10 au test". Le raisonnement inductif est vice versa; ici, une idée générale ou une conclusion est tirée de termes particuliers. Prenons un exemple pour visualiser le raisonnement. Répond a cette question:

Quelle vache ne produit que du lait longue conservation (UHT) ? Si vous répondez « aucun », vous faites partie des 21 % de jeunes interrogés. 5% des jeunes interrogés ont marqué "Vaches à lait", 10% ont marqué "tous", 2% d'entre eux ont fait la queue pour "vaches femelles" et "vaches noires et blanches", et 50% d'entre eux n'ont pas répondu.

Lisez aussi : Réseau de neurones récurrent

Il y a beaucoup à analyser à partir de ce résultat, mais considérons la pensée des vaches Milka. Comprenons la conclusion sous forme de raisonnement inductif avec le point de vue du jeune. Premièrement, "la vache Milka est une race spéciale", "le lait UHT est spécial", ce qui conduit finalement à "le lait UHT est produit par une vache Milka".

Que peut-on en conclure ? Le biais inductif ou raisonnement inductif est un ensemble d'hypothèses de l'apprenant, qui suffit à expliquer son interférence inductive et déductive. Il faut être très prudent lors de la conception des algorithmes de biais inductif. On peut utiliser des interférences inductives pour obtenir des résultats équivalents à des inférences déductives.

Fait intéressant : dans le corpus mathématique de l'informatique supérieure, s'il existe un sujet réputé pour être considéré comme un sujet difficile, c'est la théorie des graphes en mathématiques discrètes.

Cependant, la théorie des graphes nous permet d'effectuer quelques tâches passionnantes et de fournir des informations étonnantes grâce à l'apprentissage en profondeur.

Segmentation graphique

La segmentation de graphe est un processus de classification d'un et de tous les composants d'un graphe comme les nœuds (entités), les arêtes (relations). Pensez aux voitures autonomes dont l'environnement doit être surveillé après un intervalle régulier et prédisez ce qu'elles seront ensuite par les piétons.

Habituellement, les piétons humains sont soit représentés comme d'énormes boîtes englobantes en trois dimensions, soit comme des squelettes à plusieurs degrés de mouvement. Avec une segmentation sémantique tridimensionnelle plus rapide et meilleure, les voitures autonomes auraient de plus en plus d'algorithmes qui rendraient la perception possible.

Classement des graphiques

Dans la classification des graphes, l'algorithme obtient un graphe ou un sous-graphe en entrée et interprète une sortie de n classes qui sont spécifiées comme ayant une valeur de certitude combinée à la prédiction. Elle équivaut à la classification d'images dont le réseau employé comporte deux parties principales.

La première partie importante est l'extracteur de caractéristiques qui crée une représentation optique des données d'entrée. Ensuite, pour contraindre la régression de sortie à une dimensionnalité particulière, des couches entièrement connectées sont utilisées. En revanche, une couche softmax est requise pour la classification multi-classes.

Doit lire : Méthodes étape par étape pour créer votre propre système d'IA aujourd'hui

La ligne du bas

Nous avons compris le Deep Learning géométrique en profondeur en le plaçant dans le contexte global du Deep Learning. Nous pouvons conclure que l'apprentissage profond géométrique traite des données irrégulières dans leur ensemble, et nous avons découvert les graphes en illustrant à quel point leur rôle dans les biais d'apprentissage est prometteur.

Si vous souhaitez en savoir plus sur les techniques d'apprentissage en profondeur, l'apprentissage automatique, consultez le diplôme PG en apprentissage automatique et IA de IIIT-B et upGrad, conçu pour les professionnels en activité et offrant plus de 450 heures de formation rigoureuse, plus de 30 études de cas et affectations, statut IIIT-B Alumni, 5+ projets de synthèse pratiques et aide à l'emploi avec les meilleures entreprises.

Menez la révolution technologique basée sur l'IA

DIPLÔME PG EN APPRENTISSAGE MACHINE ET INTELLIGENCE ARTIFICIELLE
Apprendre encore plus