Arbre de décision en IA : introduction, types et création
Publié: 2020-09-03Un arbre de décision est la représentation dénotative d'un processus de prise de décision. Les arbres de décision en intelligence artificielle sont utilisés pour arriver à des conclusions basées sur les données disponibles à partir de décisions prises dans le passé. De plus, ces conclusions sont des valeurs assignées, déployées pour prédire la ligne de conduite susceptible d'être prise à l'avenir.
Les arbres de décision sont des modèles statistiques et algorithmiques d'apprentissage automatique qui interprètent et apprennent les réponses à divers problèmes et leurs conséquences possibles. En conséquence, les arbres de décision connaissent les règles de prise de décision dans des contextes spécifiques en fonction des données disponibles. Le processus d'apprentissage est continu et basé sur la rétroaction. Cela améliore les résultats de l'apprentissage au fil du temps. Ce type d'apprentissage est appelé apprentissage supervisé. Par conséquent, les modèles d'arbres de décision sont des outils d'aide à l'apprentissage supervisé.
Ainsi, les arbres de décision fournissent un processus de prise de décision scientifique basé sur des faits et des valeurs plutôt que sur l'intuition. En affaires, les organisations utilisent ce processus pour prendre des décisions commerciales importantes.
Apprenez les cours d'IA et de ML des meilleures universités du monde. Gagnez des programmes de maîtrise, Executive PGP ou Advanced Certificate pour accélérer votre carrière.
Table des matières
Type de modèles d'arbre de décision
Ces modèles peuvent être utilisés pour résoudre des problèmes en fonction du type de données nécessitant une prédiction. Ils entrent dans les catégories suivantes :
- Prédiction de variables continues
- Prédiction des variables catégorielles
1. Prédiction des variables continues
La prédiction des variables continues dépend d'un ou plusieurs prédicteurs. Par exemple, les prix des maisons dans une zone peuvent dépendre de nombreuses variables telles qu'une adresse, la disponibilité d'équipements comme une piscine, le nombre de chambres, etc. Dans ce cas, l'arbre de décision prédira le prix d'une maison en fonction de diverses variables. valeurs. La valeur prédite sera également une valeur variable.

Le modèle d'arbre de décision utilisé pour indiquer ces valeurs est appelé arbre de décision à variable continue. Divers arbres de décision continus résolvent des problèmes de type régression. Dans de tels cas, des ensembles de données étiquetés sont utilisés pour prédire une sortie continue, variable et numérotée.
Doit lire: Comment créer un arbre de décision parfait
2. Prédiction des variables catégorielles
La prédiction des variables catégorielles est également basée sur d'autres variables catégorielles ou continues. Cependant, au lieu de prédire une valeur, ce problème consiste à classer un nouvel ensemble de données dans les classes d'ensembles de données disponibles. Par exemple, analyser un commentaire sur Facebook pour classer le texte comme négatif ou favorable. La réalisation d'un diagnostic de maladie sur la base des symptômes d'un patient est également un exemple de modèle d'arbre de décision à variable catégorielle. Les arbres de décision à variables qualitatives résolvent des problèmes de type classification où la sortie est une classe au lieu d'une valeur.
Découvrez : Arbre de décision dans R
Comment sont créés les arbres de décision en intelligence artificielle
Comme son nom l'indique, l'algorithme d'arbre de décision se présente sous la forme d'une structure arborescente. Pourtant, il est inversé. Un arbre de décision commence à partir de la racine ou du nœud de décision supérieur qui classe les ensembles de données en fonction des valeurs d'attributs soigneusement sélectionnés.

Le nœud racine représente l'ensemble de données complet. C'est là que la première étape de l'algorithme sélectionne la meilleure variable prédictive. Cela en fait un nœud de décision. Il classe également l'ensemble de données dans différentes classes ou ensembles de données plus petits.
L'ensemble de critères de sélection des attributs est appelé mesures de sélection d'attributs (ASM). L'ASM est basé sur des mesures de sélection, notamment le gain d'information, l'entropie, l'indice de Gini, le rapport de gain, etc. Ces attributs, également appelés fonctionnalités, créent des règles de décision qui facilitent la création de branches. Le processus de branchement divise le nœud racine en sous-nœuds, se divisant davantage en plusieurs sous-nœuds jusqu'à ce que des nœuds feuilles soient formés. Les nœuds feuilles ne peuvent pas être divisés davantage.

Déterminer si une image donnée est celle d'un chat ou d'un chien est un exemple typique de classification. Ici, les caractéristiques ou attributs peuvent être la présence de griffes ou de pattes, la longueur des oreilles, le type de langue, etc. L'ensemble de données sera ensuite divisé en classes plus petites en fonction de ces variables d'entrée jusqu'à ce que le résultat soit obtenu.
Lire aussi : Classification dans l'arbre de décision
Conclusion
Les arbres de décision sont des modèles d'apprentissage classiques et naturels. Ils sont basés sur le concept fondamental de diviser pour mieux régner. Dans le monde de l'intelligence artificielle, les arbres de décision sont utilisés pour développer des machines d'apprentissage en leur apprenant à déterminer le succès et l'échec. Ces machines d'apprentissage analysent ensuite les données entrantes et les stockent.
Ensuite, ils prennent d'innombrables décisions basées sur les expériences d'apprentissage passées. Ces décisions constituent la base de la modélisation prédictive qui aide à prédire les résultats des problèmes. En affaires, les organisations utilisent ces techniques pour prendre d'innombrables petites et grandes décisions commerciales entraînant des gains ou des pertes gigantesques.
Consultez le programme de certificat avancé d'upGrad en apprentissage automatique et en PNL. Ce cours a été conçu en gardant à l'esprit différents types d'étudiants intéressés par l'apprentissage automatique, offrant un mentorat 1-1 et bien plus encore.
Qu'est-ce qu'un modèle d'arbre de décision en IA ?
Les arbres de décision existent depuis longtemps, mais ont récemment gagné en importance dans la communauté de l'apprentissage automatique et de la science des données. Un arbre de décision est un modèle qui apprend à partir des données et vous aide à prédire la classe d'un objet en fonction d'un ensemble de caractéristiques. Un arbre de décision est un graphe acyclique dans lequel chaque nœud représente un test sur une caractéristique d'entrée et chaque branche représente le résultat d'un test. En parcourant l'arbre, le nœud racine contient la prédiction pour l'ensemble de l'arbre
Quelles sont les applications des arbres de décision ?
Les modèles sont utilisés dans plusieurs domaines. En biologie computationnelle, ils sont souvent utilisés pour prédire les fonctions biologiques des protéines ou des séquences d'ADN. En épidémiologie, ils sont utilisés pour déterminer le risque de transmission de la maladie par les individus affectés. Dans l'exploration de données, ils sont utilisés pour prédire des événements futurs en fonction d'événements antérieurs. En finance, ils sont utilisés pour déterminer le risque de défaut, et en génie logiciel, ils sont utilisés pour déterminer la priorité des défauts logiciels.
Quels sont les problèmes rencontrés par l'algorithme d'arbre de décision ?
Le plus gros problème avec les modèles d'arbre de décision est que, dans de nombreux cas, tous les arbres possibles ne sont pas énumérés, même lorsque le nombre d'états possibles (nœuds) est infini, comme dans le cas d'un score BLEU inconnu. Comme nous le savons, un arbre de décision est un algorithme d'apprentissage automatique. C'est un arbre de décision binaire. Un arbre où chaque nœud interne représente un test sur une variable et chaque nœud feuille représente une étiquette de classe. L'arbre de décision doit prendre des décisions sur un tuple de données particulier. Cette représentation n'est pas très bonne lorsqu'il s'agit de prendre une décision sur une variable continue. De plus, il a une limitation pour travailler sur des données qui peuvent être encodées comme une variable catégorique.