Comment créer un arbre de décision parfait | Algorithme d'arbre de décision [avec exemples]

Publié: 2020-03-30

Si vous vous demandiez "comment créer un arbre de décision" ou "puis-je créer un arbre de décision en Java", vous êtes au bon endroit. Dans cet article, nous trouverons des réponses à ces questions, car nous discuterons en détail des arbres de décision. Vous découvrirez ce qu'ils sont, pourquoi ils sont si populaires et comment vous pouvez en créer un.

Avant de créer un arbre de décision, vous devez être familiarisé avec plusieurs autres sujets tels que la régression linéaire et les algorithmes.

Lire la suite : Arbre de décision en R

Table des matières

Qu'est-ce qu'un arbre de décision ?

Un arbre de décision vous donne une carte de tous les résultats possibles de sélections particulières. Il peut vous aider à planifier les actions futures selon différents scénarios en fonction de différents choix. Vous pouvez comparer ces résultats possibles sur la base de leurs probabilités et de leurs coûts.

Comme son nom l'indique, un arbre de décision montre un graphique ressemblant à un arbre. C'est un modèle de décisions, avec les résultats et les conséquences de chacune d'entre elles. Son but ultime est de vous aider à effectuer correctement la classification tout en passant par le plus petit nombre de choix possible.

Vous pouvez également représenter des fonctions booléennes en utilisant des arbres de décision. Chaque nœud feuille d'un arbre de décision est une étiquette de classe et les nœuds internes de l'arbre affichent les attributs. Ils commencent par un nœud, puis se divisent en toutes les possibilités. Chacune de ces branches mène à plus de nœuds qui représentent d'autres conséquences possibles. Vous pouvez créer un arbre de décision en Java.

Un arbre de décision a différents types de nœuds :

  • Nœuds de décision
  • Nœuds aléatoires
  • Nœuds de fin

Les nœuds finaux reflètent le résultat final d'un chemin de décision tandis que les nœuds aléatoires montrent les chances de résultats particuliers. Les nœuds de décision indiquent la décision que vous prendrez qui mènerait aux résultats possibles. Vous pouvez utiliser des arbres de décision pour tracer des prédictions algorithmiques ainsi que pour prendre des décisions informelles.

Maintenant que vous savez ce qu'est un arbre de décision, nous devrions nous concentrer sur creuser un peu plus et comprendre pourquoi il est répandu. Plongeons dedans.

Applications de l'arbre de décision

Voici quelques applications des arbres de décision afin que vous puissiez voir à quel point ils sont répandus :

  • Les banques les utilisent pour classer leurs demandes de prêt
  • Les professionnels de la finance utilisent des arbres de décision pour la tarification des options
  • Classement des épreuves d'examen selon le niveau d'expertise des candidats
  • Choisir d'accepter ou de refuser une offre d'emploi
  • Prendre des décisions commerciales essentielles, par exemple si une entreprise doit modifier son produit ou non.

Vous devez avoir vous-même utilisé des arbres de décision pour faire divers choix dans votre vie. Proposez simplement quelques scénarios où vous deviez prendre une décision complexe.

Avantages de l'arbre de décision

L'utilisation d'un arbre de décision présente de nombreux avantages. Les voici :

  • Les arbres de décision produisent des règles que vous pouvez comprendre facilement. Vous n'auriez aucune difficulté à transmettre ces règles à d'autres systèmes.
  • Ils peuvent gérer à la fois des variables catégorielles et continues
  • Un arbre de décision vous donnera une indication simple de l'importance de chaque champ. Vous pouvez facilement faire des prédictions (ou des classifications) selon la même chose.
  • Les arbres de décision effectuent également implicitement une sélection de fonctionnalités qui vous aide dans l'exploration des données.

En savoir plus : Algorithmes d'intelligence artificielle

Inconvénients de l'arbre de décision

Tout a ses défauts et les arbres de décision ne font pas exception. Voici quelques problèmes liés à leur utilisation :

  • Les arbres de décision ne sont pas utiles pour effectuer des tâches d'estimation. En effet, ces travaux nécessitent la prédiction de la valeur d'un attribut continu, et les arbres de décision ne sont pas bons pour cela.
  • Sur le plan informatique, les arbres de décision sont plus coûteux que les autres options. Il vous en coûtera beaucoup pour former un modèle d'arbre de décision également par rapport aux autres. Les algorithmes d'élagage que vous utiliseriez pour créer des arbres de décision sont également assez coûteux car ils nécessitent de créer de nombreux sous-arbres.
  • Si vous avez un grand nombre d'exemples de classes mais un faible nombre d'exemples de formation, vos arbres de décision ne seront pas très précis et leurs chances de contenir des erreurs seront considérablement élevées.

Comment créer un arbre de décision

Créons un arbre de décision indiquant si une personne achèterait un ordinateur ou non. Dans ce cas, nous aurions deux classes, "Oui" et "Non". La première classe fait référence aux personnes qui achèteraient un ordinateur, tandis que la seconde fait référence à celles qui ne le feraient pas. Tout d'abord, nous allons calculer le gain d'information et l'entropie pour ces classes.

Une fois que nous aurons calculé l'entropie de ces classes, nous nous concentrerons sur le gain d'informations. Nous pouvons classer les valeurs d'entropie comme ceci :

Si l'entropie est de 0, cela signifie que les données sont pures (homogènes)

Si l'entropie est de 1, cela signifie que les données sont impures (à moitié divisées)

Supposons que notre entropie soit impure. Ensuite, nous diviserons le gain d'information sur l'âge. De cette façon, nos données montreront combien de personnes d'une tranche d'âge spécifique achèteront ce produit et combien ne le feront pas. Nous pouvons calculer le gain d'information pour plusieurs attributs. Mais dans notre exemple, nous avons constaté que le gain d'informations est le plus élevé pour « Âge » et le plus faible pour « Revenu ». Alors, on va faire avec ça.

Voici les règles de classification pour cet arbre de décision :

Si quelqu'un a moins de 30 ans et si cette personne n'est pas étudiante, elle n'achètera pas le produit donc :

Âge (<30) ^ étudiant(non) = NON

Mais si quelqu'un dont l'âge est inférieur à 30 ans et qui est étudiant, il achèterait le produit :

Âge (<30)^ étudiant(oui) = OUI

Maintenant, si leur âge se situe entre 31 et 40 ans, ils achèteraient sûrement le produit :

Âge (31…40) = OUI

Une personne âgée de plus de 40 ans et ayant une cote de crédit élevée n'achèterait pas :

Âge (> 40) ^ cote de crédit (élevée) = NON

D'un autre côté, si une personne âgée de plus de 40 ans mais ayant une cote de crédit moyenne, elle achèterait le produit :

Âge (> 40) ^ cote de crédit (normale) = OUI

En suivant ces étapes, vous serez en mesure de créer l'arbre de décision parfait sans aucune difficulté .

En savoir plus sur : Top 9 des bibliothèques d'apprentissage automatique à connaître

Conclusion

Vous devez maintenant savoir comment créer un arbre de décision. Vous pouvez en apprendre beaucoup plus sur les arbres de décision et les algorithmes pertinents dans notre cours d'apprentissage automatique. Nous sommes sûrs que vous y améliorerez vos connaissances en apprenant comment vous pouvez créer un arbre de décision en Java, comment vous pouvez les utiliser dans la vie réelle, et plus encore.

Si vous souhaitez en savoir plus sur l'apprentissage automatique, consultez le diplôme PG en apprentissage automatique et IA de IIIT-B & upGrad, conçu pour les professionnels en activité et offrant plus de 450 heures de formation rigoureuse, plus de 30 études de cas et missions, IIIT- Statut B Alumni, plus de 5 projets de synthèse pratiques et aide à l'emploi avec les meilleures entreprises.

Menez la révolution technologique basée sur l'IA

DIPLÔME PG EN APPRENTISSAGE MACHINE ET INTELLIGENCE ARTIFICIELLE
Appliquer maintenant