Arborele de decizie în AI: introducere, tipuri și creare

Publicat: 2020-09-03

Un arbore de decizie este reprezentarea denotativă a unui proces de luare a deciziilor. Arborele de decizie din inteligența artificială sunt utilizați pentru a ajunge la concluzii pe baza datelor disponibile din deciziile luate în trecut. În plus, acestor concluzii li se atribuie valori, desfășurate pentru a prezice cursul acțiunii care ar putea fi luate în viitor.

Arborele de decizie sunt modele statistice, algoritmice de învățare automată care interpretează și învață răspunsurile de la diverse probleme și posibilele consecințe ale acestora. Ca urmare, arborii de decizie cunosc regulile de luare a deciziilor în contexte specifice pe baza datelor disponibile. Procesul de învățare este continuu și se bazează pe feedback. Acest lucru îmbunătățește rezultatul învățării în timp. Acest tip de învățare se numește învățare supravegheată. Prin urmare, modelele arborelui de decizie sunt instrumente de sprijin pentru învățarea supravegheată.

Astfel, arborii de decizie oferă un proces științific de luare a deciziilor bazat pe fapte și valori, mai degrabă decât pe intuiție. În afaceri, organizațiile folosesc acest proces pentru a lua decizii de afaceri semnificative.

Învață cursuri AI și ML de la cele mai bune universități din lume. Câștigă programe de master, Executive PGP sau Advanced Certificate pentru a-ți accelera cariera.

Cuprins

Tipul de modele de arbore de decizie

Aceste modele pot fi utilizate pentru a rezolva probleme în funcție de tipul de date care necesită predicție. Ele se încadrează în următoarele categorii:

Predicția variabilelor continue
Predicția variabilelor categoriale

1. Predicția variabilelor continue

Predicția variabilelor continue depinde de unul sau mai mulți predictori. De exemplu, prețurile caselor dintr-o zonă pot depinde de multe variabile, cum ar fi o adresă, disponibilitatea facilităților precum o piscină, numărul de camere etc. În acest caz, arborele de decizie va prezice prețul unei case pe baza diferitelor variabile. valorile. Valoarea prezisă va fi, de asemenea, o valoare variabilă.

Modelul arborelui de decizie utilizat pentru a indica astfel de valori se numește arbore de decizie variabilă continuă. Arborii de decizie diferiți continui rezolvă probleme de tip regresie. În astfel de cazuri, seturile de date etichetate sunt folosite pentru a prezice o ieșire continuă, variabilă și numerotată.

Trebuie să citiți: Cum să creați un arbore decizional perfect

2. Predicția variabilelor categoriale

Predicția variabilelor categoriale se bazează și pe alte variabile categoriale sau continue. Cu toate acestea, în loc să prezică o valoare, această problemă se referă la clasificarea unui nou set de date în clasele disponibile de seturi de date. De exemplu, analiza unui comentariu pe Facebook pentru a clasifica textul drept negativ sau de susținere. Efectuarea diagnosticului de boală pe baza simptomelor unui pacient este, de asemenea, un exemplu de model de arbore de decizie variabilă categoric. Arborele de decizie variabile categoriale rezolvă probleme de tip clasificare în care rezultatul este o clasă în loc de o valoare.

Consultați: Arborele de decizie în R

Cum sunt creați arborii de decizie în inteligența artificială

După cum sugerează și numele, algoritmul arborelui de decizie este sub forma unei structuri asemănătoare arborelui. Cu toate acestea, este inversat. Un arbore de decizie începe de la rădăcina sau nodul de decizie superior care clasifică seturile de date pe baza valorilor atributelor atent selectate.

Nodul rădăcină reprezintă întregul set de date. Acesta este locul în care primul pas al algoritmului selectează cea mai bună variabilă de predicție. Îl face un nod de decizie. De asemenea, clasifică întregul set de date în diferite clase sau seturi de date mai mici.

Setul de criterii pentru selectarea atributelor se numește Măsuri de selecție a atributelor (ASM). ASM se bazează pe măsuri de selecție, inclusiv câștigul de informații, entropia, indicele Gini, raportul de câștig și așa mai departe. Aceste atribute, numite și caracteristici, creează reguli de decizie care ajută la ramificare. Procesul de ramificare împarte nodul rădăcină în sub-noduri, împărțindu-se în continuare în mai multe sub-noduri până când se formează nodurile frunză. Nodurile frunzelor nu pot fi divizate în continuare.

Determinarea dacă o anumită imagine este cea a unei pisici sau a unui câine este un exemplu tipic de clasificare. Aici, trăsăturile sau atributele ar putea fi prezența ghearelor sau labelor, lungimea urechilor, tipul limbii etc. Setul de date va fi împărțit în continuare în clase mai mici pe baza acestor variabile de intrare până la obținerea rezultatului.

Citește și: Clasificare în Arborele de Decizie

Concluzie

Arborele de decizie sunt modele clasice și naturale de învățare. Ele se bazează pe conceptul fundamental de împărțire și cuceri. În lumea inteligenței artificiale, arborii de decizie sunt folosiți pentru a dezvolta mașini de învățare, învățându-le cum să determine succesul și eșecul. Aceste mașini de învățare analizează apoi datele primite și le stochează.

Apoi, ei iau nenumărate decizii bazate pe experiențele de învățare din trecut. Aceste decizii formează baza pentru modelarea predictivă care ajută la prezicerea rezultatelor problemelor. În afaceri, organizațiile folosesc aceste tehnici pentru a lua nenumărate decizii de afaceri mici și mari care duc la câștiguri sau pierderi uriașe.

Verificați programul de certificat avansat de la upGrad în învățare automată și NLP. Acest curs a fost creat ținând cont de diferitele tipuri de studenți interesați de Machine Learning, oferind mentorat 1-1 și multe altele.

Ce este un model de arbore de decizie în AI?

Arborele de decizie există de mult timp, dar recent au câștigat importanță în comunitatea învățării automate și a științei datelor. Un arbore de decizie este un model care învață din date și vă ajută să preziceți clasa unui obiect pe baza unui set de caracteristici. Un arbore de decizie este un grafic aciclic în care fiecare nod reprezintă un test pe o caracteristică de intrare și fiecare ramură reprezintă rezultatul unui test. Prin parcurgerea în jos a arborelui, nodul rădăcină conține predicția pentru întregul arbore

Care sunt aplicațiile arborilor de decizie?

Modelele sunt utilizate în mai multe domenii. În biologia computațională, ele sunt adesea folosite pentru a prezice funcțiile biologice ale proteinelor sau ale secvențelor de ADN. În epidemiologie, ele sunt utilizate pentru a determina riscul de transmitere a bolii de către persoanele afectate. În data mining, acestea sunt folosite pentru a prezice evenimente viitoare pe baza evenimentelor anterioare. În finanțe, ele sunt utilizate pentru a determina riscul de implicit, iar în ingineria software, sunt utilizate pentru a determina prioritatea defectelor software.

Care sunt problemele cu care se confruntă algoritmul arborelui de decizie?

Cea mai mare problemă cu modelele de arbore de decizie este că, în multe cazuri, toți arborii posibili nu sunt enumerați, chiar și atunci când numărul de stări posibile (noduri) este infinit, cum ar fi în cazul unui scor BLEU necunoscut. După cum știm, un arbore de decizie este un algoritm de învățare automată. Este un arbore de decizie binar. Un arbore în care fiecare nod intern reprezintă un test pe o variabilă și fiecare nod frunză reprezintă o etichetă de clasă. Arborele de decizie trebuie să ia decizii cu privire la un anumit tuplu de date. Această reprezentare nu este foarte bună atunci când vine vorba de a lua o decizie asupra unei variabile continue. De asemenea, are o limitare de a lucra pe date care pot fi codificate ca variabilă categorială.