Cum să creezi un arbore decizional perfect | Algoritmul arborelui de decizie [cu exemple]
Publicat: 2020-03-30Dacă vă întrebați „cum se creează un arbore de decizie” sau „pot crea un arbore de decizie în Java”, ați ajuns la locul potrivit. În acest articol, vom găsi răspunsuri la astfel de întrebări, deoarece vom discuta în detaliu despre arbori de decizie. Veți afla care sunt acestea, de ce sunt atât de populare și cum puteți crea una dintre ele.
Înainte de a crea un arbore de decizie, trebuie să fiți familiarizat cu alte câteva subiecte, cum ar fi regresia liniară și algoritmii.
Citește mai mult: Arborele de decizie în R
Cuprins
Ce este un arbore de decizie?
Un arbore de decizie vă oferă o hartă a tuturor rezultatelor posibile ale anumitor selecții. Vă poate ajuta să planificați acțiunile viitoare în diferite scenarii, în funcție de diferite alegeri. Puteți compara acele rezultate posibile pe baza probabilităților și costurilor lor.
După cum sugerează și numele, un arbore de decizie arată un grafic asemănător cu un arbore. Este un model de decizii, împreună cu rezultatele și consecințele fiecăreia dintre ele. Scopul său final este să vă ajute să realizați corect clasificarea în timp ce parcurgeți cel mai mic număr posibil de opțiuni.
Puteți reprezenta funcții booleene folosind și arbori de decizie. Fiecare nod frunză al unui arbore de decizie este o etichetă de clasă, iar nodurile interne ale arborelui arată atributele. Ele încep cu un singur nod și apoi se ramifică în toate posibilitățile. Fiecare dintre aceste ramuri duce la mai multe noduri care reprezintă alte consecințe posibile. Puteți crea un arbore de decizie în Java.

Un arbore de decizie are diferite tipuri de noduri:
- Noduri de decizie
- Noduri de șansă
- Nodurile de sfârșit
Nodurile finale reflectă rezultatul final al unei căi de decizie, în timp ce nodurile de șansă arată șansele unor rezultate particulare. Nodurile de decizie indică decizia pe care o veți lua care ar duce la posibilele rezultate. Puteți folosi arbori de decizie pentru a mapa predicții algoritmice, precum și pentru a lua decizii informale.
Acum că sunteți familiarizat cu ce este un arbore de decizie, ar trebui să ne concentrăm să săpăm puțin mai adânc și să înțelegem de ce este predominant. Să ne scufundăm.
Aplicații ale arborelui decizional
Iată câteva aplicații ale arborilor de decizie, astfel încât să puteți vedea cât de răspândite sunt acestea:
- Băncile le folosesc pentru a-și clasifica cererile de împrumut
- Profesioniștii din domeniul financiar folosesc arbori de decizie pentru stabilirea prețului opțiunilor
- Clasificarea lucrărilor de examen în funcție de nivelul de expertiză al candidaților
- Alegerea de a accepta sau de a respinge o ofertă de muncă
- Luarea unor decizii de afaceri esențiale, cum ar fi dacă o companie ar trebui să își modifice produsul sau nu.
Trebuie să fi folosit tu însuți arborii de decizie pentru a face diferite alegeri în viața ta. Vino doar cu câteva scenarii în care a trebuit să iei o decizie complicată.
Avantajele arborelui decizional
Există multe avantaje în utilizarea unui arbore de decizie. Iată-le:
- Arborele de decizie produc reguli pe care le puteți înțelege cu ușurință. Nu ați avea dificultăți în transmiterea acestor reguli către alte sisteme.
- Ele pot gestiona atât variabile categorice, cât și variabile continue
- Un arbore de decizie vă va oferi o indicație simplă a importanței fiecărui domeniu. Puteți face cu ușurință predicții (sau clasificări) conform acelorași.
- Arborele de decizie efectuează, de asemenea, selecția de caracteristici implicit, care vă ajută cu explorarea datelor.
Aflați mai multe: Algoritmi de inteligență artificială

Dezavantajele arborelui decizional
Totul are defectele sale, iar arborii de decizie nu fac excepție. Iată câteva probleme legate de utilizarea lor:
- Arborele de decizie nu sunt utili pentru efectuarea sarcinilor de estimare. Asta pentru că astfel de locuri de muncă necesită predicția valorii unui atribut continuu, iar arborii de decizie nu sunt buni la asta.
- Din punct de vedere computațional, arborii de decizie sunt mai scumpi decât alte opțiuni. Te va costa mult să antrenezi un model de arbore de decizie, de asemenea, în comparație cu alții. Algoritmii de tăiere pe care i-ați folosi în luarea arborilor de decizie sunt, de asemenea, destul de scumpi, deoarece necesită construirea multor sub-arbori.
- Dacă aveți un număr mare de exemple de cursuri, dar un număr redus de exemple de antrenament, arborii de decizie nu ar fi prea precis, iar șansele lor de a conține erori ar fi semnificativ mari.
Cum se creează un arbore de decizie
Să creăm un arbore de decizie privind dacă o persoană ar cumpăra sau nu un computer. În acest caz, am avea două clase, „Da” și „Nu”. Prima clasă se referă la persoanele care ar cumpăra un computer, în timp ce a doua se referă la cei care nu ar cumpăra. Mai întâi, vom calcula câștigul de informații și entropia pentru aceste clase.
Odată ce am calculat Entropia acestor clase, ne vom concentra pe câștigul de informații. Putem clasifica valorile Entropiei astfel:
Dacă Entropia este 0, înseamnă că datele sunt pure (omogene)
Dacă Entropia este 1, înseamnă că datele sunt impure (împărțite pe jumătate)
Să presupunem că Entropia noastră este impură. Apoi vom împărți câștigul de informații în funcție de vârstă. În acest fel, datele noastre vor arăta câți oameni dintr-o anumită categorie de vârstă vor cumpăra acest produs și câți nu. Putem calcula câștigul de informații pentru mai multe atribute. Dar în exemplul nostru, am constatat că câștigul de informații este cel mai mare pentru „Vârsta” și cel mai mic pentru „Venit”. Deci, vom merge cu asta.
Iată regulile de clasificare pentru acest arbore de decizie:
Dacă vârsta cuiva este mai mică de 30 de ani și dacă persoana respectivă nu este studentă, nu va cumpăra produsul, așa că:
Vârsta (<30) ^ elev(nu) = NU
Dar dacă cineva a cărui vârstă este mai mică de 30 de ani și este student, ar cumpăra produsul:
Vârsta (<30)^ elev(da) = DA
Acum, dacă vârsta lor este între 31 și 40 de ani, cu siguranță ar cumpăra produsul:
Vârsta (31…40) = DA
O persoană cu vârsta mai mare de 40 de ani și cu un rating de credit ridicat nu ar cumpăra:
Vârstă(>40)^ rating_credit(high) = NU
Pe de altă parte, dacă o persoană care are peste 40 de ani, dar are un rating mediu de credit, el sau ea ar cumpăra produsul:

Vârsta(>40)^ rating_credit(normal) = DA
Urmând acești pași, veți putea crea arborele de decizie perfect fără nicio dificultate .
Aflați mai multe despre: Top 9 biblioteci de învățare automată despre care ar trebui să știți
Concluzie
Acum trebuie să știți cum să creați un arbore de decizie. Puteți afla multe mai multe despre arborii de decizie și algoritmii relevanți în cursul nostru de învățare automată. Suntem siguri că îți vei îmbunătăți cunoștințele acolo, pe măsură ce vei afla cum poți crea un arbore de decizie în Java, cum le poți folosi în viața reală și multe altele.
Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Diploma PG de la IIIT-B și upGrad în Învățare automată și AI, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT- B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.