Drzewo decyzyjne w AI: wprowadzenie, typy i tworzenie

Opublikowany: 2020-09-03

Drzewo decyzyjne to denotacyjna reprezentacja procesu decyzyjnego. Drzewa decyzyjne w sztucznej inteligencji służą do wyciągania wniosków na podstawie danych dostępnych z decyzji podjętych w przeszłości. Co więcej, tym wnioskom przypisano wartości, stosowane w celu przewidzenia kierunku działań, które mogą zostać podjęte w przyszłości.

Drzewa decyzyjne to statystyczne, algorytmiczne modele uczenia maszynowego, które interpretują i uczą odpowiedzi na różne problemy i ich możliwe konsekwencje. Dzięki temu drzewa decyzyjne znają zasady podejmowania decyzji w określonych kontekstach na podstawie dostępnych danych. Proces uczenia się jest ciągły i oparty na informacjach zwrotnych. Z czasem poprawia to wyniki uczenia się. Ten rodzaj uczenia się nazywa się uczeniem nadzorowanym. Dlatego modele drzew decyzyjnych są narzędziami wspomagającymi uczenie nadzorowane.

W ten sposób drzewa decyzyjne zapewniają naukowy proces podejmowania decyzji oparty na faktach i wartościach, a nie na intuicji. W biznesie organizacje wykorzystują ten proces do podejmowania ważnych decyzji biznesowych.

Ucz się kursów AI i ML z najlepszych światowych uniwersytetów. Zdobywaj programy Masters, Executive PGP lub Advanced Certificate Programy, aby przyspieszyć swoją karierę.

Spis treści

Rodzaje modeli drzew decyzyjnych

Modele te można wykorzystać do rozwiązywania problemów w zależności od rodzaju danych, które wymagają predykcji. Należą do następujących kategorii:

Przewidywanie zmiennych ciągłych
Przewidywanie zmiennych kategorycznych

1. Przewidywanie zmiennych ciągłych

Przewidywanie zmiennych ciągłych zależy od co najmniej jednego predyktora. Na przykład ceny domów na danym obszarze mogą zależeć od wielu zmiennych, takich jak adres, dostępność udogodnień, takich jak basen, liczba pokoi itp. W takim przypadku drzewo decyzyjne będzie przewidywać cenę domu na podstawie różnych zmiennych wartości. Przewidywana wartość będzie również wartością zmienną.

Model drzewa decyzyjnego używany do wskazywania takich wartości nazywa się ciągłym drzewem decyzyjnym zmiennych. Ciągłe różne drzewa decyzyjne rozwiązują problemy typu regresyjnego. W takich przypadkach do przewidywania ciągłych, zmiennych i numerowanych danych wyjściowych używane są zestawy danych z etykietami.

Musisz przeczytać: Jak stworzyć idealne drzewo decyzyjne

2. Przewidywanie zmiennych kategorialnych

Przewidywanie zmiennych kategorycznych jest również oparte na innych zmiennych kategorycznych lub ciągłych. Jednak zamiast przewidywać wartość, ten problem dotyczy klasyfikowania nowego zestawu danych do dostępnych klas zestawów danych. Na przykład analizując komentarz na Facebooku, aby sklasyfikować tekst jako negatywny lub wspierający. Przeprowadzanie diagnozy choroby na podstawie objawów pacjenta jest również przykładem modelu drzewa decyzyjnego zmiennych kategorialnych. Drzewa decyzyjne ze zmiennymi kategorialnymi rozwiązują problemy klasyfikacyjne, w których wynikiem jest klasa, a nie wartość.

Sprawdź: Drzewo decyzyjne w R

Jak powstają drzewa decyzyjne w sztucznej inteligencji

Jak sama nazwa wskazuje, algorytm drzewa decyzyjnego ma postać struktury przypominającej drzewo. Jednak jest odwrócony. Drzewo decyzyjne zaczyna się od głównego lub najwyższego węzła decyzyjnego, który klasyfikuje zestawy danych na podstawie wartości starannie wybranych atrybutów.

Węzeł główny reprezentuje cały zestaw danych. W tym miejscu pierwszy krok algorytmu wybiera najlepszą zmienną predykcyjną. To sprawia, że jest to węzeł decyzyjny. Klasyfikuje również cały zestaw danych na różne klasy lub mniejsze zestawy danych.

Zestaw kryteriów wyboru atrybutów nosi nazwę Miary wyboru atrybutów (ASM). ASM opiera się na miarach selekcji, w tym przyrostu informacji, entropii, indeksie Giniego, współczynniku wzmocnienia i tak dalej. Te atrybuty, zwane również cechami, tworzą reguły decyzyjne, które pomagają w rozgałęzianiu. Proces rozgałęziania dzieli węzeł główny na podwęzły, dzieląc dalej na kolejne podwęzły, aż do utworzenia węzłów liści. Węzły liści nie mogą być dalej dzielone.

Typowym przykładem klasyfikacji jest ustalenie, czy dany obrazek przedstawia kota czy psa. Tutaj cechami lub atrybutami mogą być obecność pazurów lub łap, długość uszu, rodzaj języka itp. Zbiór danych zostanie dalej podzielony na mniejsze klasy w oparciu o te zmienne wejściowe, aż do uzyskania wyniku.

Przeczytaj także: Klasyfikacja w drzewie decyzyjnym

Wniosek

Drzewa decyzyjne to klasyczne i naturalne modele uczenia się. Opierają się na podstawowej koncepcji dziel i rządź. W świecie sztucznej inteligencji drzewa decyzyjne są wykorzystywane do rozwijania uczących się maszyn poprzez uczenie ich, jak określać sukces i porażkę. Te uczące się maszyny analizują następnie przychodzące dane i przechowują je.

Następnie podejmują niezliczone decyzje na podstawie wcześniejszych doświadczeń edukacyjnych. Decyzje te stanowią podstawę modelowania predykcyjnego, które pomaga przewidywać wyniki problemów. W biznesie organizacje wykorzystują te techniki do podejmowania niezliczonych małych i dużych decyzji biznesowych prowadzących do gigantycznych zysków lub strat.

Zamówienie zaawansowanego programu certyfikatów upGrad w zakresie uczenia maszynowego i NLP. Ten kurs został stworzony z myślą o różnych rodzajach uczniów zainteresowanych uczeniem maszynowym, oferując mentoring 1-1 i wiele więcej.

Czym jest model drzewa decyzyjnego w AI?

Drzewa decyzyjne istnieją od dawna, ale ostatnio zyskują na znaczeniu w społeczności uczenia maszynowego i nauki o danych. Drzewo decyzyjne to model, który uczy się na podstawie danych i pomaga przewidzieć klasę obiektu na podstawie zestawu cech. Drzewo decyzyjne to acykliczny graf, w którym każdy węzeł reprezentuje test na elemencie wejściowym, a każda gałąź reprezentuje wynik testu. Przechodząc w dół drzewa, węzeł główny zawiera prognozę dla całego drzewa

Jakie są zastosowania drzew decyzyjnych?

Modele są używane w kilku dziedzinach. W biologii obliczeniowej są często wykorzystywane do przewidywania funkcji biologicznych białek lub sekwencji DNA. W epidemiologii wykorzystuje się je do określenia ryzyka przeniesienia choroby przez dotknięte nią osoby. W eksploracji danych służą do przewidywania przyszłych wydarzeń na podstawie wcześniejszych wydarzeń. W finansach służą do określenia ryzyka niewypłacalności, a w inżynierii oprogramowania do określania priorytetu defektów oprogramowania.

Jakie problemy napotyka algorytm drzewa decyzyjnego?

Największym problemem związanym z modelami drzew decyzyjnych jest to, że w wielu przypadkach wszystkie możliwe drzewa nie są wyliczane, nawet jeśli liczba możliwych stanów (węzłów) jest nieskończona, tak jak w przypadku nieznanego wyniku BLEU. Jak wiemy drzewo decyzyjne to algorytm uczenia maszynowego. Jest to binarne drzewo decyzyjne. Drzewo, w którym każdy węzeł wewnętrzny reprezentuje test na zmiennej, a każdy węzeł liścia reprezentuje etykietę klasy. Drzewo decyzyjne musi podejmować decyzje dotyczące określonej krotki danych. Ta reprezentacja nie jest zbyt dobra, jeśli chodzi o podejmowanie decyzji o zmiennej ciągłej. Ma również ograniczenie do pracy z danymi, które można zakodować jako zmienną kategoryczną.