Jak stworzyć idealne drzewo decyzyjne | Algorytm drzewa decyzyjnego [z przykładami]

Opublikowany: 2020-03-30

Jeśli zastanawiałeś się „jak stworzyć drzewo decyzyjne” lub „czy mogę stworzyć drzewo decyzyjne w Javie”, to dobrze trafiłeś. W tym artykule znajdziemy odpowiedzi na takie pytania, ponieważ będziemy szczegółowo omawiać drzewa decyzyjne. Dowiesz się, czym one są, dlaczego są tak popularne i jak możesz je stworzyć.

Zanim utworzysz drzewo decyzyjne, musisz zapoznać się z kilkoma innymi tematami, takimi jak regresja liniowa i algorytmy.

Czytaj więcej: Drzewo decyzyjne w R

Spis treści

Co to jest drzewo decyzyjne?

Drzewo decyzyjne przedstawia mapę wszystkich możliwych wyników poszczególnych wyborów. Pomoże Ci zaplanować przyszłe działania w różnych scenariuszach zgodnie z różnymi wyborami. Możesz porównać te możliwe wyniki na podstawie ich prawdopodobieństwa i kosztów.

Jak sama nazwa wskazuje, drzewo decyzyjne przedstawia wykres przypominający drzewo. Jest to model decyzji wraz z wynikami i konsekwencjami każdej z nich. Jego ostatecznym celem jest pomoc w prawidłowym przeprowadzeniu klasyfikacji przy jak najmniejszej możliwej liczbie wyborów.

Możesz również reprezentować funkcje logiczne za pomocą drzew decyzyjnych. Każdy węzeł liścia drzewa decyzyjnego jest etykietą klasy, a wewnętrzne węzły drzewa przedstawiają atrybuty. Zaczynają od jednego węzła, a następnie rozgałęziają się na wszystkie możliwości. Każda z tych gałęzi prowadzi do większej liczby węzłów, które reprezentują inne możliwe konsekwencje. Możesz stworzyć drzewo decyzyjne w Javie.

Drzewo decyzyjne ma różne rodzaje węzłów:

Węzły decyzyjne
Węzły szans
Węzły końcowe

Węzły końcowe odzwierciedlają końcowy wynik ścieżki decyzyjnej, podczas gdy węzły szansy pokazują szanse na określone wyniki. Węzły decyzyjne wskazują decyzję, którą podejmiesz, prowadzącą do możliwych wyników. Możesz używać drzew decyzyjnych do mapowania przewidywań algorytmicznych, a także do podejmowania nieformalnych decyzji.

Teraz, gdy już wiesz, czym jest drzewo decyzyjne, powinniśmy skupić się na kopaniu głębiej i zrozumieć, dlaczego jest powszechne. Zanurzmy się.

Zastosowania drzewa decyzyjnego

Oto kilka zastosowań drzew decyzyjnych, dzięki którym możesz zobaczyć, jak powszechne są:

Banki wykorzystują je do klasyfikacji wniosków kredytowych
Specjaliści ds. finansów używają drzew decyzyjnych do wyceny opcji
Kategoryzacja prac egzaminacyjnych według poziomu wiedzy kandydatów
Wybór, czy przyjąć lub odrzucić ofertę pracy
Podejmowanie istotnych decyzji biznesowych, np. czy firma powinna zmodyfikować swój produkt, czy nie.

Musiałeś sam używać drzew decyzyjnych przy dokonywaniu różnych wyborów w swoim życiu. Po prostu wymyśl kilka scenariuszy, w których musiałeś podjąć skomplikowaną decyzję.

Zalety drzewa decyzyjnego

Korzystanie z drzewa decyzyjnego ma wiele zalet. Oto one:

Drzewa decyzyjne tworzą reguły, które można łatwo zrozumieć. Nie miałbyś trudności z przekazaniem tych zasad innym systemom.
Mogą obsługiwać zarówno zmienne kategoryczne, jak i ciągłe
Drzewo decyzyjne w prosty sposób wskaże znaczenie każdego pola. Możesz łatwo przewidywać (lub klasyfikować) według tego samego.
Drzewa decyzyjne dokonują również niejawnego wyboru funkcji, co pomaga w eksploracji danych.

Dowiedz się więcej: Algorytmy sztucznej inteligencji

Wady drzewa decyzyjnego

Wszystko ma swoje wady, a drzewa decyzyjne nie są wyjątkiem. Oto kilka problemów z ich używaniem:

Drzewa decyzyjne nie są przydatne do wykonywania zadań szacowania. Dzieje się tak, ponieważ takie zadania wymagają przewidywania wartości ciągłego atrybutu, a drzewa decyzyjne nie są w tym dobre.
Pod względem obliczeniowym drzewa decyzyjne są droższe niż inne opcje. Nauczenie modelu drzewa decyzyjnego będzie dużo kosztować w porównaniu z innymi modelami. Algorytmy przycinające, których używasz do tworzenia drzew decyzyjnych, są również dość drogie, ponieważ wymagają zbudowania wielu poddrzew.
Jeśli masz dużą liczbę przykładów klas, ale małą liczbę przykładów uczących, twoje drzewa decyzyjne nie byłyby zbyt dokładne, a ich szanse na zawieranie błędów byłyby znacznie wysokie.

Jak stworzyć drzewo decyzyjne

Stwórzmy drzewo decyzyjne, czy ktoś kupi komputer, czy nie. W tym przypadku mielibyśmy dwie klasy, „Tak” i „Nie”. Pierwsza klasa odnosi się do osób, które kupiłyby komputer, a druga do tych, którzy tego nie zrobili. Najpierw obliczymy przyrost informacji i entropię dla tych klas.

Po obliczeniu Entropii tych klas skupimy się na zdobywaniu informacji. Możemy sklasyfikować wartości Entropii w następujący sposób:

Jeśli Entropia wynosi 0, oznacza to, że dane są czyste (jednorodne)

Jeśli Entropia wynosi 1, oznacza to, że dane są nieczyste (podzielone na pół)

Załóżmy, że nasza Entropia jest nieczysta. Następnie podzielimy zysk informacji ze względu na wiek. W ten sposób nasze dane pokażą, ile osób w określonym przedziale wiekowym kupi ten produkt, a ile nie. Możemy obliczyć przyrost informacji dla wielu atrybutów. Jednak w naszym przykładzie stwierdziliśmy, że przyrost informacji jest najwyższy w przypadku „Wiek”, a najniższy w przypadku „Dochodu”. Więc pójdziemy z tym.

Oto zasady klasyfikacji dla tego drzewa decyzyjnego:

Jeśli ktoś ma mniej niż 30 lat i nie jest studentem, nie kupi produktu, więc:

Wiek (<30) ^ uczeń (nie) = NIE

Ale jeśli ktoś, kto ma mniej niż 30 lat i jest studentem, kupi produkt:

Wiek (<30)^ uczeń(tak) = TAK

Teraz, jeśli ich wiek mieści się w przedziale od 31 do 40, na pewno kupiliby produkt:

Wiek (31…40) = TAK

Osoba w wieku powyżej 40 lat i wysokim ratingu kredytowym nie kupiłaby:

Wiek (> 40)^ credit_rating (wysoka) = NIE

Z drugiej strony, jeśli osoba, która ma więcej niż 40 lat, ale ma średnią zdolność kredytową, kupiłaby produkt:

Wiek (>40)^ credit_rating (normalny) = TAK

Postępując zgodnie z tymi krokami, będziesz w stanie bez żadnych trudności stworzyć idealne drzewo decyzyjne .

Dowiedz się więcej o: 9 najlepszych bibliotekach uczenia maszynowego, o których powinieneś wiedzieć

Wniosek

Teraz musisz wiedzieć, jak stworzyć drzewo decyzyjne. Możesz dowiedzieć się o wiele więcej o drzewach decyzyjnych i odpowiednich algorytmach z naszego kursu uczenia maszynowego. Jesteśmy pewni, że będziesz mógł tam poszerzyć swoją wiedzę, ponieważ dowiesz się, jak stworzyć drzewo decyzyjne w Javie, jak możesz z nich korzystać w prawdziwym życiu i nie tylko.

Jeśli chcesz dowiedzieć się więcej o uczeniu maszynowym, sprawdź dyplom PG IIIT-B i upGrad w uczeniu maszynowym i sztucznej inteligencji, który jest przeznaczony dla pracujących profesjonalistów i oferuje ponad 450 godzin rygorystycznego szkolenia, ponad 30 studiów przypadków i zadań, IIIT- Status absolwenta B, ponad 5 praktycznych, praktycznych projektów zwieńczenia i pomoc w pracy z najlepszymi firmami.

Poprowadź rewolucję technologiczną napędzaną sztuczną inteligencją

DYPLOM PG Z UCZENIA MASZYNOWEGO I SZTUCZNEJ INTELIGENCJI

Aplikuj teraz