So erstellen Sie einen perfekten Entscheidungsbaum | Entscheidungsbaumalgorithmus [mit Beispielen]
Veröffentlicht: 2020-03-30Wenn Sie sich gefragt haben, „wie man einen Entscheidungsbaum erstellt“ oder „kann ich einen Entscheidungsbaum in Java erstellen“, sind Sie hier genau richtig. In diesem Artikel finden wir Antworten auf solche Fragen, da wir ausführlich auf Entscheidungsbäume eingehen werden. Sie erfahren, was sie sind, warum sie so beliebt sind und wie Sie einen davon erstellen können.
Bevor Sie einen Entscheidungsbaum erstellen, müssen Sie mit mehreren anderen Themen wie linearer Regression und Algorithmen vertraut sein.
Weiterlesen: Entscheidungsbaum in R
Inhaltsverzeichnis
Was ist ein Entscheidungsbaum?
Ein Entscheidungsbaum gibt Ihnen eine Karte aller möglichen Ergebnisse bestimmter Auswahlen. Es kann Ihnen helfen, die zukünftigen Aktionen unter verschiedenen Szenarien gemäß verschiedenen Entscheidungen zu planen. Sie können diese möglichen Ergebnisse anhand ihrer Wahrscheinlichkeiten und Kosten vergleichen.
Wie der Name schon sagt, zeigt ein Entscheidungsbaum einen baumähnlichen Graphen. Es ist ein Modell von Entscheidungen, zusammen mit den Ergebnissen und Konsequenzen jeder einzelnen von ihnen. Das ultimative Ziel besteht darin, Ihnen dabei zu helfen, die Klassifizierung korrekt durchzuführen und gleichzeitig die geringstmögliche Anzahl von Auswahlmöglichkeiten zu wählen.
Sie können boolesche Funktionen auch mithilfe von Entscheidungsbäumen darstellen. Jeder Blattknoten eines Entscheidungsbaums ist eine Klassenbezeichnung, und die internen Knoten des Baums zeigen die Attribute. Sie beginnen mit einem Knoten und verzweigen sich dann in alle Möglichkeiten. Jeder dieser Zweige führt zu weiteren Knoten, die andere mögliche Konsequenzen darstellen. Sie können einen Entscheidungsbaum in Java erstellen.

Ein Entscheidungsbaum hat verschiedene Arten von Knoten:
- Entscheidungsknoten
- Zufallsknoten
- Endknoten
Die Endknoten spiegeln das Endergebnis eines Entscheidungspfads wider, während die Zufallsknoten die Chancen bestimmter Ergebnisse zeigen. Die Entscheidungsknoten geben die Entscheidung an, die Sie treffen werden und die zu den möglichen Ergebnissen führen würde. Sie können Entscheidungsbäume verwenden, um algorithmische Vorhersagen abzubilden und informelle Entscheidungen zu treffen.
Nachdem Sie nun wissen, was ein Entscheidungsbaum ist, sollten wir uns darauf konzentrieren, etwas tiefer zu graben und zu verstehen, warum er weit verbreitet ist. Tauchen wir ein.
Anwendungen des Entscheidungsbaums
Hier sind einige Anwendungen von Entscheidungsbäumen, damit Sie sehen können, wie verbreitet sie sind:
- Banken verwenden sie, um ihre Kreditanträge zu klassifizieren
- Finanzfachleute verwenden Entscheidungsbäume für die Preisgestaltung von Optionen
- Kategorisierung von Prüfungsarbeiten nach dem Kenntnisstand der Kandidaten
- Entscheidung, ein Stellenangebot anzunehmen oder abzulehnen
- Wichtige Geschäftsentscheidungen treffen, z. B. ob ein Unternehmen sein Produkt ändern sollte oder nicht.
Sie müssen selbst Entscheidungsbäume verwendet haben, um verschiedene Entscheidungen in Ihrem Leben zu treffen. Überlegen Sie sich einfach ein paar Szenarien, in denen Sie eine komplizierte Entscheidung treffen mussten.
Vorteile des Entscheidungsbaums
Die Verwendung eines Entscheidungsbaums hat viele Vorteile. Hier sind sie:
- Entscheidungsbäume erzeugen Regeln, die Sie leicht verstehen können. Sie hätten keine Schwierigkeiten, diese Regeln auf andere Systeme zu übertragen.
- Sie können sowohl kategoriale als auch kontinuierliche Variablen verarbeiten
- Ein Entscheidungsbaum gibt Ihnen einen einfachen Hinweis auf die Wichtigkeit jedes Feldes. Sie können danach leicht Vorhersagen (oder Klassifizierungen) treffen.
- Entscheidungsbäume führen auch implizit eine Merkmalsauswahl durch, die Ihnen bei der Datenexploration hilft.
Erfahren Sie mehr: Algorithmen der künstlichen Intelligenz

Nachteile des Entscheidungsbaums
Alles hat seine Fehler, und Entscheidungsbäume sind da keine Ausnahme. Hier sind einige Probleme bei der Verwendung:
- Entscheidungsbäume sind für die Durchführung von Schätzaufgaben nicht nützlich. Das liegt daran, dass solche Jobs die Vorhersage des Werts eines kontinuierlichen Attributs erfordern, und Entscheidungsbäume sind dafür nicht gut.
- Rechentechnisch sind Entscheidungsbäume teurer als andere Optionen. Es kostet Sie viel, ein Entscheidungsbaummodell im Vergleich zu anderen auch zu trainieren. Die Beschneidungsalgorithmen, die Sie zum Erstellen von Entscheidungsbäumen verwenden würden, sind auch ziemlich teuer, da sie viele Unterbäume erstellen müssen.
- Wenn Sie eine große Anzahl von Klassenbeispielen, aber eine geringe Anzahl von Trainingsbeispielen haben, wären Ihre Entscheidungsbäume nicht sehr genau, und ihre Wahrscheinlichkeit, Fehler zu enthalten, wäre sehr hoch.
So erstellen Sie einen Entscheidungsbaum
Lassen Sie uns einen Entscheidungsbaum darüber erstellen, ob eine Person einen Computer kaufen würde oder nicht. In diesem Fall hätten wir zwei Klassen, „Ja“ und „Nein“. Die erste Klasse bezieht sich auf die Leute, die einen Computer kaufen würden, während die zweite sich auf diejenigen bezieht, die dies nicht tun würden. Zuerst berechnen wir den Informationsgewinn und die Entropie für diese Klassen.
Sobald wir die Entropie dieser Klassen berechnet haben, konzentrieren wir uns auf den Informationsgewinn. Wir können die Werte der Entropie wie folgt klassifizieren:
Wenn die Entropie 0 ist, bedeutet dies, dass die Daten rein (homogen) sind.
Wenn die Entropie 1 ist, bedeutet dies, dass die Daten unrein (halbgeteilt) sind.
Nehmen wir an, unsere Entropie ist unrein. Dann teilen wir den Informationsgewinn nach Alter auf. Auf diese Weise zeigen unsere Daten, wie viele Personen einer bestimmten Altersgruppe dieses Produkt kaufen werden und wie viele nicht. Wir können den Informationsgewinn für mehrere Attribute berechnen. Aber in unserem Beispiel haben wir festgestellt, dass der Informationsgewinn für „Alter“ am höchsten und für „Einkommen“ am niedrigsten ist. Also gehen wir damit.
Hier sind die Klassifizierungsregeln für diesen Entscheidungsbaum:
Wenn jemand jünger als 30 Jahre alt ist und diese Person kein Student ist, wird er das Produkt nicht kaufen, also:
Alter (<30) ^ Schüler(nein) = NEIN
Aber wenn jemand unter 30 Jahre alt ist und Student ist, würde er das Produkt kaufen:
Alter (<30)^ Schüler(ja) = JA
Wenn ihr Alter nun zwischen 31 und 40 liegt, würden sie das Produkt sicherlich kaufen:
Alter (31…40) = JA
Eine Person mit einem Alter von über 40 Jahren und einer hohen Kreditwürdigkeit würde Folgendes nicht kaufen:
Alter(>40)^ credit_rating(high) = NEIN
Wenn hingegen eine Person, die älter als 40 Jahre ist, aber eine durchschnittliche Bonität hat, würde sie das Produkt kaufen:

Alter(>40)^ credit_rating(normal) = JA
Wenn Sie diese Schritte befolgen, können Sie problemlos den perfekten Entscheidungsbaum erstellen .
Erfahren Sie mehr über: Top 9 Bibliotheken für maschinelles Lernen, die Sie kennen sollten
Fazit
Jetzt müssen Sie wissen, wie man einen Entscheidungsbaum erstellt. In unserem Machine-Learning-Kurs erfahren Sie noch viel mehr über Entscheidungsbäume und die dazugehörigen Algorithmen. Wir sind sicher, dass Sie dort Ihr Wissen erweitern werden, da Sie lernen, wie Sie einen Entscheidungsbaum in Java erstellen, wie Sie ihn im wirklichen Leben verwenden können und vieles mehr.
Wenn Sie mehr über maschinelles Lernen erfahren möchten, sehen Sie sich das PG-Diplom in maschinellem Lernen und KI von IIIT-B & upGrad an, das für Berufstätige konzipiert ist und mehr als 450 Stunden strenge Schulungen, mehr als 30 Fallstudien und Aufgaben bietet, IIIT- B-Alumni-Status, mehr als 5 praktische, praktische Abschlussprojekte und Jobunterstützung bei Top-Unternehmen.