Multinomial Naive Bayes erklärt: Funktion, Vor- und Nachteile, Anwendungen im Jahr 2022

Veröffentlicht: 2021-01-03

Inhaltsverzeichnis

Einführung

Es gibt Tausende von Software oder Tools für die Analyse numerischer Daten, aber nur sehr wenige für Texte. Multinomial Naive Bayes ist eine der beliebtesten Klassifikationen für überwachtes Lernen, die für die Analyse der kategorialen Textdaten verwendet wird.

Die Klassifizierung von Textdaten wird immer beliebter, da in E-Mails, Dokumenten, Websites usw. eine enorme Menge an Informationen verfügbar ist, die analysiert werden müssen. Den Kontext um eine bestimmte Art von Text herum zu kennen, hilft dabei, die Wahrnehmung einer Software oder eines Produkts für Benutzer zu finden, die es verwenden werden.

Dieser Artikel vermittelt Ihnen ein tiefes Verständnis des multinomialen Naive-Bayes-Algorithmus und aller damit verbundenen Konzepte. Wir geben einen kurzen Überblick über den Algorithmus, seine Funktionsweise, seine Vorteile und seine Anwendungen.

Was ist der Multinomial Naive Bayes Algorithmus?

Der multinomiale Naive-Bayes-Algorithmus ist eine probabilistische Lernmethode, die hauptsächlich in der Verarbeitung natürlicher Sprache (NLP) verwendet wird. Der Algorithmus basiert auf dem Bayes-Theorem und sagt das Tag eines Textes wie einer E-Mail oder eines Zeitungsartikels voraus. Es berechnet die Wahrscheinlichkeit jedes Tags für eine gegebene Probe und gibt dann das Tag mit der höchsten Wahrscheinlichkeit als Ausgabe aus.

Der Naive Bayes-Klassifikator ist eine Sammlung vieler Algorithmen, bei denen alle Algorithmen ein gemeinsames Prinzip haben, und das heißt, dass jedes zu klassifizierende Merkmal nicht mit einem anderen Merkmal zusammenhängt. Das Vorhandensein oder Fehlen eines Merkmals beeinflusst nicht das Vorhandensein oder Fehlen des anderen Merkmals.

Nehmen Sie online am Machine Learning Training der weltbesten Universitäten teil – Master, Executive Post Graduate Programs und Advanced Certificate Program in ML & AI, um Ihre Karriere zu beschleunigen.

Wie funktioniert Multinomial Naive Bayes?

Naive Bayes ist ein leistungsfähiger Algorithmus, der für die Textdatenanalyse und bei Problemen mit mehreren Klassen verwendet wird. Um die Funktionsweise des Naive-Bayes-Theorems zu verstehen, ist es wichtig, zuerst das Konzept des Bayes-Theorems zu verstehen, da es auf letzterem basiert.

Das von Thomas Bayes formulierte Bayes-Theorem berechnet die Wahrscheinlichkeit, dass ein Ereignis eintritt, basierend auf der vorherigen Kenntnis der mit einem Ereignis verbundenen Bedingungen. Es basiert auf folgender Formel:

P(A|B) = P(A) * P(B|A)/P(B)

Wobei wir die Wahrscheinlichkeit von Klasse A berechnen, wenn Prädiktor B bereits bereitgestellt wird.

P(B) = vorherige Wahrscheinlichkeit von B

P(A) = vorherige Wahrscheinlichkeit der Klasse A

P(B|A) = Auftreten von Prädiktor B bei gegebener Wahrscheinlichkeit der Klasse A

Diese Formel hilft bei der Berechnung der Wahrscheinlichkeit der Tags im Text.

Lassen Sie uns den Naive-Bayes-Algorithmus anhand eines Beispiels verstehen. In der unten angegebenen Tabelle haben wir einen Datensatz von Wetterbedingungen genommen, die sonnig, bewölkt und regnerisch sind. Jetzt müssen wir die Wahrscheinlichkeit vorhersagen, ob die Spieler basierend auf den Wetterbedingungen spielen werden.

Muss gelesen werden: Einführung in Naive Bayes

Trainingsdatensatz

Wetter

Sonnig

Bedeckt

Regnerisch

Sonnig

Bedeckt

Regnerisch

Sonnig

Regnerisch

Sonnig

Bedeckt

Regnerisch

Spiel

Nein

Jawohl

Nein

Jawohl

Nein

Jawohl

Nein

Dies kann leicht berechnet werden, indem Sie die folgenden Schritte ausführen:

Erstellen Sie eine Häufigkeitstabelle des in der obigen Problemstellung angegebenen Trainingsdatensatzes. Listen Sie die Zählung aller Wetterbedingungen gegenüber der jeweiligen Wetterbedingung auf.

Wetter	Jawohl	Nein
Sonnig	3	2
Bedeckt	4	0
Regnerisch	2	3
Gesamt	9	5

Finden Sie die Wahrscheinlichkeiten für jede Wetterlage heraus und erstellen Sie eine Wahrscheinlichkeitstabelle.

Wetter	Jawohl	Nein
Sonnig	3	2	=5/14(0,36)
Bedeckt	4	0	=4/14(0,29)
Regnerisch	2	3	=5/14(0,36)
Gesamt	9	5
	=9/14 (0,64)	=5/14 (0,36)

Berechnen Sie die A-posteriori-Wahrscheinlichkeit für jede Wetterbedingung unter Verwendung des Naive-Bayes-Theorems. Die Wetterlage mit der höchsten Wahrscheinlichkeit ist das Ergebnis, ob die Spieler spielen werden oder nicht.

Verwenden Sie die folgende Gleichung, um die spätere Wahrscheinlichkeit aller Wetterbedingungen zu berechnen:

P(A|B) = P(A) * P(B|A)/P(B)

Nach dem Ersetzen von Variablen in der obigen Formel erhalten wir:

P(ja|sonnig) = P(ja) * P(sonnig|ja) / P(sonnig)

Nehmen Sie die Werte aus der obigen Wahrscheinlichkeitstabelle und setzen Sie sie in die obige Formel ein.

P(sonnig|ja) = 3/9 = 0,33, P(ja) = 0,64 und P(sonnig) = 0,36

Daher ist P(Ja|Sonnig) = (0,64*0,33)/0,36 = 0,60

P(Nein|Sonnig) = P(Nein) * P(Sonnig|Nein) / P(Sonnig)

Nehmen Sie die Werte aus der obigen Wahrscheinlichkeitstabelle und setzen Sie sie in die obige Formel ein.

P(sonnig|nein) = 2/5 = 0,40, P(nein) = 0,36 und P(sonnig) = 0,36

P(Nein|Sonnig) = (0,36*0,40)/0,36 = 0,6 = 0,40

Die Wahrscheinlichkeit, bei sonnigem Wetter zu spielen, ist höher. Daher spielt der Spieler bei sonnigem Wetter.

In ähnlicher Weise können wir die spätere Wahrscheinlichkeit von regnerischen und bewölkten Bedingungen berechnen und basierend auf der höchsten Wahrscheinlichkeit; wir können vorhersagen, ob der Spieler spielen wird.

Checkout: Modelle für maschinelles Lernen erklärt

Vorteile

Der Naive-Bayes-Algorithmus hat folgende Vorteile:

Es ist einfach zu implementieren, da Sie nur die Wahrscheinlichkeit berechnen müssen.
Sie können diesen Algorithmus sowohl für kontinuierliche als auch für diskrete Daten verwenden.
Es ist einfach und kann zur Vorhersage von Echtzeitanwendungen verwendet werden.
Es ist hochgradig skalierbar und kann problemlos große Datensätze verarbeiten.

Nachteile

Der Naive-Bayes-Algorithmus hat folgende Nachteile:

Die Vorhersagegenauigkeit dieses Algorithmus ist geringer als die der anderen Wahrscheinlichkeitsalgorithmen.
Es ist nicht für eine Regression geeignet. Der Naive-Bayes-Algorithmus wird nur für die Klassifizierung von Textdaten verwendet und kann nicht zur Vorhersage numerischer Werte verwendet werden.

Anwendungen

Der Naive-Bayes-Algorithmus wird an folgenden Stellen verwendet:

Gesichtserkennung
Wettervorhersage
Medizinische Diagnose
Spam-Erkennung
Alters-/Geschlechtsidentifikation
Spracherkennung
Sentimentale Analyse
Urheberidentifikation
Nachrichtenklassifizierung

Fazit

Es lohnt sich, den Multinomial Naive Bayes-Algorithmus zu lernen, da er so viele Anwendungen in verschiedenen Branchen hat und die von diesem Algorithmus getroffenen Vorhersagen sehr schnell sind. Die Nachrichtenklassifizierung ist einer der beliebtesten Anwendungsfälle des Naive-Bayes-Algorithmus. Es wird häufig verwendet, um Nachrichten in verschiedene Abschnitte wie politisch, regional, global usw. zu klassifizieren.

Dieser Artikel behandelt Schritt für Schritt alles, was Sie wissen sollten, um mit dem Multinomial Naive Bayes-Algorithmus und der Funktionsweise des Naive Bayes-Klassifikators zu beginnen.

Wenn Sie mehr über KI und maschinelles Lernen erfahren möchten, sehen Sie sich das Executive PG-Programm von IIIT-B & upGrad für maschinelles Lernen und KI an, das für Berufstätige konzipiert ist und mehr als 450 Stunden strenge Schulungen, mehr als 30 Fallstudien und Aufgaben bietet , IIIT-B-Alumni-Status, mehr als 5 praktische Schlusssteinprojekte und Arbeitsunterstützung bei Top-Unternehmen.

Was meinst du mit multinomialem Naive-Bayes-Algorithmus?

Der Multinomial Naive Bayes-Algorithmus ist ein bayesianischer Lernansatz, der in der Verarbeitung natürlicher Sprache (NLP) beliebt ist. Das Programm errät das Tag eines Textes, beispielsweise einer E-Mail oder eines Zeitungsartikels, mithilfe des Bayes-Theorems. Es berechnet die Wahrscheinlichkeit jedes Tags für eine gegebene Probe und gibt das Tag mit der größten Wahrscheinlichkeit aus. Der Naive-Bayes-Klassifikator besteht aus einer Reihe von Algorithmen, die alle eines gemeinsam haben: Jedes klassifizierte Merkmal steht in keinem Zusammenhang mit einem anderen Merkmal. Das Vorhandensein oder Fehlen eines Merkmals hat keinen Einfluss auf die Aufnahme oder den Ausschluss eines anderen Merkmals.

Wie funktioniert der multinomiale Naive-Bayes-Algorithmus?

Die Naive-Bayes-Methode ist ein starkes Werkzeug, um Texteingaben zu analysieren und Probleme mit zahlreichen Klassen zu lösen. Da das Naive-Bayes-Theorem auf dem Bayes-Theorem basiert, ist es notwendig, zuerst den Begriff des Bayes-Theorems zu verstehen. Das Bayes-Theorem, das von Thomas Bayes entwickelt wurde, schätzt die Eintrittswahrscheinlichkeit auf der Grundlage der Vorkenntnisse über die Bedingungen des Ereignisses. Wenn Prädiktor B selbst verfügbar ist, berechnen wir die Wahrscheinlichkeit von Klasse A. Sie basiert auf der folgenden Formel: P(A|B) = P(A) * P(B|A)/P(B).

Was sind die Vor- und Nachteile des multinomialen Naive-Bayes-Algorithmus?

Es ist einfach zu implementieren, da Sie lediglich die Wahrscheinlichkeit berechnen müssen. Dieser Ansatz funktioniert sowohl mit kontinuierlichen als auch mit diskreten Daten. Es ist unkompliziert und kann zur Vorhersage von Echtzeitanwendungen verwendet werden. Es ist sehr skalierbar und kann problemlos mit enormen Datensätzen umgehen.

Die Vorhersagegenauigkeit dieses Algorithmus ist geringer als die anderer Wahrscheinlichkeitsalgorithmen. Es ist nicht geeignet für eine Regression. Die Naive-Bayes-Technik kann nur zum Klassifizieren von Texteingaben und nicht zum Schätzen numerischer Werte verwendet werden.