Spiegazione di Bayes ingenuo multinomiale: funzione, vantaggi e svantaggi, applicazioni nel 2022

Pubblicato: 2021-01-03

Sommario

introduzione

Esistono migliaia di software o strumenti per l'analisi dei dati numerici ma ce ne sono pochissimi per i testi. Multinomiale Naive Bayes è una delle classificazioni di apprendimento supervisionato più popolari utilizzata per l'analisi dei dati del testo categoriale.

La classificazione dei dati di testo sta guadagnando popolarità perché c'è un'enorme quantità di informazioni disponibili in e-mail, documenti, siti Web, ecc. che devono essere analizzate. Conoscere il contesto attorno a un certo tipo di testo aiuta a trovare la percezione di un software o prodotto per gli utenti che lo utilizzeranno.

Questo articolo ti fornirà una conoscenza approfondita dell'algoritmo multinomiale Naive Bayes e di tutti i concetti ad esso correlati. Esaminiamo una breve panoramica dell'algoritmo, del suo funzionamento, dei suoi vantaggi e delle sue applicazioni.

Che cos'è l'algoritmo multinomiale Naive Bayes?

L'algoritmo multinomiale Naive Bayes è un metodo di apprendimento probabilistico utilizzato principalmente nell'elaborazione del linguaggio naturale (NLP). L'algoritmo si basa sul teorema di Bayes e prevede il tag di un testo come un messaggio di posta elettronica o un articolo di giornale. Calcola la probabilità di ciascun tag per un dato campione e quindi fornisce il tag con la probabilità più alta come output.

Il classificatore Naive Bayes è una raccolta di molti algoritmi in cui tutti gli algoritmi condividono un principio comune, ovvero ogni caratteristica che viene classificata non è correlata a nessun'altra caratteristica. La presenza o l'assenza di una caratteristica non pregiudica la presenza o l'assenza dell'altra caratteristica.

Partecipa al Machine Learning Training online dalle migliori università del mondo: master, programmi post-laurea per dirigenti e programma di certificazione avanzata in ML e AI per accelerare la tua carriera.

Come funziona il multinomiale Naive Bayes?

Naive Bayes è un potente algoritmo utilizzato per l'analisi dei dati di testo e con problemi con più classi. Per comprendere il funzionamento del teorema di Naive Bayes, è importante comprendere prima il concetto del teorema di Bayes poiché si basa su quest'ultimo.

Il teorema di Bayes, formulato da Thomas Bayes, calcola la probabilità che un evento si verifichi in base alla conoscenza preliminare delle condizioni relative a un evento. Si basa sulla seguente formula:

P(A|B) = P(A) * P(B|A)/P(B)

Dove stiamo calcolando la probabilità della classe A quando il predittore B è già fornito.

P(B) = probabilità a priori di B

P(A) = probabilità a priori della classe A

P(B|A) = occorrenza del predittore B data la probabilità di classe A

Questa formula aiuta a calcolare la probabilità dei tag nel testo.

Cerchiamo di capire l'algoritmo di Naive Bayes con un esempio. Nella tabella seguente, abbiamo preso un set di dati di condizioni meteorologiche soleggiate, nuvolose e piovose. Ora, dobbiamo prevedere la probabilità che i giocatori giocheranno in base alle condizioni meteorologiche.

Da leggere: Introduzione a Naive Bayes

Set di dati di allenamento

Tempo metereologico Soleggiato Nuvoloso Piovoso Soleggiato Soleggiato Nuvoloso Piovoso Piovoso Soleggiato Piovoso Soleggiato Nuvoloso Nuvoloso Piovoso
Giocare No No No No No

Questo può essere facilmente calcolato seguendo i passaggi indicati di seguito:

Creare una tabella di frequenza del set di dati di addestramento fornito nella dichiarazione del problema precedente. Elenca il conteggio di tutte le condizioni meteorologiche rispetto alle rispettive condizioni meteorologiche.

Tempo metereologico No
Soleggiato 3 2
Nuvoloso 4 0
Piovoso 2 3
Totale 9 5

Trova le probabilità di ciascuna condizione meteorologica e crea una tabella di probabilità.

Tempo metereologico No
Soleggiato 3 2 =5/14(0,36)
Nuvoloso 4 0 =4/14(0,29)
Piovoso 2 3 =5/14(0,36)
Totale 9 5
=9/14 (0,64) =5/14 (0,36)

Calcola la probabilità a posteriori per ogni condizione meteorologica usando il teorema di Naive Bayes. La condizione meteorologica con la più alta probabilità dipenderà dal fatto che i giocatori giocheranno o meno.

Utilizzare la seguente equazione per calcolare la probabilità a posteriori di tutte le condizioni meteorologiche:

P(A|B) = P(A) * P(B|A)/P(B)

Dopo aver sostituito le variabili nella formula precedente, otteniamo:

P(Sì|Soleggiato) = P(Sì) * P(Soleggiato|Sì) / P(Soleggiato)

Prendi i valori dalla tabella di probabilità sopra e inseriscili nella formula sopra.

P(Soleggiato|Sì) = 3/9 = 0,33, P(Sì) = 0,64 e P(Soleggiato) = 0,36

Quindi, P(Sì|Soleggiato) = (0,64*0,33)/0,36 = 0,60

P(No|Soleggiato) = P(No) * P(Soleggiato|No) / P(Soleggiato)

Prendi i valori dalla tabella di probabilità sopra e inseriscili nella formula sopra.

P(Soleggiato|No) = 2/5 = 0,40, P(No) = 0,36 e P(Soleggiato) = 0,36

P(No|Soleggiato) = (0,36*0,40)/0,36 = 0,6 = 0,40

La probabilità di giocare in condizioni di tempo soleggiato è maggiore. Quindi, il giocatore giocherà se il tempo è soleggiato.

Allo stesso modo, possiamo calcolare la probabilità a posteriori di condizioni piovose e nuvolose e in base alla probabilità più alta; possiamo prevedere se il giocatore giocherà.

Checkout: Spiegazione dei modelli di machine learning

Vantaggi

L'algoritmo di Naive Bayes presenta i seguenti vantaggi:

  • È facile da implementare poiché devi solo calcolare la probabilità.
  • È possibile utilizzare questo algoritmo su dati sia continui che discreti.
  • È semplice e può essere utilizzato per prevedere applicazioni in tempo reale.
  • È altamente scalabile e può gestire facilmente set di dati di grandi dimensioni.

Svantaggi

L'algoritmo Naive Bayes presenta i seguenti svantaggi:

  • L'accuratezza di previsione di questo algoritmo è inferiore rispetto agli altri algoritmi di probabilità.
  • Non è adatto per la regressione. L'algoritmo Naive Bayes viene utilizzato solo per la classificazione dei dati testuali e non può essere utilizzato per prevedere valori numerici.

Applicazioni

L'algoritmo Naive Bayes viene utilizzato nei seguenti luoghi:

  • Riconoscimento facciale
  • Previsioni meteo
  • Diagnosi medica
  • Rilevamento spam
  • Identificazione età/sesso
  • Identificazione della lingua
  • Analisi sentimentale
  • Identificazione della paternità
  • Classificazione delle notizie

Conclusione

Vale la pena imparare l'algoritmo Multinomiale Naive Bayes poiché ha così tante applicazioni in diversi settori e le previsioni fatte da questo algoritmo sono molto veloci. La classificazione delle notizie è uno dei casi d'uso più popolari dell'algoritmo di Naive Bayes. È molto usato per classificare le notizie in diverse sezioni come politiche, regionali, globali e così via.

Questo articolo copre tutto ciò che dovresti sapere per iniziare con l'algoritmo multinomiale Naive Bayes e il funzionamento del classificatore Naive Bayes passo dopo passo.

Se sei interessato a saperne di più sull'intelligenza artificiale e sull'apprendimento automatico, dai un'occhiata al programma Executive PG di IIIT-B e upGrad in Machine Learning e AI , progettato per i professionisti che lavorano e offre oltre 450 ore di formazione rigorosa, oltre 30 casi di studio e incarichi , status di Alumni IIIT-B, oltre 5 progetti pratici pratici e assistenza sul lavoro con le migliori aziende.

Cosa intendi per algoritmo di bayes ingenuo multinomiale?

L'algoritmo Multinomial Naive Bayes è un approccio di apprendimento bayesiano popolare nell'elaborazione del linguaggio naturale (NLP). Il programma indovina il tag di un testo, come un'e-mail o un articolo di giornale, utilizzando il teorema di Bayes. Calcola la probabilità di ogni tag per un dato campione e restituisce il tag con le maggiori possibilità. Il classificatore Naive Bayes è composto da una serie di algoritmi che hanno tutti una cosa in comune: ogni caratteristica che viene classificata non è correlata a nessun'altra caratteristica. L'esistenza o l'assenza di una caratteristica non ha alcuna relazione con l'inclusione o l'esclusione di un'altra caratteristica.

Come funziona l'algoritmo multinomiale naive bayes?

Il metodo Naive Bayes è un potente strumento per analizzare l'input di testo e risolvere problemi con numerose classi. Poiché il teorema di Naive Bayes si basa sul teorema di Bayes, è necessario prima comprendere la nozione del teorema di Bayes. Il teorema di Bayes, che è stato sviluppato da Thomas Bayes, stima la probabilità che si verifichi in base alla conoscenza preliminare delle condizioni dell'evento. Quando il predittore B stesso è disponibile, calcoliamo la probabilità della classe A. Si basa sulla formula seguente: P(A|B) = P(A) * P(B|A)/P(B).

Quali sono i vantaggi e gli svantaggi dell'algoritmo di bayes ingenuo multinomiale?

È semplice da implementare perché tutto ciò che devi fare è calcolare la probabilità. Questo approccio funziona sia con dati continui che discreti. È semplice e può essere utilizzato per prevedere applicazioni in tempo reale. È molto scalabile e può gestire con facilità enormi set di dati.

L'accuratezza di previsione di questo algoritmo è inferiore a quella di altri algoritmi di probabilità. Non è appropriato per la regressione. La tecnica Naive Bayes può essere utilizzata solo per classificare l'input testuale e non può essere utilizzata per stimare valori numerici.