Multinomial Naive Bayes explicado: função, vantagens e desvantagens, aplicações em 2022

Publicados: 2021-01-03

Índice

Introdução

Existem milhares de softwares ou ferramentas para análise de dados numéricos, mas são muito poucos para textos. Multinomial Naive Bayes é uma das classificações de aprendizado supervisionado mais populares que é usada para a análise dos dados de texto categórico.

A classificação de dados de texto está ganhando popularidade porque há uma enorme quantidade de informações disponíveis em e-mail, documentos, sites, etc. que precisam ser analisadas. Conhecer o contexto em torno de um determinado tipo de texto ajuda a encontrar a percepção de um software ou produto para os usuários que irão utilizá-lo.

Este artigo lhe dará uma compreensão profunda do algoritmo multinomial Naive Bayes e todos os conceitos relacionados a ele. Passamos por uma breve visão geral do algoritmo, como ele funciona, seus benefícios e suas aplicações.

O que é o algoritmo Multinomial Naive Bayes?

O algoritmo Multinomial Naive Bayes é um método de aprendizado probabilístico que é usado principalmente em Processamento de Linguagem Natural (PLN). O algoritmo é baseado no teorema de Bayes e prevê a tag de um texto, como um pedaço de e-mail ou artigo de jornal. Ele calcula a probabilidade de cada tag para uma determinada amostra e, em seguida, fornece a tag com a maior probabilidade como saída.

O classificador Naive Bayes é uma coleção de muitos algoritmos onde todos os algoritmos compartilham um princípio comum, ou seja, cada recurso sendo classificado não está relacionado a nenhum outro recurso. A presença ou ausência de um recurso não afeta a presença ou ausência do outro recurso.

Participe do Treinamento de Aprendizado de Máquina on-line das principais universidades do mundo - Mestrados, Programas de Pós-Graduação Executiva e Programa de Certificado Avançado em ML e IA para acelerar sua carreira.

Como funciona o Multinomial Naive Bayes?

Naive Bayes é um algoritmo poderoso que é usado para análise de dados de texto e com problemas com várias classes. Para entender o funcionamento do teorema de Naive Bayes, é importante entender primeiro o conceito do teorema de Bayes, pois é baseado no último.

O teorema de Bayes, formulado por Thomas Bayes, calcula a probabilidade de um evento ocorrer com base no conhecimento prévio das condições relacionadas a um evento. É baseado na seguinte fórmula:

P(A|B) = P(A) * P(B|A)/P(B)

Onde estamos calculando a probabilidade da classe A quando o preditor B já é fornecido.

P(B) = probabilidade anterior de B

P(A) = probabilidade anterior de classe A

P(B|A) = ocorrência do preditor B dada a probabilidade de classe A

Essa fórmula ajuda a calcular a probabilidade das tags no texto.

Vamos entender o algoritmo Naive Bayes com um exemplo. Na tabela abaixo, pegamos um conjunto de dados de condições climáticas com sol, céu nublado e chuva. Agora, precisamos prever a probabilidade de os jogadores jogarem com base nas condições climáticas.

Deve ler: Introdução a Naive Bayes

Conjunto de dados de treinamento

Clima

Ensolarado

Nublado

Chuvoso

Ensolarado

Nublado

Chuvoso

Ensolarado

Chuvoso

Ensolarado

Nublado

Chuvoso

Jogar

Não

sim

Não

sim

Não

sim

Não

Isso pode ser facilmente calculado seguindo as etapas abaixo:

Crie uma tabela de frequência do conjunto de dados de treinamento fornecido na declaração do problema acima. Liste a contagem de todas as condições meteorológicas em relação à respectiva condição meteorológica.

Clima	sim	Não
Ensolarado	3	2
Nublado	4	0
Chuvoso	2	3
Total	9	5

Encontre as probabilidades de cada condição meteorológica e crie uma tabela de probabilidade.

Clima	sim	Não
Ensolarado	3	2	=5/14(0,36)
Nublado	4	0	=4/14(0,29)
Chuvoso	2	3	=5/14(0,36)
Total	9	5
	=9/14 (0,64)	=5/14 (0,36)

Calcule a probabilidade posterior para cada condição meteorológica usando o teorema de Naive Bayes. A condição meteorológica com maior probabilidade será o resultado de os jogadores jogarem ou não.

Use a seguinte equação para calcular a probabilidade posterior de todas as condições meteorológicas:

P(A|B) = P(A) * P(B|A)/P(B)

Após substituir as variáveis na fórmula acima, obtemos:

P(Sim|Ensolarado) = P(Sim) * P(Ensolarado|Sim) / P(Ensolarado)

Pegue os valores da tabela de probabilidade acima e coloque-os na fórmula acima.

P(Ensolarado|Sim) = 3/9 = 0,33, P(Sim) = 0,64 e P(Ensolarado) = 0,36

Portanto, P(Sim|Ensolarado) = (0,64*0,33)/0,36 = 0,60

P(Não|Ensolarado) = P(Não) * P(Ensolarado|Não) / P(Ensolarado)

Pegue os valores da tabela de probabilidade acima e coloque-os na fórmula acima.

P(Ensolarado|Não) = 2/5 = 0,40, P(Não) = 0,36 e P(Ensolarado) = 0,36

P(Não|Ensolarado) = (0,36*0,40)/0,36 = 0,6 = 0,40

A probabilidade de jogar em condições de tempo ensolarado é maior. Assim, o jogador jogará se o tempo estiver ensolarado.

Da mesma forma, podemos calcular a probabilidade posterior de condições de chuva e nublado, e com base na probabilidade mais alta; podemos prever se o jogador vai jogar.

Checkout: modelos de aprendizado de máquina explicados

Vantagens

O algoritmo Naive Bayes tem as seguintes vantagens:

É fácil de implementar, pois você só precisa calcular a probabilidade.
Você pode usar esse algoritmo em dados contínuos e discretos.
É simples e pode ser usado para prever aplicações em tempo real.
É altamente escalável e pode lidar facilmente com grandes conjuntos de dados.

Desvantagens

O algoritmo Naive Bayes tem as seguintes desvantagens:

A precisão de previsão deste algoritmo é menor do que os outros algoritmos de probabilidade.
Não é adequado para regressão. O algoritmo Naive Bayes é usado apenas para classificação de dados textuais e não pode ser usado para prever valores numéricos.

Formulários

O algoritmo Naive Bayes é usado nos seguintes locais:

Reconhecimento facial
Previsão do tempo
Diagnóstico médico
Detecção de spam
Identificação de idade/sexo
Identificação do idioma
Análise sentimental
Identificação de autoria
Classificação de notícias

Conclusão

Vale a pena aprender o algoritmo Multinomial Naive Bayes, pois tem tantas aplicações em diversos setores, e as previsões feitas por este algoritmo são muito rápidas. A classificação de notícias é um dos casos de uso mais populares do algoritmo Naive Bayes. É muito usado para classificar notícias em diferentes seções, como política, regional, global e assim por diante.

Este artigo cobre tudo o que você deve saber para começar com o algoritmo Multinomial Naive Bayes e o funcionamento do classificador Naive Bayes passo a passo.

Se você estiver interessado em aprender mais sobre IA, aprendizado de máquina, confira o Programa PG Executivo do IIIT-B e do upGrad em Machine Learning e IA , projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições , IIIT-B Alumni status, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.

O que você quer dizer com algoritmo multinomial naive bayes?

O algoritmo Multinomial Naive Bayes é uma abordagem de aprendizagem Bayesiana popular em Processamento de Linguagem Natural (NLP). O programa adivinha a tag de um texto, como um e-mail ou uma notícia de jornal, usando o teorema de Bayes. Ele calcula a probabilidade de cada tag para uma determinada amostra e gera a tag com a maior chance. O classificador Naive Bayes é composto de vários algoritmos que têm uma coisa em comum: cada recurso classificado não está relacionado a nenhum outro recurso. A existência ou ausência de um recurso não tem influência na inclusão ou exclusão de outro recurso.

Como funciona o algoritmo multinomial naive bayes?

O método Naive Bayes é uma ferramenta forte para analisar a entrada de texto e resolver problemas com várias classes. Como o teorema de Naive Bayes é baseado no teorema de Bayes, é necessário primeiro compreender a noção do teorema de Bayes. O teorema de Bayes, desenvolvido por Thomas Bayes, estima a probabilidade de ocorrência com base no conhecimento prévio das condições do evento. Quando o próprio preditor B está disponível, calculamos a probabilidade da classe A. Ela é baseada na fórmula abaixo: P(A|B) = P(A) * P(B|A)/P(B).

Quais são as vantagens e desvantagens do algoritmo multinomial naive bayes?

É simples de implementar porque tudo o que você precisa fazer é calcular a probabilidade. Essa abordagem funciona com dados contínuos e discretos. É simples e pode ser usado para prever aplicações em tempo real. É muito escalável e pode lidar com enormes conjuntos de dados com facilidade.

A precisão de previsão desse algoritmo é menor do que a de outros algoritmos de probabilidade. Não é apropriado para regressão. A técnica Naive Bayes só pode ser usada para classificar a entrada textual e não pode ser usada para estimar valores numéricos.