Explication de Bayes naïf multinomial : fonction, avantages et inconvénients, applications en 2022
Publié: 2021-01-03Table des matières
introduction
Il existe des milliers de logiciels ou d'outils pour l'analyse de données numériques mais il en existe très peu pour les textes. Multinomial Naive Bayes est l'une des classifications d'apprentissage supervisé les plus populaires utilisées pour l'analyse des données textuelles catégorielles.
La classification des données textuelles gagne en popularité car il existe une énorme quantité d'informations disponibles dans les e-mails, les documents, les sites Web, etc. qui doivent être analysées. Connaître le contexte autour d'un certain type de texte aide à trouver la perception d'un logiciel ou d'un produit aux utilisateurs qui vont l'utiliser.
Cet article vous donnera une compréhension approfondie de l'algorithme multinomial Naive Bayes et de tous les concepts qui y sont liés. Nous passons en revue un bref aperçu de l'algorithme, de son fonctionnement, de ses avantages et de ses applications.
Qu'est-ce que l'algorithme Multinomial Naive Bayes ?
L'algorithme multinomial Naive Bayes est une méthode d'apprentissage probabiliste principalement utilisée dans le traitement du langage naturel (TAL). L'algorithme est basé sur le théorème de Bayes et prédit la balise d'un texte tel qu'un e-mail ou un article de journal. Il calcule la probabilité de chaque balise pour un échantillon donné, puis donne la balise avec la probabilité la plus élevée en sortie.
Le classificateur Naive Bayes est une collection de nombreux algorithmes où tous les algorithmes partagent un principe commun, à savoir que chaque fonctionnalité classée n'est liée à aucune autre fonctionnalité. La présence ou l'absence d'une caractéristique n'affecte pas la présence ou l'absence de l'autre caractéristique.
Rejoignez la formation en apprentissage automatique en ligne des meilleures universités du monde - Masters, programmes de troisième cycle pour cadres et programme de certificat avancé en ML et IA pour accélérer votre carrière.

Comment fonctionne Multinomial Naive Bayes ?
Naive Bayes est un algorithme puissant qui est utilisé pour l'analyse de données textuelles et avec des problèmes avec plusieurs classes. Pour comprendre le fonctionnement du théorème de Naive Bayes, il est important de comprendre d'abord le concept du théorème de Bayes car il est basé sur ce dernier.
Le théorème de Bayes, formulé par Thomas Bayes, calcule la probabilité qu'un événement se produise sur la base de la connaissance préalable des conditions liées à un événement. Il est basé sur la formule suivante :
P(A|B) = P(A) * P(B|A)/P(B)
Où nous calculons la probabilité de la classe A lorsque le prédicteur B est déjà fourni.
P(B) = probabilité a priori de B
P(A) = probabilité a priori de classe A
P(B|A) = occurrence du prédicteur B étant donné la probabilité de classe A
Cette formule aide à calculer la probabilité des balises dans le texte.
Comprenons l'algorithme Naive Bayes avec un exemple. Dans le tableau ci-dessous, nous avons pris un ensemble de données de conditions météorologiques ensoleillées, couvertes et pluvieuses. Maintenant, nous devons prédire la probabilité que les joueurs joueront en fonction des conditions météorologiques.
Doit lire: Introduction à Naive Bayes
Ensemble de données d'entraînement
Temps | Ensoleillé | Couvert | Pluvieux | Ensoleillé | Ensoleillé | Couvert | Pluvieux | Pluvieux | Ensoleillé | Pluvieux | Ensoleillé | Couvert | Couvert | Pluvieux |
Jouer | Non | Oui | Oui | Oui | Oui | Oui | Non | Non | Oui | Oui | Non | Oui | Oui | Non |
Cela peut être facilement calculé en suivant les étapes ci-dessous :
Créez un tableau de fréquence de l'ensemble de données d'entraînement donné dans l'énoncé du problème ci-dessus. Énumérez le décompte de toutes les conditions météorologiques par rapport à la condition météo respective.
Temps | Oui | Non |
Ensoleillé | 3 | 2 |
Couvert | 4 | 0 |
Pluvieux | 2 | 3 |
Total | 9 | 5 |
Trouvez les probabilités de chaque condition météorologique et créez un tableau de probabilité.
Temps | Oui | Non | |
Ensoleillé | 3 | 2 | =5/14(0.36) |
Couvert | 4 | 0 | =4/14(0,29) |
Pluvieux | 2 | 3 | =5/14(0.36) |
Total | 9 | 5 | |
=9/14 (0,64) | =5/14 (0,36) |
Calculez la probabilité a posteriori pour chaque condition météorologique à l'aide du théorème de Naive Bayes. La condition météo avec la probabilité la plus élevée sera le résultat du fait que les joueurs vont jouer ou non.
Utilisez l'équation suivante pour calculer la probabilité a posteriori de toutes les conditions météorologiques :

P(A|B) = P(A) * P(B|A)/P(B)
Après avoir remplacé les variables dans la formule ci-dessus, nous obtenons :
P(Oui|Ensoleillé) = P(Oui) * P(Ensoleillé|Oui) / P(Ensoleillé)
Prenez les valeurs du tableau de probabilité ci-dessus et mettez-les dans la formule ci-dessus.
P(Ensoleillé|Oui) = 3/9 = 0,33, P(Oui) = 0,64 et P(Ensoleillé) = 0,36
Par conséquent, P(Oui|Ensoleillé) = (0,64*0,33)/0,36 = 0,60
P(Non|Ensoleillé) = P(Non) * P(Ensoleillé|Non) / P(Ensoleillé)
Prenez les valeurs du tableau de probabilité ci-dessus et mettez-les dans la formule ci-dessus.
P(Ensoleillé|Non) = 2/5 = 0,40, P(Non) = 0,36 et P(Ensoleillé) = 0,36
P(Non|Ensoleillé) = (0,36*0,40)/0,36 = 0,6 = 0,40
La probabilité de jouer dans des conditions météorologiques ensoleillées est plus élevée. Par conséquent, le joueur jouera si le temps est ensoleillé.
De même, nous pouvons calculer la probabilité a posteriori des conditions pluvieuses et couvertes, et basée sur la probabilité la plus élevée ; nous pouvons prédire si le joueur jouera.
Paiement : Explication des modèles d'apprentissage automatique
Avantages
L'algorithme Naive Bayes présente les avantages suivants :

- Il est facile à mettre en œuvre car vous n'avez qu'à calculer la probabilité.
- Vous pouvez utiliser cet algorithme sur des données continues et discrètes.
- Il est simple et peut être utilisé pour prédire des applications en temps réel.
- Il est hautement évolutif et peut facilement gérer de grands ensembles de données.
Désavantages
L'algorithme Naive Bayes présente les inconvénients suivants :
- La précision de prédiction de cet algorithme est inférieure à celle des autres algorithmes de probabilité.
- Il n'est pas adapté à la régression. L'algorithme Naive Bayes n'est utilisé que pour la classification de données textuelles et ne peut pas être utilisé pour prédire des valeurs numériques.
Applications
L'algorithme Naive Bayes est utilisé dans les endroits suivants :
- Reconnaissance de visage
- Prévision météo
- Diagnostic médical
- Détection de spam
- Identification de l'âge/sexe
- Identification de la langue
- Analyse sentimentale
- Identification de l'auteur
- Classement des actualités
Conclusion
Il vaut la peine d'apprendre l'algorithme Multinomial Naive Bayes car il a de nombreuses applications dans plusieurs industries, et les prédictions faites par cet algorithme sont très rapides. La classification des actualités est l'un des cas d'utilisation les plus populaires de l'algorithme Naive Bayes. Il est très utilisé pour classer les nouvelles en différentes sections telles que politique, régionale, mondiale, etc.
Cet article couvre tout ce que vous devez savoir pour démarrer avec l'algorithme Multinomial Naive Bayes et le fonctionnement du classificateur Naive Bayes étape par étape.
Si vous souhaitez en savoir plus sur l'IA, l'apprentissage automatique, consultez le programme Executive PG d'IIIT-B & upGrad en Machine Learning & AI , conçu pour les professionnels en activité et offrant plus de 450 heures de formation rigoureuse, plus de 30 études de cas et missions. , statut IIIT-B Alumni, plus de 5 projets de synthèse pratiques et aide à l'emploi avec les meilleures entreprises.
Qu'entendez-vous par algorithme de Bayes naïf multinomial ?
L'algorithme Multinomial Naive Bayes est une approche d'apprentissage bayésienne populaire dans le traitement du langage naturel (TAL). Le programme devine la balise d'un texte, tel qu'un e-mail ou un article de journal, en utilisant le théorème de Bayes. Il calcule la probabilité de chaque étiquette pour un échantillon donné et génère l'étiquette avec la plus grande chance. Le classificateur Naive Bayes est composé d'un certain nombre d'algorithmes qui ont tous une chose en commun : chaque caractéristique classée n'est liée à aucune autre caractéristique. L'existence ou l'absence d'une fonctionnalité n'a aucune incidence sur l'inclusion ou l'exclusion d'une autre fonctionnalité.
Comment fonctionne l'algorithme de Bayes naïf multinomial ?
La méthode Naive Bayes est un outil puissant pour analyser la saisie de texte et résoudre des problèmes avec de nombreuses classes. Parce que le théorème naïf de Bayes est basé sur le théorème de Bayes, il est nécessaire de comprendre d'abord la notion de théorème de Bayes. Le théorème de Bayes, qui a été développé par Thomas Bayes, estime la probabilité d'occurrence sur la base d'une connaissance préalable des conditions de l'événement. Lorsque le prédicteur B lui-même est disponible, nous calculons la vraisemblance de la classe A. Elle est basée sur la formule ci-dessous : P(A|B) = P(A) * P(B|A)/P(B).
Quels sont les avantages et les inconvénients de l'algorithme de Bayes naïf multinomial ?
Il est simple à mettre en œuvre car il suffit de calculer la probabilité. Cette approche fonctionne à la fois avec des données continues et discrètes. Il est simple et peut être utilisé pour prévoir des applications en temps réel. Il est très évolutif et peut gérer facilement d'énormes ensembles de données.
La précision de prédiction de cet algorithme est inférieure à celle des autres algorithmes de probabilité. Ce n'est pas approprié pour la régression. La technique Naive Bayes ne peut être utilisée que pour classer les entrées textuelles et ne peut pas être utilisée pour estimer des valeurs numériques.