شرح Multinomial Naive Bayes: الوظيفة ، المزايا والعيوب ، التطبيقات في عام 2022
نشرت: 2021-01-03جدول المحتويات
مقدمة
هناك الآلاف من البرامج أو الأدوات لتحليل البيانات الرقمية ولكن هناك القليل جدًا منها للنصوص. تعد Multinomial Naive Bayes واحدة من أكثر تصنيفات التعلم الخاضع للإشراف شيوعًا والتي يتم استخدامها لتحليل بيانات النص الفئوي.
يكتسب تصنيف بيانات النص شيوعًا نظرًا لوجود كمية هائلة من المعلومات المتوفرة في البريد الإلكتروني والمستندات والمواقع الإلكترونية وما إلى ذلك والتي تحتاج إلى تحليل. تساعد معرفة السياق حول نوع معين من النص في إيجاد تصور لبرنامج أو منتج للمستخدمين الذين سيستخدمونه.
ستمنحك هذه المقالة فهمًا عميقًا لخوارزمية Naive Bayes متعددة الحدود وجميع المفاهيم المتعلقة بها. نستعرض لمحة موجزة عن الخوارزمية وكيف تعمل وفوائدها وتطبيقاتها.
ما هي خوارزمية Multinomial Naive Bayes؟
تعد خوارزمية Naive Bayes متعددة الحدود طريقة تعلم احتمالية تستخدم في الغالب في معالجة اللغة الطبيعية (NLP). تعتمد الخوارزمية على نظرية بايز وتتنبأ بعلامة نص مثل جزء من البريد الإلكتروني أو مقال صحفي. تحسب احتمالية كل علامة لعينة معينة ثم تعطي العلامة ذات الاحتمال الأعلى كناتج.
مُصنف Naive Bayes عبارة عن مجموعة من العديد من الخوارزميات حيث تشترك جميع الخوارزميات في مبدأ واحد مشترك ، وهذا يعني أن كل ميزة يتم تصنيفها لا ترتبط بأي ميزة أخرى. لا يؤثر وجود أو عدم وجود عنصر في وجود أو عدم وجود الميزة الأخرى.
انضم إلى تدريب التعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم - الماجستير ، وبرامج الدراسات العليا التنفيذية ، وبرنامج الشهادة المتقدم في ML & AI لتسريع حياتك المهنية.

كيف يعمل Multinomial Naive Bayes؟
Naive Bayes هي خوارزمية قوية تُستخدم لتحليل بيانات النص ومع مشاكل الفئات المتعددة. لفهم عمل نظرية Naive Bayes ، من المهم أن نفهم مفهوم نظرية بايز أولاً لأنه يعتمد على الأخير.
تحسب نظرية بايز ، التي صاغها توماس بايز ، احتمالية وقوع حدث بناءً على المعرفة المسبقة بالظروف المتعلقة بالحدث. يعتمد على الصيغة التالية:
الفوسفور (أ | ب) = ف (أ) * ف (ب | أ) / ف (ب)
حيث نقوم بحساب احتمال الفئة أ عندما يتم توفير المتنبئ ب بالفعل.
P (B) = الاحتمال السابق لـ B
P (A) = الاحتمال السابق للفئة A
P (B | A) = حدوث المتنبئ B معطى احتمالية من الفئة A
تساعد هذه الصيغة في حساب احتمال العلامات في النص.
دعونا نفهم خوارزمية Naive Bayes بمثال. في الجدول أدناه ، أخذنا مجموعة بيانات من الأحوال الجوية المشمسة ، الملبدة بالغيوم ، والممطرة. الآن ، نحتاج إلى توقع احتمالية ما إذا كان اللاعبون سيلعبون بناءً على الظروف الجوية.
يجب أن تقرأ: مقدمة إلى Naive Bayes
مجموعة بيانات التدريب
الجو | مشمس | غائم | ماطر | مشمس | مشمس | غائم | ماطر | ماطر | مشمس | ماطر | مشمس | غائم | غائم | ماطر |
لعب | رقم | نعم | نعم | نعم | نعم | نعم | رقم | رقم | نعم | نعم | رقم | نعم | نعم | رقم |
يمكن حساب ذلك بسهولة باتباع الخطوات الموضحة أدناه:
قم بإنشاء جدول تكراري لمجموعة بيانات التدريب الواردة في بيان المشكلة أعلاه. ضع قائمة بعدد جميع الأحوال الجوية مقابل حالة الطقس المعنية.
الجو | نعم | رقم |
مشمس | 3 | 2 |
غائم | 4 | 0 |
ماطر | 2 | 3 |
المجموع | 9 | 5 |
ابحث عن احتمالات كل حالة طقس وقم بإنشاء جدول احتمالية.
الجو | نعم | رقم | |
مشمس | 3 | 2 | = 5/14 (0.36) |
غائم | 4 | 0 | = 4/14 (0.29) |
ماطر | 2 | 3 | = 5/14 (0.36) |
المجموع | 9 | 5 | |
= 9/14 (0.64) | = 5/14 (0.36) |
احسب الاحتمال اللاحق لكل حالة طقس باستخدام نظرية بايز السذاجة. ستكون حالة الطقس ذات أعلى احتمالية هي نتيجة ما إذا كان اللاعبون سيلعبون أم لا.
استخدم المعادلة التالية لحساب الاحتمال اللاحق لجميع الظروف الجوية:
الفوسفور (أ | ب) = ف (أ) * ف (ب | أ) / ف (ب)

بعد استبدال المتغيرات في الصيغة أعلاه ، نحصل على:
ف (نعم | مشمس) = ف (نعم) * ف (مشمس | نعم) / ف (مشمس)
خذ القيم من جدول الاحتمالات أعلاه وضعها في الصيغة أعلاه.
ف (مشمس | نعم) = 3/9 = 0.33 ، ف (نعم) = 0.64 ، ف (مشمس) = 0.36
ومن ثم ، ف (نعم | مشمس) = (0.64 * 0.33) /0.36 = 0.60
ف (لا | مشمس) = ف (لا) * ف (مشمس | لا) / ف (مشمس)
خذ القيم من جدول الاحتمالات أعلاه وضعها في الصيغة أعلاه.
الفوسفور (مشمس | لا) = 2/5 = 0.40 ، الفوسفور (لا) = 0.36 ، الفوسفور (مشمس) = 0.36
P (لا | مشمس) = (0.36 * 0.40) /0.36 = 0.6 = 0.40
احتمال اللعب في ظروف الطقس المشمس أعلى. ومن ثم ، سيلعب اللاعب إذا كان الطقس مشمسًا.
وبالمثل ، يمكننا حساب الاحتمال اللاحق للظروف الممطرة والغيوم ، وبناءً على أعلى احتمال ؛ يمكننا توقع ما إذا كان اللاعب سيلعب.
الخروج: شرح نماذج التعلم الآلي
مزايا
تتمتع خوارزمية Naive Bayes بالمزايا التالية:

- من السهل تنفيذه حيث ما عليك سوى حساب الاحتمال.
- يمكنك استخدام هذه الخوارزمية في كل من البيانات المستمرة والمنفصلة.
- إنه بسيط ويمكن استخدامه للتنبؤ بالتطبيقات في الوقت الفعلي.
- إنه قابل للتطوير بدرجة كبيرة ويمكنه بسهولة التعامل مع مجموعات البيانات الكبيرة.
سلبيات
خوارزمية Naive Bayes لها العيوب التالية:
- دقة التنبؤ لهذه الخوارزمية أقل من خوارزميات الاحتمال الأخرى.
- انها ليست مناسبة للانحدار. تُستخدم خوارزمية Naive Bayes فقط لتصنيف البيانات النصية ولا يمكن استخدامها للتنبؤ بالقيم الرقمية.
التطبيقات
يتم استخدام خوارزمية Naive Bayes في الأماكن التالية:
- تمييز الوجوه
- التنبؤ بالطقس
- تشخيص طبي
- كشف البريد العشوائي
- تحديد العمر / الجنس
- تحديد اللغة
- التحليل العاطفي
- تحديد التأليف
- تصنيف الأخبار
خاتمة
يجدر تعلم خوارزمية Multinomial Naive Bayes لأنها تحتوي على العديد من التطبيقات في العديد من الصناعات ، والتنبؤات التي قدمتها هذه الخوارزمية سريعة جدًا. يعد تصنيف الأخبار أحد أكثر حالات الاستخدام شيوعًا لخوارزمية Naive Bayes. يتم استخدامه بشكل كبير لتصنيف الأخبار إلى أقسام مختلفة مثل السياسية والإقليمية والعالمية وما إلى ذلك.
تتناول هذه المقالة كل ما يجب أن تعرفه لتبدأ باستخدام خوارزمية Multinomial Naive Bayes وعمل مصنف Naive Bayes خطوة بخطوة.
إذا كنت مهتمًا بمعرفة المزيد حول الذكاء الاصطناعي والتعلم الآلي ، فراجع برنامج IIIT-B & upGrad's Executive PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، حالة خريجي IIIT-B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع كبرى الشركات.
ماذا تقصد بخوارزمية بايز الساذجة متعددة الحدود؟
خوارزمية Multinomial Naive Bayes هي منهج تعليمي بايزي شائع في معالجة اللغة الطبيعية (NLP). يقوم البرنامج بتخمين علامة النص ، مثل بريد إلكتروني أو قصة جريدة ، باستخدام نظرية بايز. تحسب احتمالية كل علامة لعينة معينة وتخرج العلامة بأكبر فرصة. يتكون مصنف Naive Bayes من عدد من الخوارزميات التي تشترك جميعها في شيء واحد: كل ميزة يتم تصنيفها لا علاقة لها بأي ميزة أخرى. لا يؤثر وجود الميزة أو غيابها على تضمين أو استبعاد ميزة أخرى.
كيف تعمل خوارزمية بايز الساذجة متعددة الحدود؟
تعد طريقة Naive Bayes أداة قوية لتحليل إدخال النص وحل المشكلات مع العديد من الفئات. نظرًا لأن نظرية Naive Bayes تستند إلى نظرية بايز ، فمن الضروري أولاً فهم فكرة نظرية بايز. تقدر نظرية بايز ، التي طورها توماس بايز ، احتمالية الحدوث بناءً على المعرفة المسبقة بظروف الحدث. عندما يكون المتنبئ B نفسه متاحًا ، نحسب احتمالية الفئة أ. إنها تعتمد على الصيغة أدناه: P (A | B) = P (A) * P (B | A) / P (B).
ما هي مزايا وعيوب خوارزمية بايز الساذجة متعددة الحدود؟
إنه سهل التنفيذ لأن كل ما عليك فعله هو حساب الاحتمال. يعمل هذا النهج مع كل من البيانات المستمرة والمنفصلة. إنه واضح ومباشر ويمكن استخدامه للتنبؤ بالتطبيقات في الوقت الفعلي. إنه قابل للتطوير للغاية ويمكنه التعامل مع مجموعات البيانات الهائلة بسهولة.
دقة توقع هذه الخوارزمية أقل من تلك الخاصة بخوارزميات الاحتمالات الأخرى. لا يناسب الانحدار. لا يمكن استخدام تقنية Naive Bayes إلا لتصنيف المدخلات النصية ولا يمكن استخدامها لتقدير القيم الرقمية.