شبكات بايزي: مقدمة وأمثلة وتطبيقات عملية

نشرت: 2020-02-23

كل أولئك الذين عملوا مع البيانات أو الإحصائيات يعرفون شيئًا واحدًا مؤكدًا: الارتباط لا يعني بالضرورة أو يشير إلى السببية. الآن ، بينما قد يبدو هذا واضحًا جدًا ، قد يصدمك معرفة أن معظم الأخطاء في البيانات تحدث بسبب الخلط بين المصطلحين. هذا في المقام الأول لأنه في حين أنه من الملائم تحديد الارتباط ، يكاد يكون من المستحيل تحديد أو تحديد السببية.

في الواقع ، يصرح جوديا بيرل ، مؤلف كتاب السببية: النماذج والاستدلال والاستدلال ، في الكتاب أن البشر يركزون جهودهم الرياضية على الاستدلالات الاحتمالية والإحصائية ، تاركين الاعتبارات السببية "لرحمة الحدس والحكم الصالح". يقول إن هذا عامل رئيسي لا نزال متأخرين فيه كثيرًا من حيث التقدم العلمي.

هذا هو الوقت الذي تسهّل فيه شبكات Bayesian Networks الأمر علينا. إنها تساعدنا على التمييز بين الارتباط والسببية من خلال السماح لنا برؤية الأسباب المستقلة المختلفة في وقت واحد. يتم كل هذا بدقة لأن خوارزميات التعلم الآلي لا تعمل على الذاتية أو الحدس ؛ يعملون على البيانات.

دعونا نرى مثالاً لفهم كيفية عمل شبكات Bayesian.

جدول المحتويات

مثال على شبكات بايزي

من أجل هذا المثال ، دعونا نفترض أن العالم يعاني من مرض نادر للغاية ولكنه قاتل ؛ قل أن هناك فرصة واحدة من كل 1000 لإصابتك بالمرض.

الآن ، لمعرفة ما إذا كان شخص ما يعاني من المرض ، يقوم الأطباء بتطوير اختبار. المهم هو أنها دقيقة بنسبة 99٪ فقط.

كيف ستعرف على وجه اليقين ما إذا كنت مصابًا بالمرض أم لا؟ هل سيؤثر إجراء اختبار آخر على النتائج؟

لنرى ماذا سيحدث عندما تجري ...

اختبار 1

نظرًا لأن المرض يصيب 1 فقط من كل 1000 ، فإن احتمال إصابتك هو:

مصاب 0.001
حر 0.999

مرض CPT (جدول الاحتمال الشرطي)

من الواضح ، تمامًا كما أن 1 من كل 1000 لديه فرصة للمعاناة من المرض ، فإن 999 من كل 1000 شخص خالٍ منه.

وبالمثل ، سننشئ جدولًا لحساب احتمالية الاختبار. كما ذكرنا سابقًا ، إذا كان الاختبار دقيقًا بنسبة 99٪ فقط. هذا يعني أن هناك فرصة بنسبة 99٪ فقط أن تكون النتيجة صحيحة. نفس الحال مع النتائج السلبية.

وجود الفيروس مصاب حر
الاختبار 1 (إيجابي) 0.99 0.01
اختبار 1 (سلبي) 0.01 0.99

Test1 CPT (جدول الاحتمالية الشرطية)

الآن ، دعنا نرسم رسمًا بيانيًا لنرى كيف يتأثر وجود المرض بنتائج الاختبار.

سوف يعطيني ملء هذه الخلايا بنتائج الاختبار النتيجة التالية.

مصدر الصورة

كما ترى ، إذا كان الاختبار إيجابيًا ، فهناك احتمال 9٪ فقط أنك تعاني من المرض.

الآن ، كيف حصلنا على هذا الرقم؟

مبرهنة بايز!

مصدر الصورة

في مثالنا ،

الفوسفور (H | E) = P (H) x P (E | H) / P (E)

  • الفوسفور (H | E) = P (H) x P (E | H) / {P (E | H) x P (H) + P (E | Hc) x P (Ec)}
  • P (H | E) = (0.99 × 0.001) / (0.001 × 0.99 + 0.999 × 0.01) = 0.9 = 9٪

ما يخبرنا هذا الكلام؟

حتى عندما يكون الاختبار إيجابيًا ، نظرًا لندرة المرض ، هناك فرصة بنسبة 9٪ للإصابة بالمرض.

إذن ، ما يحدث عندما تجري اختبارًا آخر للتأكد من أنه أيضًا إيجابي.

قراءة: أفكار مشروع التعلم الآلي للمبتدئين

اختبار 2

مرة أخرى ، سيكون الاختبار الثاني أيضًا دقيقًا بنسبة 99٪.

وجود الفيروس مصاب حر
الاختبار 2 (إيجابي) 0.99 0.01
اختبار 2 (سلبي) 0.01 0.99

ستكون شبكة بايز الآن:

مصدر الصورة

النتائج عكست!

هذا يعني أنه إذا حصلت على نتيجتين إيجابيتين في اختبارين ، فإن احتمالات الإصابة بالفيروس تزداد من 9٪ إلى 91٪. لكن مرة أخرى ، لا يقول 100٪!

الآن ، ماذا لو حصلت على نتيجة إيجابية وأخرى سلبية من الاختبار؟

مصدر الصورة

كما ترى ، هناك فرصة بنسبة 100٪ لعدم إصابتك بالمرض في حالة سلبية أحد الاختبارين.

اختبار 3

يصبح الأمر أفضل عندما تجري ثلاثة اختبارات ويظهر كل منهم على حقيقته.

مصدر الصورة

من الواضح ، الآن ، أن هناك فرصة بنسبة 100٪ للإصابة.

لنرى الآن ما يحدث عندما يكون أحد الاختبارين سالبًا بينما يكون الاختباران الآخران إيجابيين.

مصدر الصورة

مرة أخرى ، جاءت النتائج إيجابية بنسبة 91٪ لوجود فيروس.

شبكات بايز ونمذجة البيانات

في المثال أعلاه ، يمكن ملاحظة أن شبكات Bayesian Networks تلعب دورًا مهمًا عندما يتعلق الأمر بنمذجة البيانات لتقديم نتائج دقيقة.

في الواقع ، يتيح لنا تحسين الشبكة من خلال تضمين المزيد من العوامل التي قد تؤثر على النتيجة أيضًا تصور ومحاكاة السيناريوهات المختلفة باستخدام شبكات Bayesian.

تعد شبكات Bayesian Networks أيضًا أداة رائعة لتحديد مدى عدم الإنصاف في البيانات وتقنيات التنظيم لتقليل هذا الظلم.

في مثل هذه الحالات ، من الأفضل استخدام تقنيات خاصة بالمسار لتحديد العوامل الحساسة التي تؤثر على النتائج النهائية.

أهم 5 تطبيقات عملية لشبكات بايزي

تُستخدم شبكات Bayesian على نطاق واسع في مجال علم البيانات للحصول على نتائج دقيقة ببيانات غير مؤكدة.

تطبيقات شبكات بايزي

1. عامل تصفية البريد العشوائي

يجب أن تكذب إذا قلت أنك لم تتساءل أبدًا عن كيفية تصفية Gmail لرسائل البريد الإلكتروني العشوائية (رسائل البريد الإلكتروني غير المرغوب فيها وغير المرغوب فيها. فهي تستخدم عامل تصفية البريد العشوائي Bayesian ، وهو أقوى عامل تصفية.

2. كود توربو

تُستخدم شبكات Bayesian لإنشاء أكواد توربو ذات أداء عالٍ لتصحيح الأخطاء. يتم استخدامها في شبكات الهاتف المحمول 3G و 4G.

3. معالجة الصور

تستخدم شبكات بايزي العمليات الحسابية لتحويل الصور إلى تنسيق رقمي. كما يسمح بتحسين الصورة.

4. الرصد الحيوي

لا يمكن أن يصبح قياس تركيز المواد الكيميائية أسهل مما هو عليه مع شبكات Bayesian. في هذا ، يتم قياس كمية الدم والأنسجة لدى البشر باستخدام المؤشرات.

5. شبكة تنظيم الجينات (GNR)

يحتوي GNR على أجزاء مختلفة من الحمض النووي للخلية التي تتفاعل مع محتويات الخلية الأخرى من خلال منتجات تعبير البروتين والحمض النووي الريبي. يمكن تحليل تنبؤات سلوكها باستخدام شبكات Bayesian.

خاتمة

في منشور المدونة هذا عبر الإنترنت ، تعلمت كيف تساعدنا Bayesian Networks في الحصول على نتائج دقيقة من البيانات المتوفرة. حتى الاختلاف الصغير في البيانات يمكن أن يؤثر بشكل كبير على النتيجة النهائية. تساعدنا شبكات Bayesian Networks في تحليل البيانات باستخدام السببية بدلاً من الارتباط فقط.

لقد أثبتوا أنهم ثوريون في مجال علم البيانات. من الواضح أن الحصول على وظيفة في هذا العلم يمكن أن يساعدك في الحصول على وظيفة أحلامك. لذا ، سجل في إحدى دوراتنا في علوم البيانات وتعلم من الخبراء! نقدم أيضًا دعمًا مهنيًا مجانيًا من مستشارين مهنيين من الدرجة الأولى وذوي خبرة. قم بتنزيل الكتيب لمعرفة المزيد عن الدورة.

إذا كنت ترغب في معرفة المزيد عن الوظائف في التعلم الآلي والذكاء الاصطناعي ، تحقق من IIT Madras وشهادة upGrad المتقدمة في التعلم الآلي والسحابة.

ما هي مكونات شبكة بايزي؟

تعود أصول شبكات بايز إلى نظرية بايز ، التي سُميت على اسم عالم الرياضيات البريطاني الشهير توماس بايز. هذه النظرية هي أساسًا صيغة رياضية تستخدم لتحديد الاحتمال الشرطي. تشتق شبكات Bayesian في مجال الذكاء الاصطناعي من Bayesian Statistics ، والتي تعتبر نظرية بايز طبقتها الأساسية. تتكون شبكة بايز من وحدتين - الاحتمال الشرطي في الوحدة الكمية والرسم البياني غير الدوري الموجه في الوحدة النوعية. في الذكاء الاصطناعي والتعلم الآلي ، تعد شبكات Bayesian أدوات مستخدمة للتفكير والنمذجة بناءً على معتقدات غير مؤكدة.

ما مقدار الاحتمالات والإحصاءات التي تحتاج إلى معرفتها للتعلم الآلي؟

يعتمد جزء كبير من الذكاء الاصطناعي وحقوله الفرعية المختلفة على الاحتمالات والإحصاءات. عندما يتعلق الأمر بالتعلم الآلي ، فأنت بحاجة إلى اعتباره مجالًا متعدد التخصصات يستخدم الاحتمالات والإحصاءات والخوارزميات المختلفة. الإحصاء والاحتمالية هي مجالات الرياضيات ذات الصلة المستخدمة لتحليل التكرار النسبي للأحداث. يتم استخدام هذا المزيج من الإحصائيات والاحتمالات والخوارزميات في النهاية لبناء تطبيقات ذكية تتعلم من البيانات وتقدم أيضًا رؤى قيمة. لذلك ، يعد الفهم الأساسي للإحصاءات والاحتمالات إلزاميًا إذا كنت تريد تعلم التعلم الآلي. يجب أن تكون على دراية بالمفاهيم الأساسية مثل الاحتمال التجريبي والنظري ، الاحتمال المشترك ، الاحتمال الشرطي ، نظرية بايز ، الإحصاء الوصفي ، الإحصاء الوصفي أحادي المتغير وثنائي المتغير ، الارتباط ، إلخ.

ما هي مزايا استخدام شبكات Bayesian في الذكاء الاصطناعي؟

شبكات بايز هي تقنية شائعة جدًا لإنشاء نماذج للمجالات المعقدة وغير المؤكدة. باستخدام Bayesian Networks ، يمكنك تطوير إطار منطقي رياضيًا وقويًا للمناظر الطبيعية غير المؤكدة مثل النظم البيئية وإدارة البيئة. الميزة الأكثر أهمية لاستخدام هذه التقنية هي أنه يمكنك بسهولة دمج البيانات من مصادر غير متجانسة ومستويات دقة مختلفة في نموذج متماسك رياضيًا. يساعد هذا في الجمع بين معرفة الخبراء وبيانات حول المتغيرات التي لا تحتوي على أية بيانات.