التوزيع الاحتمالي: شرح أنواع التوزيعات
نشرت: 2020-12-16جدول المحتويات
مقدمة في التوزيع الاحتمالي والاحتمالي
لفهم التوزيع الاحتمالي ، دعونا أولاً نفهم ما هو الاحتمال. الاحتمال هو قياس احتمالية وقوع حدث في التجربة. بعبارات بسيطة ، يخبرنا مدى احتمالية وقوع الحدث. تتراوح قيمة احتمال وقوع حدث من 0 (أقل احتمالية) إلى 1 (الأكثر احتمالية).
توزيع الاحتمالات هو دالة توفر احتمالات النتائج المختلفة للتجربة. يعرض القيم المحتملة التي يمكن أن يأخذها متغير عشوائي وعدد مرات حدوث هذه القيم.
في توزيع الاحتمالات ، يتجمع مجموع كل هذه الاحتمالات دائمًا إلى 1. في مجال علم البيانات ، يكون أحد استخدامات توزيع الاحتمالات لحساب فترات الثقة ولحساب المناطق الحرجة في اختبارات الفرضيات.
التوزيعات المستمرة والمتقطعة
يعتمد نوع التوزيع الاحتمالي الذي سيتم استخدامه على ما إذا كان المتغير يحتوي على قيم منفصلة أو قيم مستمرة. يمكن أن يأخذ التوزيع المنفصل مجموعة محدودة من القيم فقط بينما يمكن أن تأخذ التوزيعات المستمرة أي قيمة ضمن النطاق المحدد.
يتم تمثيل التوزيعات المستمرة من حيث كثافة الاحتمال حيث يمكن أن تكون هناك قيم غير محدودة في نطاق معين وسيكون احتمال كل قيمة صفراً. في حالة التوزيع المنفصل ، يمكننا الحصول على احتمال لكل قيمة لأن عدد القيم محدود.
أنواع التوزيعات - التوزيع المنفصل
توزيع ثنائي
إنه نوع من التوزيع حيث يكون عدد النتائج في تجربة واحدة اثنين فقط. كل محاكمة مستقلة عن محاكمة أخرى ؛ أي أن نتيجة كل تجربة ليس لها تأثير على نتيجة التجارب الأخرى. التجارب التي أجريت في هذه التجربة متطابقة مع بعضها البعض.

وبالتالي ، فإن احتمالية النجاح والفشل ستكون هي نفسها لكل تجربة. على سبيل المثال ، إذا كان احتمال نجاح التجربة 0.8 (مما يعني أن احتمال الفشل سيكون 0.2) ، فسيكون هو نفسه بالنسبة لبقية التجارب أيضًا.
التوزيع الاسمي المتعدد
هذه هي النسخة المعممة من التوزيع ذي الحدين حيث يمكن أن يكون عدد النتائج أكبر من اثنين. تتشابه الخصائص الأخرى لهذا التوزيع مع خصائص التوزيع ذي الحدين. على سبيل المثال ، ضع في اعتبارك عندما يتم رمي نرد عادل ، فإن احتمالية كل نتيجة ستكون هي نفسها لجميع المحاكمات لأن هذه التجارب مستقلة عن بعضها البعض.
توزيع برنولي
هذا هو نوع آخر من التوزيع ذي الحدين. إنها حالة خاصة للتوزيع ذي الحدين حيث يكون عدد التجارب التي أجريت في التجربة 1 (ن = 1). نظرًا لوجود تجربة واحدة فقط ، يمكن تعريفها باستخدام معامل واحد فقط (p) وهو عمومًا احتمال النجاح.
قراءة: التوزيع ذي الحدين في بايثون
التوزيع السلبي ذو الحدين
تختلف الشروط التالية في التوزيع ذي الحدين السالب عن التوزيع ذي الحدين: -
- لم يتم تحديد عدد التجارب التي أجريت في التجربة.
- يشير المتغير العشوائي إلى عدد التجارب المطلوبة لتحقيق العدد المطلوب من النجاحات.
بالنسبة للتوزيع ذي الحدين ، فإن المتغير العشوائي هو عدد النجاحات المطلوبة ، أي أننا نركز فقط على عدد النجاحات بغض النظر عن عدد المسارات التي تفشل. ولكن في حالة ذات الحدين السالب ، فإنه يركز على عدد المحاولات المطلوبة لتحقيق عدد النجاحات ، أي أن عدد حالات الفشل (السلبيات) يتم وضعه في الاعتبار أيضًا وهذا هو سبب تسميته بالتوزيع السلبي ذي الحدين.
تستمر العملية فقط حتى يتم تحقيق العدد المطلوب من النجاحات. يؤدي هذا إلى أن يكون عدد المحاكمات الخاصة بالتجربة تعسفيًا. ويسمى أيضًا توزيع باسكال.
توزيع السم
يوفر توزيع بواسون احتمالية حدوث عدد منفصل من الأحداث في فترة زمنية محددة ، بشرط أن نعرف متوسط عدد الأحداث التي حدثت خلال نفس الفترة. تحدث هذه الأحداث بشكل مستقل وليس لها تأثير على الأحداث الأخرى. لتنفيذ هذا التوزيع ، يفترض أن معدل الحدوث يظل ثابتًا خلال الفترة الزمنية.

توزيع الزي الموحد المنفصل
في التوزيع الموحد ، تكون احتمالات جميع النتائج متساوية. على سبيل المثال ، ضع في اعتبارك عندما يتم رمي نرد عادل ، فإن احتمالية أي نتيجة تتراوح من 1 إلى 6 ستكون متساوية. دالة الكتلة الاحتمالية لهذا التوزيع هي 1 / n حيث n هو العدد الإجمالي للقيم المنفصلة.
أنواع التوزيعات - التوزيع المستمر
توزيع منتظم مستمر
يمكن تطبيق التوحيد في التوزيع على القيم المستمرة أيضًا. يشير إلى أن توزيع الاحتمالات منتظم بين النطاق المحدد. ويسمى أيضًا التوزيع المستطيل بسبب الشكل الذي يتخذه عند رسمه على الرسم البياني.
التوزيع الطبيعي
التوزيع الطبيعي (المعروف أيضًا باسم منحنى الجرس) هو نوع من التوزيع المستمر المتماثل من طرفي المتوسط. يشير بشكل عام إلى أن نصف العينات يقع على الجانب الأيسر من الوسط ، بينما يقع النصف الآخر على الجانب الأيمن. بالنسبة للتوزيع الطبيعي ، يكون المتوسط والوضع والوسيط متساويين.
عادةً ما تتبع البيانات الموزعة بشكل عام القاعدة التجريبية. توضح القاعدة التجريبية انتشار البيانات من حيث الانحراف المعياري وتعني كما يلي: -
- 68٪ احتمال أن المتغير العشوائي يقع ضمن انحراف معياري واحد عن المتوسط.
- احتمال 95٪ أن المتغير العشوائي يقع ضمن انحرافين معياريين عن المتوسط.
- احتمال 99.7٪ أن المتغير العشوائي يقع ضمن 3 انحرافات معيارية عن المتوسط.
ت - التوزيع
إنه مشابه للتوزيع العادي ، لكن لديه احتمال أكبر تجاه القيم القصوى للبيانات. هذا يجعله أكثر عرضة لاتخاذ القيم البعيدة عن المتوسط. عند رسم المنحنى على الرسم البياني ، يبدو أقصر وأسمن من منحنى التوزيع الطبيعي.
يفضل عندما يكون عدد العينات أصغر في الحجم. مع زيادة حجم العينات ، يبدأ منحنى توزيع t في الظهور كمنحنى توزيع عادي. نظرًا لأن الصيغ الخاصة بالتوزيع العادي والتوزيع t معقدة للغاية وتستغرق وقتًا طويلاً لحسابها ، فإننا بدلاً من ذلك نحسب قيم درجة Z و T على التوالي.
اقرأ أيضًا: 13 فكرة مثيرة للاهتمام لمشروع هيكل البيانات وموضوعات للمبتدئين
تشي - توزيع مربع
توزيع مربع كاي هو توزيع مجموع مربع المتغيرات العشوائية المأخوذة من التوزيع الطبيعي. درجات الحرية المستخدمة في هذا التوزيع تساوي عدد المتغيرات المأخوذة من التوزيع الطبيعي. متوسط توزيع مربع كاي يساوي عدد درجات الحرية.

يستخدم هذا التوزيع على نطاق واسع في حساب فترات الثقة وفي اختبار الفرضيات. إنها حالة محددة لتوزيع جاما . يتم استخدامه أيضًا في اختبار مربع كاي وهو اختبار جودة الملاءمة للتوزيع المرصود والذي يساعد في الإشارة إلى ما إذا كانت بيانات العينة تمثل تمثيلًا جيدًا لجميع السكان.
خاتمة
أعطت هذه المقالة نظرة عامة على بعض الأمثلة لأنواع التوزيعات المنفصلة والمستمرة. تستخدم هذه التوزيعات المختلفة لخدمة أغراض مختلفة ، ولكل منها افتراضاته الخاصة.
تعلم دورة ML من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.
على الرغم من أنه في مواقف الحياة الواقعية ، قد لا تتحقق افتراضات هذه التوزيعات ، لكن هذه التوزيعات تساعد في اتخاذ قرارات مهمة للمنظمة.
إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.
ما الذي يميز التوزيع ذي الحدين عن التوزيع الطبيعي؟
في التوزيع ذي الحدين ، لا توجد نقاط بيانات بين أي نقطتي بيانات معينتين. هذا في تناقض صارخ مع التوزيع الطبيعي ، الذي يتميز بنقاط بيانات منفصلة. التوزيع الطبيعي ليس منفصلاً على عكس التوزيع ذي الحدين. التوزيع ذو الحدين له عدد محدود من التكرارات ، في حين أن التوزيع الطبيعي له عدد لا حصر له من التكرارات. ومع ذلك ، إذا كان حجم العينة كبيرًا بدرجة كافية ، فإن شكل التوزيع ذي الحدين سيشابه التوزيع الطبيعي.
ما الذي يميز التوزيع ذي الحدين عن توزيع برنولي؟
يتم التعامل مع نتيجة تجربة واحدة لحدث ما من خلال توزيع برنولي ، ولكن يتم التعامل مع نتيجة العديد من التجارب لحدث واحد من خلال التوزيع ذي الحدين. عندما تكون نتيجة حدث ما مطلوبة مرة واحدة فقط ، يتم تطبيق توزيع برنولي ، ولكن يتم استخدام التوزيع ذي الحدين عندما تكون النتيجة مطلوبة عدة مرات.
عندما يكون هناك عدم يقين ، كيف يمكننا استخدام التوزيع الاحتمالي؟
مساحة الاحتمال هي تمثيل لعدم اليقين لدينا بشأن التجربة التي تتضمن عينة من مساحة النتائج المحتملة وقياس الاحتمال الذي يقدر احتمالية كل حدث. في تحليل عدم اليقين ، التوزيع المستطيل هو التوزيع الاحتمالي الأكثر استخدامًا. من المرجح أن تحدث جميع النتائج في توزيع مستطيل. سيتعين عليك تقسيم قيمك على الجذر التربيعي لـ 3 لتحويل مساهمات عدم اليقين إلى مكافئات الانحراف المعياري.
