اعرف لماذا يعتبر النموذج الخطي المعمم نموذجًا توليفيًا رائعًا!
نشرت: 2020-11-17جدول المحتويات
فهم الأساسيات
GLM مشهور جدًا بين الأفراد الذين يتعاملون مع نماذج الانحدار المختلفة بدءًا من نماذج الانحدار الخطي الكلاسيكي إلى نماذج تحليل البقاء. تمت صياغة مصطلح النموذج الخطي المعمم (GLIM أو GLM ) وتعريفه بواسطة McCullagh (1982) و Nelder (الإصدار الثاني 1989). GLM ، في أبسط شكل كما هو موضح في Rutherford 2001 ، البيانات = نموذج + خطأ. له إطار مفيد ، وهو أساس الاختبارات الإحصائية المختلفة.
إعادة النظر في فئة النماذج
- نماذج الانحدار الخطي الكلاسيكي (CLR) ، والتي يشار إليها أيضًا باسم نماذج الانحدار الخطي
- تحليل نماذج التباين (ANOVA).
- النماذج التي تتنبأ باحتمالات الفوز مثل احتمال فشل الآلة
- النماذج المستخدمة لشرح والتنبؤ بعدد الأحداث
- نماذج لتقدير عمر الكائنات الحية وغير الحية مثل المعالج أو العمر البيولوجي للنبات وما إلى ذلك.
النموذج الخطي المعمم ، كما يوحي الاسم ، يشبه مظلة لجميع النماذج المذكورة أعلاه مع حسابات وتقديرات محسّنة.
هيكل النماذج الخطية المعممة
يتكون النموذج الخطي المعمم (أو GLM1) من ثلاثة مكونات رئيسية:
- المكون العشوائي: المكون العشوائي المعروف بنموذج الضوضاء أو نموذج الخطأ هو التوزيع الاحتمالي لمتغير الاستجابة (ص).
- المكون المنهجي: المتنبئ الخطي هو دالة خطية للمنحدرات ، كما هو مذكور أدناه:
ηi = α + β1Xi1 + β2Xi2 + ··· + βkXik
- وظيفة الارتباط (يُشار إليها بـ η أو g (μ) ): كما يوحي الاسم ، فهي الرابط بين المكونات النظامية والعشوائية
مثال: μi = E (Yi) ، إلى المتنبئ الخطي g (μi) = i = α + β1Xi1 + β2Xi2 + ··· + kXik
ينطبق النموذج الخطي المعمم على البيانات من خلال عملية الاحتمال الأقصى. يوفر هذا تقديرات لمعاملات الانحدار والأخطاء المعيارية المقاربة المقدرة للمعاملات.

GLM الأساسي لبيانات الجرد هو نموذج Poisson مع ارتباط السجل. ومع ذلك ، عندما يكون متغير الاستجابة عبارة عن عدد ، فإن تباينه الشرطي يزداد بسرعة أكبر من متوسطه ، مما ينتج عنه حالة تسمى فرط التشتت وإبطال استخدام توزيع بواسون. يضيف شبه Poisson GLM معلمة تشتت للتعامل مع بيانات التعداد المفرط.
بشكل عام ، تقدير شبه الاحتمال هو إحدى طرق السماح بالتشتت المفرط ، وهو تباين أكثر أهمية في البيانات مما هو متوقع من النموذج الإحصائي المستخدم.

يعتمد نموذج مشابه على التوزيع ذي الحدين السالب ، وهو ليس عائلة أسية. لا يمكن تحديد القيم ذات الحدين السالب في النموذج الخطي المعمم بالاحتمال الأقصى. قد يكون نموذج انحدار بواسون المتضخم الصفري مناسبًا بشكل أفضل عندما يكون هناك عدد أكبر من الأصفار في البيانات أكثر مما يتوافق مع توزيع بواسون.
قراءة: شرح نماذج التعلم الآلي

مزايا النموذج الخطي المعمم على انحدار المربع الصغرى العادي (OLS)
هناك العديد من مزايا النماذج الخطية العامة على انحدار OLS ، والتي يمكن تلخيصها على النحو التالي:
- بخلاف انحدار OLS ، لا يلزم تحويل الاستجابة Y في كل مرة للحصول على توزيع طبيعي.
- النمذجة أكثر مرونة لأن اختيار رابط يختلف عن اختيار مكون عشوائي.
- لا يلزم التباين المستمر إذا كان الارتباط يعطي تأثيرات إضافية.
- لدينا الخصائص المثلى للمقدرين حيث يتم إرفاق النماذج من خلال تقدير الاحتمالية القصوى.
- تنطبق جميع أدوات الاستدلال وفحص النموذج لنماذج الانحدار اللوجيستي الخطي واللوجستي على نماذج GLM الأخرى أيضًا.
- عادة ما توجد عملية واحدة فقط (إجراء أو وظيفة) في حزمة البرامج لالتقاط جميع النماذج المدرجة في الجدول أعلاه ؛ خذ ، على سبيل المثال ، glm () (لغة R) أو PROC GENMOD (SAS).
عيوب النموذج الخطي المعمم
بصرف النظر عن المزايا المذكورة أعلاه ، هناك عيبان رئيسيان من المهم معرفتهما:
- يمكن أن يكون لبعض القيود مثل الوظيفة الخطية مؤشر خطي فقط في المكون النظامي.
- لا يمكن أن تعتمد الردود على بعضها البعض.
يجب أن تقرأ: شرح أفكار مشروع التعلم الآلي
خاتمة
إذا قمنا بتلخيص جميع المعلومات المذكورة أعلاه ، وجدنا أن GLM مناسب مع تعقيد أقل. باستخدام GLM ، يمكن أن يكون لمتغيرات الاستجابة أي شكل من أشكال التوزيع الأسي. بصرف النظر عن هذا ، يمكنه التعامل مع المتنبئين القاطعين. النموذج الخطي العام سهل التفسير ويسمح بفهم واضح لكيفية تأثير كل متنبئ على النتيجة.
إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.
ما هو نموذج الانحدار بواسون؟
كيف يختلف النموذج الخطي العام عن النموذج الخطي المعمم؟
ما هي بعض الافتراضات التي يقوم بها النموذج الخطي المعمم؟
غالبية افتراضات GLM قابلة للمقارنة مع نماذج الانحدار الخطي ، ولكن تم تغيير بعض افتراضات الانحدار الخطي. يُفترض أن تكون البيانات الموجودة في GLM مستقلة وعشوائية. تعتبر الأخطاء مستقلة أيضًا ، على الرغم من عدم ضرورة توزيعها بانتظام. بينما لا يشترط أن يكون متغير الاستجابة مستقلاً ، يجب أن ينتمي التوزيع إلى العائلة الأسية.