المثلية الجنسية في التعلم الآلي: الاكتشاف والتأثيرات وكيفية العلاج
نشرت: 2021-01-06بنهاية هذا البرنامج التعليمي ، ستكون لديك معرفة بما يلي:
- ما هي اللواط والتغاير؟
- كيفية معرفة ما إذا كانت التغايرية موجودة.
- آثار التغاير المرونة في التعلم الآلي.
- علاج التغاير المرونة.
جدول المحتويات
ما هي اللواط والتغاير؟
اللواط يعني أن تكون من "نفس التباين". في الانحدار الخطي ، تتمثل إحدى الافتراضات الرئيسية في وجود تشابه في الأخطاء أو المصطلحات المتبقية (Y_Pred - Y_actual).
بعبارة أخرى ، يفترض الانحدار الخطي أنه بالنسبة لجميع الحالات ، ستكون شروط الخطأ متماثلة وذات تباين ضئيل للغاية.
دعونا نفهمها بمساعدة مثال. ضع في اعتبارك أن لدينا متغيرين - مساحة السجاد للمنزل وسعر المنزل. مع زيادة مساحة السجاد ، تزداد الأسعار أيضًا.
لذلك نحن نلائم نموذج الانحدار الخطي ونرى أن الأخطاء لها نفس التباين في جميع الأنحاء. يحتوي الرسم البياني في الصورة أدناه على مساحة السجاد في المحور السيني والسعر في المحور ص.
كما ترى ، فإن التنبؤات تكون تقريبًا على طول خط الانحدار الخطي وبتباين مماثل في كل مكان.

أيضًا ، إذا رسمنا هذه البقايا على المحور السيني ، فسنراها في خط مستقيم موازٍ للمحور السيني. هذه علامة واضحة على اللواط
مصدر الصورة
عندما يتم انتهاك هذا الشرط ، فهذا يعني أن هناك تباينًا في المرونة في النموذج. بالنظر إلى نفس المثال أعلاه ، دعنا نقول أنه بالنسبة للمنازل ذات المساحة الأقل للسجاد ، فإن الأخطاء أو المخلفات أو صغيرة جدًا. ومع زيادة مساحة السجادة ، يزداد التباين في التنبؤات مما يؤدي إلى زيادة قيمة الخطأ أو الشروط المتبقية. عندما نرسم القيم مرة أخرى ، نرى منحنى المخروط النموذجي الذي يشير بقوة إلى وجود التباين في النموذج.
مصدر الصورةعلى وجه التحديد ، فإن التغاير المرونة هو زيادة أو نقصان منتظمان في تباين القيم المتبقية على نطاق المتغيرات المستقلة. هذه مشكلة لأن اللواط هو افتراض الانحدار الخطي ويجب أن تكون جميع الأخطاء من نفس التباين. تعرف على المزيد حول الانحدار الخطي
انضم إلى دورة التعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم - الماجستير ، وبرامج الدراسات العليا التنفيذية ، وبرنامج الشهادات المتقدمة في ML & AI لتسريع حياتك المهنية.
كيف تعرف ما إذا كانت التغايرية موجودة؟
بعبارات أبسط ، أسهل طريقة لمعرفة ما إذا كانت المرونة غير المتجانسة موجودة هي عن طريق رسم الرسم البياني للمخلفات. إذا رأيت أي نمط موجود ، فهناك تباين المرونة. تزداد القيم عادةً مع زيادة القيمة الملائمة ، مما يؤدي إلى تكوين منحنى مخروطي الشكل.
قراءة: أفكار مشروع التعلم الآلي
الأسباب المعتادة للتغاير المرونة
- عندما يكون هناك تباين كبير في متغير. بمعنى آخر ، عندما تكون القيم الأصغر والأكبر في متغير شديدة للغاية. يمكن أن تكون هذه القيم المتطرفة.
- عندما تقوم بتركيب النموذج الخاطئ. إذا قمت بملاءمة نموذج الانحدار الخطي مع بيانات غير خطية ، فسيؤدي ذلك إلى التغاير المرونة.
- عندما يكون مقياس القيم في متغير مختلفًا.
- عندما يتم استخدام تحويل خاطئ على البيانات للانحدار.
- عند وجود انحراف يمين / يسار في البيانات.
نقية مقابل غير نقية غير نقية
الآن مع الأسباب المذكورة أعلاه ، يمكن أن تكون التغايرية إما نقية أو غير نقية. عندما نلائم النموذج الصحيح (خطي أو غير خطي) وإذا كان هناك نمط مرئي في البقايا ، فإنه يسمى التباين النقي.
ومع ذلك ، إذا قمنا بملاءمة النموذج الخاطئ ثم لاحظنا نمطًا في البقايا ، فهذه حالة عدم نقية غير متجانسة. اعتمادًا على نوع المرونة غير المتجانسة ، يجب اتخاذ التدابير للتغلب عليها. يعتمد أيضًا على المجال الذي تعمل فيه ويختلف من مجال إلى آخر.
آثار التغاير المرونة في تعلم الآلة
كما ناقشنا سابقًا ، يقدم نموذج الانحدار الخطي افتراضًا حول وجود المثلية الجنسية في البيانات. إذا تم كسر هذا الافتراض ، فلن نتمكن من الوثوق بالنتائج التي نحصل عليها.

إذا كانت الحالة غير المتجانسة موجودة ، فسيكون للحالات ذات التباين العالي تأثير أكبر على التنبؤ الذي لا نريده.
- يجعل وجود التغاير المرونة المعامِلات أقل دقة ، وبالتالي تكون المعاملات الصحيحة بعيدة عن قيمة المجتمع.
- من المحتمل أيضًا أن تنتج التغاير المرونة قيم p أصغر من القيم الفعلية. ويرجع ذلك إلى حقيقة أن التباين في تقديرات المعامل قد زاد ولكن نموذج OLS القياسي (المربعات الصغرى العادية) لم يكتشفه. لذلك يحسب نموذج OLS قيم p باستخدام تباين تم التقليل من شأنه. يمكن أن يقودنا هذا إلى استنتاج غير صحيح مفاده أن معاملات الانحدار مهمة عندما لا تكون في الواقع مهمة.
- الأخطاء المعيارية الناتجة ستكون متحيزة أيضًا. الأخطاء المعيارية حاسمة في حساب الاختبارات الهامة وفترات الثقة. إذا كانت الأخطاء المعيارية متحيزة ، فهذا يعني أن الاختبارات غير صحيحة وأن تقديرات معامل الانحدار ستكون غير صحيحة.
كيف نعالج التغاير المرونة؟
إذا اكتشفت وجود التغاير المرونة ، فهناك عدة طرق لمعالجتها. أولاً ، دعنا نفكر في مثال حيث لدينا متغيرين: عدد سكان المدينة وعدد الإصابات بـ COVID-19.
الآن في هذا المثال ، سيكون هناك فرق كبير في عدد الإصابات في مدن المترو الكبيرة مقابل مدن المستوى 3 الصغيرة. سيكون العدد المتغير للعدوى مستقلاً وسيكون عدد سكان المدينة متغيرًا تابعًا.
ضع في اعتبارك أن نموذج الانحدار يتناسب مع هذه البيانات ولاحظ التباين المرن المشابه للصورة أعلاه. لذلك نحن نعلم الآن أن هناك مرونة غير متجانسة موجودة في النموذج وتحتاج إلى إصلاح.
الآن ستكون الخطوة الأولى هي تحديد مصدر التغاير المرونة. في حالتنا ، هو المتغير ذو التباين الكبير.
يمكن أن تكون هناك طرق متعددة للتعامل مع المرونة غير المتجانسة ، لكننا سنلقي نظرة على ثلاث طرق من هذا القبيل.
معالجة المتغيرات
يمكننا إجراء بعض التعديلات على المتغيرات / الميزات التي لدينا لتقليل تأثير هذا التباين الكبير على تنبؤات النموذج. طريقة واحدة للقيام بذلك عن طريق تعديل الميزات إلى معدلات ونسب مئوية بدلاً من القيم الفعلية.
هذا من شأنه أن يجعل الميزات تنقل معلومات مختلفة قليلاً ولكن الأمر يستحق المحاولة. سيعتمد أيضًا على المشكلة والبيانات إذا كان من الممكن تنفيذ هذا النوع من النهج أم لا.
تتضمن هذه الطريقة أقل تعديل مع الميزات وغالبًا ما تساعد في حل المشكلة وحتى تحسين أداء النموذج في بعض الحالات.
لذلك في حالتنا ، يمكننا تغيير ميزة "عدد الإصابات" إلى "معدل العدوى". سيساعد هذا في تقليل التباين حيث من الواضح تمامًا أن عدد الإصابات في المدن ذات الكثافة السكانية الكبيرة سيكون كبيرًا.
الانحدار المرجح
الانحدار الموزون هو تعديل للانحدار الطبيعي حيث يتم تعيين أوزان معينة لنقاط البيانات وفقًا لتباينها. تُعطى الأوزان ذات التباين الكبير أوزانًا صغيرة وتلك ذات التباين الأقل تعطى أوزانًا أكبر.
لذلك عندما يتم تربيع هذه الأوزان ، فإن مربع الأوزان الصغيرة يقلل من تأثير التباين العالي.
عندما يتم استخدام الأوزان الصحيحة ، يتم استبدال اللواط غير المتجانسة. لكن كيف تجد الأوزان الصحيحة؟ إحدى الطرق السريعة هي استخدام معكوس هذا المتغير كوزن.
لذلك في حالتنا ، سيكون الوزن معكوسًا لسكان المدينة.
التحولات
يعتبر تحويل البيانات هو الملاذ الأخير حيث تفقد بذلك قابلية تفسير السمة.
ما يعنيه ذلك هو أنه لم يعد بإمكانك بسهولة شرح ما تعرضه الميزة.

يمكن أن تكون إحدى الطرق هي استخدام تحويلات Box-Cox وتحويلات السجل.
قبل ان تذهب
يمكن أن يكون هناك العديد من الأسباب للتغاير المرونة في بياناتك. كما أنها تختلف بشكل كبير من مجال إلى آخر.
لذلك من الضروري أن تكون على دراية بذلك قبل أن تبدأ بالعمليات المذكورة أعلاه لإزالة التغاير المرونة.
في هذه المدونة ، ناقشنا اللواط والتغاير المطاطية وكيف يمكن استخدامها لتنفيذ العديد من خوارزميات التعلم الآلي.
إذا كنت مهتمًا بمعرفة المزيد عن التعلم الآلي ، فراجع برنامج IIIT-B & upGrad's Executive PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT -ب حالة الخريجين ، 5+ مشاريع التخرج العملية العملية والمساعدة في العمل مع الشركات الكبرى.
ما المقصود بالتراجع المرجح محليًا في التعلم الآلي؟
ما هو الاختبار الأبيض للتغاير المرونة؟
إذا كنت بحاجة إلى أن يكون للمتغير المستقل تأثير تفاعلي غير خطي على التباين ، فمن المفضل استخدام اختبار أبيض للتحقق من عدم تغاير المرونة. ومع ذلك ، فإن الاختبار الأبيض ، باعتباره اختبارًا مقاربًا ، يُفضل في حالة العينات الكبيرة فقط. يمكن أن تكون عملية التغاير المرونة دالة لواحد أو أكثر من المتغيرات المستقلة الخاصة بك باستخدام اختبار White. إنه مشابه لاختبار Breusch-Pagan ، والفرق الوحيد هو أن اختبار White يسمح بتأثير غير خطي وتفاعلي للمتغير المستقل على تباين الخطأ.
ما هي بالضبط الفرضية الصفرية للتغاير المطاطية؟
يؤدي وجود شاذ في البيانات إلى عدم التجانس. يمكن أيضًا إنتاج التغاير المرونة عند حذف المتغيرات من النموذج. تشير التغاير المرونة إلى فرضيتين فقط: الفرضية الصفرية والفرضية البديلة. عند تطبيق اختبار White أو Breusch-Pagan أو Cook-Weisberg للتحقق من عدم التجانس ، تكون الفرضية الصفرية صحيحة إذا كانت تباينات الأخطاء متساوية. تحدث فرضية بديلة عندما لا تكون تباينات الأخطاء متطابقة.