نموذج الانحدار الخطي: ما هو وكيف يعمل؟

نشرت: 2020-12-16

جدول المحتويات

مقدمة

يعد تحليل الانحدار أداة مهمة لنمذجة البيانات وتحليلها ؛ من الضروري إيجاد العلاقة بين متغيرين أو أكثر. يساعد الانحدار على وضع نقاط البيانات داخل منحنى يساعد في نمذجة البيانات وتحليلها. يسمح الانحدار بقياس وتمييز المتغيرات على مستويات مختلفة لتقييم النماذج ومجموعات البيانات التنبؤية.

يجب أن تقرأ: أفكار مشروع الانحدار الخطي

نموذج الانحدار

يتضمن النموذج قيم المعامل المستخدم في تمثيل البيانات. يتضمن الخصائص الإحصائية المستخدمة لتقدير تلك المعاملات ؛ إنه اندماج جميع الانحرافات المعيارية والتغاير والارتباطات. يجب أن تكون جميع البيانات متاحة.

نموذج الانحدار هو شرط خطي يدمج ترتيبًا معينًا للقيم الإعلامية (x) الإجابة التي تمثل الناتج المتوقع لتلك المجموعة من قيم المعلومات (y). كل من قيم المعلومات (x) والمخرجات رقمية.

تخصص المعادلة الخطية عامل مقياس واحد لكل قيمة أو جزء إعلامي ، يسمى المعامل ويُشار إليه بالحرف اليوناني الكبير بيتا (ب). يُضاف أيضًا معامل إضافي واحد ، مما يمنح الخط مستوى إضافيًا من الفرص (على سبيل المثال الانتقال إلى كل مكان في مخطط ثنائي الأبعاد) وهذا كثيرًا ما يسمى الالتقاط أو معامل الميل.

على سبيل المثال ، في الانحدار الأساسي (x بسيط و y بسيط) ، سيكون نوع النموذج:

ص = B0 + B1 * س

في القياسات الأعلى عندما يكون لدينا أكثر من معلومة (س) ، يُعرف الخط بالمستوى أو المستوى الفائق. التصوير على طول هذه الخطوط هو نوع الشرط والصفات الخاصة المستخدمة للمعاملات (على سبيل المثال B0 و B1 في النموذج أعلاه).

ليس من غير المتوقع مناقشة الطبيعة متعددة الأوجه لنموذج الانتكاس مثل الانحدار. يشير هذا إلى عدد المعاملات المستخدمة في النموذج.

عند النقطة التي يصل فيها المعامل إلى الصفر ، فإنه يلغي بشكل كاف تأثير متغير المعلومات على النموذج وبالتالي من التنبؤ الناتج باستخدام النموذج (0 * س = 0). هذا وثيق الصلة إذا ألقيت نظرة على تقنيات التنظيم التي تغير حساب التعلم لتقليل الطبيعة متعددة الأوجه لنماذج الانتكاس عن طريق الضغط على الحجم الأعلى للمعاملات ، مما يدفع البعض إلى الصفر.

من الأفضل تمثيل الانحدار بخط مستقيم حيث يتم استخدام متغير واحد أو أكثر لإنشاء علاقة.

المنطق الكامن وراء النموذج:

حيث يستخدم نموذج الانحدار المعادلة y = mx + c

حيث y = متغير مستقل

م = المنحدر

ج = اعتراض لخط معين

لحساب العديد من المتغيرات المستقلة ، سيتم وضع نماذج الانحدار المتعددة قيد التنفيذ. إليك العملية نحو إنشاء نموذج يعمل بشكل مثالي

  1. مكتبات الاستيراد- هناك معلمات أساسية تدور حول تنفيذ نماذج التعلم الآلي. يجب أن تتضمن المكتبة الأولى sklearn لأنها مكتبة التعلم الآلي الرسمية في Python. يستخدم Numpy لتحويل البيانات إلى مصفوفات ، وللوصول إلى ملفات مجموعة البيانات ، يتم تنفيذ Pandas.
  2. قم بتحميل مجموعة البيانات النسبية- يتم إنجاز ذلك بمساعدة متغير Panda الذي تم استيراده مسبقًا.
  3. تقسيم المتغيرات- تحديد وتعريف عدد المتغيرات المستقلة أو المتغيرات التابعة المطلوبة لعناصر الصفيف.
  4. تقسيم بيانات الاختبار والتدريب - يتم تقسيم مجموعة البيانات بأكملها إلى مجالات تدريب واختبار للسماح بالقيم العشوائية المأخوذة من مجموعة البيانات وتسهيلها.
  5. اختر النموذج الصحيح - سيتطلب الخيار المناسب عملية التجربة والخطأ حيث يتم تضمين نفس مجموعة البيانات مع النماذج الأخرى.
  6. توقع المخرجات - سيعمل النموذج على المتغير التابع المدعوم بقيم الاختبار من المتغير المستقل ، والطرق المضمنة في هذه النماذج تقوم بالحسابات النوعية لكل قيمة معروضة.

هذا يبدأ تنفيذ نموذج الانحدار الخطي. يتم تنفيذ وظائف التوقع الخطي لنمذجة العلاقة ، كما ذكر سابقًا. يعطي المتوسط ​​الشرطي للاستجابة النموذج المتنبئين المطلوبين لتحريك المتوسط ​​الشرطي للاستجابة.

الهدف من هذا التنبؤ والتنبؤ هو استيعاب متغيرات إضافية دون إضافة قيمة استجابة مصاحبة ؛ سيتم تنفيذ النموذج المناسب لإجراء التنبؤ اللازم لتلك الاستجابة.

يفضل استخدام نماذج الانحدار الخطي مع نهج المربعات الصغرى ، حيث قد يتطلب التنفيذ طرقًا أخرى عن طريق تقليل الانحرافات ووظائف التكلفة ، على سبيل المثال. تتضمن النماذج الخطية العامة متغير استجابة يكون متجهًا بطبيعته وليس عدديًا بشكل مباشر. لا يزال يُفترض أن الخطية الشرطية موجبة خلال عملية النمذجة. تختلف على نطاق واسع ، ولكن من الأفضل وصفها بالتوزيع المنحرف ، والذي يرتبط بالتوزيع اللوغاريتمي العادي.

اقرأ: أنواع نماذج الانحدار في التعلم الآلي

تحذيرات

بالنظر إلى أن المتغيرين مرتبطان ، فإن هذا لا يستبعد الميزة التي يسبب أحدهما الآخر.

إذا تمت محاولة معادلة الانحدار الخطي لمجموعة بيانات وكانت ناجحة ، فهذا لا يعني بالضرورة أن المعادلة مناسبة تمامًا ، فقد تكون هناك تكرارات أخرى ذات نظرة مماثلة. للتأكد من أن التقنية أصلية ، حاول رسم خط بنقاط البيانات للعثور على خطية المعادلة.

لتلخيص

ثبت أن طريقة الانحدار الخطي توفر طريقة أفضل وقوية وإحصائية تسمح بزيادة الفرص وإيجاد إمكانية التنبؤ بالأحداث والعلاقات بين متغيرين أو أكثر من المتغيرات ذات الأهمية في المسألة.

إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.

اذكر بعض المشكلات التي يمكن أن يواجهها المرء أثناء استخدام نموذج الانحدار الخطي.

يساعد الانحدار الخطي في التنبؤ بالعلاقة بين متوسط ​​المتغير التابع والعوامل المستقلة. يصبح هذا مشكلة لأنه في بعض الأحيان تكون الطريقة الوحيدة لحل المشكلة هي النظر إلى القيمة القصوى للمتغير التابع. من ناحية أخرى ، يمكن استخدام الانحدار الكمي لحل هذه المشكلة. علاوة على ذلك ، يفترض الانحدار الخطي أن البيانات المقدمة مستقلة ، وهو أمر غير صحيح في حالة حدوث مشكلات في التجميع.

ما هو معامل الارتباط الخطي في الانحدار؟

معامل الارتباط هو مجرد جانب واحد من تحليل العلاقة بين المتغيرات في الانحدار الخطي البسيط. في الواقع ، إنها واحدة من أقوى طرق التحليل الإحصائي وأكثرها استخدامًا. معامل الارتباط اللحظي للمنتج ، وهو في الأساس إحصائية تخبرنا بمدى ارتباط متغيرين ، هو معامل الارتباط الأكثر استخدامًا. يقيس معامل الارتباط الخطي قوة الارتباط الخطي بين متغيرين. الاتصال الخطي المثالي هو الاتصال الذي يؤدي فيه التغيير في متغير واحد إلى تغيير متطابق للوحدة في المتغير الآخر.

كيف يكون تحليل الانحدار مفيدًا في أي عمل؟

يساعد تحليل الانحدار المؤسسة على فهم ما تمثله نقاط البيانات الخاصة بها وتطبيق مناهج تحليلية للأعمال عليها من أجل اتخاذ قرارات أفضل. يستخدم محللو الأعمال والمتخصصون في البيانات هذه الأداة الإحصائية المتطورة للتخلص من المتغيرات غير الضرورية واختيار المتغيرات الأكثر صلة. تستخدم المنظمات عملية صنع القرار التي تعتمد على البيانات ، والتي تزيل تقنيات المدرسة القديمة مثل التخمين أو افتراض فرضية ، ونتيجة لذلك ، تزيد من أداء العمل.