الانحدار الخطي في التعلم الآلي: كل ما تحتاج إلى معرفته

نشرت: 2020-04-28

تُستخدم تقنيات التعلم الآلي المختلفة في العديد من مناحي حياتنا اليومية لإيجاد حلول للمشاكل اليومية بطريقة مدعومة بالبيانات والتحليل والخبرة. تلعب خوارزميات التعلم الآلي هذه دورًا مهمًا للغاية ليس فقط في تحديد النص والصور ومقاطع الفيديو ولكنها مفيدة في تحسين الحلول الطبية والأمن السيبراني والتسويق وخدمات العملاء والعديد من الجوانب أو المجالات الأخرى التي تهم حياتنا العادية.

هناك نوعان أساسيان من خوارزميات التعلم الآلي التي يتم تقسيم جميع الخوارزميات إليهما. هذه خوارزميات تعلم الآلة خاضعة للإشراف وغير خاضعة للإشراف. سينصب تركيزنا في هذه المدونة على خوارزميات التعلم الآلي الخاضعة للإشراف ، وعلى وجه الخصوص - الانحدار الخطي. لنبدأ بفهم خوارزميات التعلم الآلي الخاضعة للإشراف.

جدول المحتويات

ما هي خوارزميات التعلم تحت الإشراف؟

خوارزميات التعلم الآلي هذه هي تلك التي ندربها للتنبؤ بمخرجات راسخة تعتمد على البيانات التي يتم إدخالها من قبل المستخدم. تقوم الخوارزمية بتدريب النموذج لتقديم مخرجات على مجموعة بيانات معينة. في البداية ، يتمتع النظام بإمكانية الوصول إلى بيانات الإدخال والإخراج. تتمثل مهمة النظام في تحديد القواعد التي ستقوم بتعيين المدخلات إلى المخرجات.

يستمر تدريب النموذج حتى يصل الأداء إلى مستواه الأمثل. بعد التدريب ، يكون النظام قادرًا على تعيين عناصر المخرجات التي لم يواجهها أثناء التدريب. في السيناريو المثالي ، تكون هذه العملية دقيقة تمامًا ولا تستغرق الكثير من الوقت. هناك نوعان من خوارزميات التعلم الخاضع للإشراف ، وهما التصنيف والانحدار.

سنناقش كلاهما بإيجاز ، قبل القفز مباشرة إلى موضوع المناقشة الأساسي.

1. التصنيف

هذه خوارزميات تعلم آلي خاضعة للإشراف ولها هدف بسيط وهو إعادة إنتاج مهام الفصل. غالبًا ما يتم النظر في أسلوب التعلم في المواقف التي يكون فيها فصل البيانات مطلوبًا. يقسم البيانات إلى فئات من خلال توقع الاستجابات. على سبيل المثال ، توقعات الطقس ليوم معين ، وتحديد نوع معين من الصور من ألبوم ، وفصل البريد العشوائي عن البريد الإلكتروني.

2. الانحدار

تستخدم تقنية التعلم لخدمة هدف إعادة إنتاج قيم المخرجات. بمعنى آخر ، يتم استخدامه في المواقف التي نحتاج فيها إلى ملاءمة البيانات مع قيمة محددة. على سبيل المثال ، غالبًا ما يتم استخدامه لتقدير سعر العناصر المختلفة. يمكن استخدام الانحدار للتنبؤ بأشياء أكثر مما تتخيله.

أنواع الانحدار

الانحدار اللوجستي والخطي هما أهم نوعين من الانحدار الموجود في العالم الحديث للتعلم الآلي وعلوم البيانات. ومع ذلك ، هناك آخرون أيضًا ، لكن يتم استخدامها بشكل ضئيل جدًا. ليس هناك من ينكر حقيقة أنه يمكننا إجراء العديد من الانحدارات على مجموعة بيانات معينة أو استخدامها في مواقف مختلفة.

كل شكل من أشكال الانحدار له إيجابياته وسلبياته وهو مناسب لظروف معينة. بينما سنركز فقط على العدوان الخطي ، فأنت بحاجة إلى معرفة الخلفية الكاملة لتتعرف على طريقة عملها.

هذا هو سبب اتخاذنا المناقشة خطوة بخطوة.

ما هو تحليل الانحدار؟

تحليل الانحدار ليس سوى منهجية نمذجة تنبؤية تهدف إلى التحقيق في العلاقة الموجودة بين المتغيرات المستقلة أو المتنبئين والمتغيرات أو الأهداف التابعة. يُستخدم هذا التحليل في مجموعة من الأشياء المختلفة ، بما في ذلك نمذجة السلاسل الزمنية والتنبؤ وغير ذلك.

على سبيل المثال ، إذا كنت ترغب في دراسة العلاقة بين حوادث الطرق والقيادة غير الرسمية ، فلا يوجد أسلوب أفضل من تحليل الانحدار لهذه الوظيفة. إنها تلعب دورًا مهمًا للغاية في كل من تحليل البيانات ونمذجةها. يتم ذلك عن طريق ملاءمة خط أو منحنى لنقاط بيانات مختلفة بطريقة يمكننا من خلالها تقليل الاختلاف في مسافات نقاط البيانات عن الخط أو المنحنى.

ما هي الحاجة لتحليل الانحدار؟

يستخدم تحليل الانحدار للتنبؤ بالعلاقة بين المتغير ، فقط إذا كانا اثنين أو أكثر من حيث العدد. دعونا نفهم كيف يعمل هذا بمثال بسيط. لنفترض أن مهمة تتطلب منك التوصل إلى نمو مبيعات الشركة لتقدير فترة معينة مع الأخذ في الاعتبار الظروف الاقتصادية الحالية.

الآن تخبرك بيانات الشركة أن المبيعات نمت حوالي ضعف النمو في الاقتصاد. يمكننا استخدام هذه البيانات لتقدير نمو مبيعات الشركة في المستقبل من خلال أخذ رؤى من المعلومات السابقة والحالية.

يمكن أن يوفر لك استخدام تحليل الانحدار عددًا من الفوائد عند التعامل مع البيانات أو عمل توقع على مجموعة البيانات. يمكن استخدامه للإشارة إلى العلاقات المهمة بين المتغيرات المستقلة والتابعة. يتم استخدامه للإشارة إلى تأثير تجارب المتغير التابع من المتغيرات المستقلة المتعددة.

يسمح بمقارنة تأثيرات المتغيرات المختلفة التي تنتمي إلى مقاييس قياس مختلفة. تقطع هذه الأشياء شوطًا طويلاً في مساعدة علماء البيانات والباحثين ومحللي البيانات في بناء نماذج تنبؤية تعتمد على مجموعة المتغيرات الأكثر ملاءمة.

قراءة: أفكار وموضوعات مشروع التعلم الآلي

ما الذي يجب أن تضعه في اعتبارك لاختيار نموذج الانحدار الصحيح؟

حسنًا ، عادةً ما تكون الأمور أسهل كثيرًا عندما يكون لديك أسلوبان أو ثلاث تقنيات للاختيار من بينها. ومع ذلك ، إذا كان لدينا الكثير من الخيارات المتاحة لنا ، فسيصبح القرار أكثر صعوبة. الآن لا يمكنك اختيار الانحدار الخطي فقط لأن النتيجة مستمرة. أو اذهب إلى الانحدار اللوجستي إذا كانت النتيجة ثنائية. هناك المزيد من الأشياء التي يجب مراعاتها عند اختيار نموذج الانحدار لمشكلتنا.

كما ذكرنا من قبل ، هناك المزيد من نماذج الانحدار المتاحة ، ثم يمكننا الحصول على رؤوسنا. إذن ما الذي يجب أن نضعه في الاعتبار أثناء الاختيار؟ هناك بعض الأشياء المهمة - أبعاد البيانات ، ونوع المتغير التابع والمستقل ، والخصائص الأخرى للبيانات المعنية. فيما يلي بعض الأشياء المهمة التي يجب مراعاتها أثناء اختيار نموذج الانحدار الصحيح:

استكشاف البيانات هو المفتاح لبناء النماذج التنبؤية. لا عجب أنه يجب أن يكون من بين أول الأشياء التي يجب عليك القيام بها قبل الاختيار. استكشف البيانات لتحديد التأثير المتغير والعلاقة.

تقييم نماذج الانحدار المختلفة للتنبؤ من خلال التحقق من الصحة. افصل مجموعة بياناتك إلى مجموعات تدريب وتحقق من الصحة. سيوفر متوسط ​​التربيع بين القيم المتنبأ بها والقيم الملاحظة نظرة ثاقبة على دقة التنبؤ.

استخدم Ridge و ElasticNet وطرق تنظيم الانحدار الأخرى لاختيار النموذج المناسب لمجموعات البيانات التي تحتوي على متغيرات ذات علاقة خطية وأبعاد عالية.

لإجراء مقارنة بين نماذج الانحدار المختلفة ومدى ملاءمتها ، يمكننا تحليل المعلمات ، مثل AIC ، و BIC ، و R-square ، ومصطلح الخطأ ، وغيرها. هناك معيار واحد آخر يسمى Mallow's Cp. يقارن النموذج مع نماذج فرعية مختلفة للبحث عن التحيز.

لا تتبع أبدًا طريقة اختيار النموذج التلقائي إذا كانت مجموعة البيانات التي تعمل بها تحتوي على عدد من المتغيرات المحيرة. إذا قمت بذلك ، فستتجه نحو وضع هذه المتغيرات في النموذج مرة واحدة.

هدفك مهم أيضًا لاختيار نموذج الانحدار الصحيح. سواء كنت بحاجة إلى نموذج قوي أو بسيط أو نموذج ذي دلالة إحصائية ، فسوف يعتمد ذلك على هدفك.

ما هو الانحدار الخطي؟

دعنا نعرف المزيد عن ما هو الانحدار الخطي. إنها إحدى تقنيات التعلم الآلي التي تندرج تحت التعلم الخاضع للإشراف. إن الارتفاع في الطلب على تقنيات التعلم الآلي واستخدامها هو السبب وراء الزيادة المفاجئة في استخدام الانحدار الخطي في عدة مجالات. هل تعلم أن طبقات الإدراك الحسي متعدد الطبقات معروفة بأداء انحدار خطي؟ دعونا الآن نلقي بعض الضوء على الافتراضات التي من المعروف أن الانحدار الخطي يقوم بها حول مجموعات البيانات التي يتم تطبيقها عليها.

1. الارتباط التلقائي:

يشير هذا الافتراض الذي تم إجراؤه بواسطة الانحدار الخطي إلى القليل من الارتباط التلقائي في البيانات أو عدم وجوده على الإطلاق. يحدث الارتباط التلقائي عندما تعتمد الأخطاء المتبقية على بعضها البعض بطريقة أو بأخرى.

2. علاقة خطية متعددة:

يشير هذا الافتراض إلى أن العلاقة الخطية المتداخلة المتعددة للبيانات إما غير موجودة على الإطلاق أو غير موجودة بشكل نادر. تحدث العلاقة الخطية المتعددة عندما تُظهر الميزات أو المتغيرات المستقلة بعض التبعية.

3. علاقة متغيرة:

يفترض النموذج وجود علاقة خطية بين متغيرات الميزة والاستجابة.

تتضمن بعض الحالات التي يمكنك فيها استخدام الانحدار الخطي تقدير سعر المنزل اعتمادًا على عدد الغرف به ، وتحديد مدى جودة نمو النبات اعتمادًا على عدد مرات ريه ، وما إلى ذلك. لكل هذه الحالات ، سيكون لديك بالفعل فكرة عن نوع العلاقة الموجودة بين المتغيرات المختلفة.

عندما تستخدم تحليل الانحدار الخطي ، فإنك تدعم فكرتك أو فرضيتك بالبيانات. عندما تطور فهمًا أفضل للعلاقة بين المتغيرات المختلفة ، فأنت في وضع أفضل لعمل تنبؤات قوية. إذا كنت لا تعرف بالفعل ، دعنا نخبرك أن الانحدار الخطي هو أسلوب تعلم آلي خاضع للإشراف بالإضافة إلى نموذج إحصائي.

في مصطلحات التعلم الآلي ، يعد نموذج الانحدار هو جهازك ، ويرتبط التعلم بهذا النموذج الذي يتم تدريبه على مجموعة بيانات ، مما يساعده على معرفة العلاقة بين المتغيرات ويمكّنه من إجراء تنبؤات مدعومة بالبيانات.

كيف يعمل الانحدار الخطي؟

قبل أن نجري التحليل ، لنفترض أن لدينا نوعين من الفرق - تلك التي تؤدي وظائفها بشكل جيد وتلك التي لا تؤدي وظائفها. يمكن أن تكون هناك عدة أسباب تجعل الفريق غير جيد فيما يقوم به. قد يكون ذلك بسبب عدم امتلاكه مجموعة المهارات المناسبة أو عدم امتلاكه الخبرة المطلوبة لأداء واجبات معينة في العمل. لكن ، لا يمكنك أبدًا أن تكون متأكدًا مما هو عليه.

يمكننا استخدام الانحدار الخطي لاكتشاف المرشحين الذين لديهم كل ما هو مطلوب ليكونوا الأنسب لفريق معين يشارك في مجال معين من العمل. سيساعدنا هذا في اختيار المرشحين الذين من المرجح أن يكونوا جيدين في وظائفهم.

الهدف الذي يخدمه تحليل الانحدار هو إنشاء منحنى أو خط اتجاه مناسب للبيانات المعنية. يساعدنا هذا في معرفة كيفية ارتباط معلمة واحدة (المتغيرات المستقلة) بالمعامل الآخر (المتغيرات التابعة).

قبل أي شيء آخر ، نحتاج أولاً إلى إلقاء نظرة فاحصة على جميع سمات المرشحين المختلفين ومعرفة ما إذا كانت مرتبطة بطريقة أو بأخرى. إذا وجدنا بعض الارتباطات ، فيمكننا المضي قدمًا في البدء في عمل تنبؤات بناءً على هذه السمات.

يتم استكشاف العلاقة في البيانات باستخدام منحنى أو خط اتجاه ورسم البيانات. يوضح لنا المنحنى أو الخط ما إذا كان هناك أي ارتباط. يمكننا الآن استخدام الانحدار الخطي لدحض العلاقات أو قبولها. عندما يتم تأكيد العلاقة ، يمكننا استخدام خوارزمية الانحدار لمعرفة علاقته. سيمكننا هذا من عمل التنبؤات الصحيحة. سنكون قادرين على التنبؤ بشكل أكثر دقة بما إذا كان المرشح مناسبًا للوظيفة أم لا.

أهمية تدريب النموذج

تتشابه العملية التي ينطوي عليها تدريب نموذج الانحدار الخطي من نواحٍ عديدة مع كيفية تدريب نماذج التعلم الآلي الأخرى. نحتاج إلى العمل على مجموعة بيانات تدريبية ونمذجة العلاقة بين متغيراتها بطريقة لا تؤثر على قدرة النموذج على التنبؤ بعينات بيانات جديدة. تم تدريب النموذج على تحسين معادلة التنبؤ بشكل مستمر.

يتم ذلك عن طريق تكرار الحلقات من خلال مجموعة البيانات المحددة. في كل مرة تكرر فيها هذا الإجراء ، تقوم في نفس الوقت بتحديث قيمة الانحياز والوزن في الاتجاه الذي تشير إليه دالة التدرج أو التكلفة. يتم الوصول إلى مرحلة إكمال التدريب عندما يتم لمس عتبة الخطأ أو عندما لا يكون هناك انخفاض في التكلفة مع التكرارات التدريبية التالية.

قبل أن نبدأ في تدريب النموذج ، هناك بعض الأشياء التي نحتاج إلى إعدادها. نحتاج إلى تحديد عدد التكرار المطلوب بالإضافة إلى معدل التعلم. بصرف النظر عن هذا ، يتعين علينا أيضًا تعيين قيم افتراضية لأوزاننا. سجل أيضًا التقدم الذي يمكننا تحقيقه مع كل تكرار.

ما هو التنظيم؟

إذا تحدثنا عن متغيرات الانحدار الخطي المفضلة على غيرها ، فسنضطر إلى ذكر تلك التي أضافت التنظيم. يتضمن التنظيم معاقبة تلك الأوزان في نموذج يحتوي على قيم مطلقة أكبر من غيرها.

يتم إجراء التنظيم للحد من فرط التخصيص ، وهو ما يفعله النموذج غالبًا لأنه يعيد إنتاج علاقات بيانات التدريب بشكل وثيق للغاية. لا يسمح للنموذج بتعميم العينات التي لم يسبق لها مثيل كما يفترض.

متى نستخدم الانحدار الخطي؟

تكمن قوة الانحدار الخطي في مدى بساطته. هذا يعني أنه يمكن استخدامه للعثور على إجابات لكل سؤال تقريبًا. قبل استخدام خوارزمية الانحدار الخطي ، يجب عليك التأكد من أن مجموعة البيانات الخاصة بك تفي بالشروط المطلوبة التي تعمل عليها.

أهم هذه الشروط هو وجود علاقة خطية بين متغيرات مجموعة البيانات الخاصة بك. هذا يسمح لهم بالتخطيط بسهولة. عليك أن ترى الفرق الموجود بين القيم المتوقعة والقيمة المحققة في الواقع ثابتًا. يجب أن تظل القيم المتوقعة مستقلة ، ويجب أن يكون الارتباط بين المتنبئين قريبًا جدًا من الراحة.

يمكنك ببساطة رسم بياناتك على طول خط ثم دراسة هيكلها بدقة لمعرفة ما إذا كانت مجموعة البيانات الخاصة بك تلبي الشروط المطلوبة أم لا.

يستخدم الانحدار الخطي

البساطة التي تجعل العدوان الخطي التفسيرات أسهل على المستوى الجزيئي هي واحدة من أكبر مزاياها. يمكن تطبيق الانحدار الخطي على جميع مجموعات البيانات حيث يكون للمتغيرات علاقة خطية.

يمكن للشركات استخدام خوارزمية الانحدار الخطي في بيانات مبيعاتها. افترض أنك شركة تخطط لإطلاق منتج جديد. لكنك لست متأكدًا حقًا من السعر الذي يجب أن تبيع فيه هذا المنتج. يمكنك التحقق من كيفية استجابة عملائك لمنتجك عن طريق بيعه ببضع نقاط سعر مدروسة جيدًا. سيسمح لك ذلك بتعميم العلاقة بين مبيعات المنتج والسعر. باستخدام الانحدار الخطي ، ستتمكن من تحديد نقطة السعر التي من المرجح أن يقبلها العملاء.

اقرأ أيضًا: راتب تعلم الآلة في الهند

يمكن أيضًا استخدام الانحدار الخطي في مراحل مختلفة من تحديد مصادر المنتج وإنتاجه. تستخدم هذه النماذج على نطاق واسع في المجالات الأكاديمية والعلمية والطبية. على سبيل المثال ، يمكن للمزارعين نمذجة نظام يسمح لهم باستخدام الظروف البيئية لصالحهم. سيساعدهم ذلك في العمل مع العناصر بطريقة تسبب الحد الأدنى من الضرر لعائد محصولهم وأرباحهم.

بالإضافة إلى ذلك ، يمكن استخدامه في الرعاية الصحية وعلم الآثار والعمل من بين مجالات أخرى. هي كيفية التفسير على نموذج خطي

خاتمة

تحليل الانحدار هو أداة معتمدة على نطاق واسع تستخدم الرياضيات لفرز المتغيرات التي يمكن أن يكون لها تأثير مباشر أو غير مباشر على البيانات النهائية. من المهم أن تضع ذلك في الاعتبار أثناء إجراء التحليل! يعد الانحدار الخطي أحد الخوارزميات الأكثر شيوعًا التي يستخدمها علماء البيانات لإنشاء علاقات خطية بين متغيرات مجموعة البيانات ، ونموذجها الرياضي ضروري للتحليل التنبئي.

إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.

هل للانحدار الخطي أي قيود أو عيوب؟

الانحدار الخطي هو طريقة شائعة تستخدم لفهم العلاقة بين متغير تابع ومتغير واحد أو أكثر من المتغيرات المستقلة. على الرغم من استخدام نموذج الانحدار الخطي على نطاق واسع لتطوير نماذج التعلم الآلي ، إلا أنه يأتي مع بعض القيود. على سبيل المثال ، تفترض خوارزمية الانحدار هذه أن جميع العلاقات بين المتغيرات خطية ، والتي يمكن أن تكون مضللة في كثير من الأحيان. بعد ذلك ، فإنه دائمًا ما يأخذ في الاعتبار القيمة المتوسطة للمتغير التابع أثناء فحص علاقاته مع المتغيرات المستقلة. بعد ذلك ، يفترض الانحدار الخطي دائمًا أن البيانات متنافية ، أي مستقلة عن قيم الآخرين ، والتي يمكن أن تكون غير صحيحة. إلى جانب ذلك ، يكون الانحدار الخطي حساسًا بشكل عام للقيم المتطرفة أو البيانات غير المتوقعة.

ما هي أسباب شعبية تحليل الانحدار؟

يعد تحليل الانحدار من أكثر التقنيات الإحصائية فائدةً وقوةً المستخدمة في التعلم الآلي. هناك العديد من الأسباب التي تفسر شعبيتها. أولاً ، يأتي تحليل الانحدار مع مجموعة واسعة من التطبيقات نظرًا لتعدد استخداماته الهائل. نموذج تحليل الانحدار سهل التنفيذ والتفسير ، أي يمكنك بسهولة شرح كيفية عمله وتفسير النتائج. يوفر فهم تحليل الانحدار قبضة قوية على النماذج الإحصائية للتعلم الآلي. كما أنه يساعدك على تطوير نماذج تعلم آلي أكثر كفاءة باستخدام لغات البرمجة مثل R و Python. علاوة على ذلك ، توفر هذه التقنية تكاملًا ممتازًا مع الشبكات العصبية الاصطناعية لعمل تنبؤات مفيدة.

كيف يمكن للشركات تطبيق الانحدار الخطي لصالحها؟

يمكن للشركات استخدام الانحدار الخطي لفحص وإنشاء رؤى بيانات مفيدة حول سلوك المستهلك الذي يؤثر على الربحية. يمكن أن يساعد أيضًا الشركات في إجراء تقديرات وتقييم اتجاهات السوق. يمكن للمسوقين استخدام الانحدار الخطي لتقييم فعالية استراتيجياتهم التسويقية التي تتضمن الترقيات وتسعير المنتجات. يمكن لشركات التمويل والتأمين تقييم المخاطر بشكل فعال وصياغة قرارات الأعمال الحاسمة. يمكن لشركات بطاقات الائتمان أن تهدف إلى تقليل محفظتها من المخاطر مع المتعثرين باستخدام نماذج الانحدار الخطي.