مقابل الانحدار الخطي. الانحدار اللوجستي: الفرق بين الانحدار الخطي والانحدار اللوجستي
نشرت: 2020-09-10لن يكتمل عالم التعلم الآلي بدون وجود اثنين من أبسط خوارزميات التعلم الآلي. نعم ، يعد كل من الانحدار الخطي والانحدار اللوجستي من أكثر خوارزميات التعلم الآلي التي يمكنك تنفيذها مباشرة. قبل مناقشة أي من الاختلافات بين الانحدار الخطي واللوجستي ، يجب أولاً أن نفهم الأساسيات التي تم وضع أساس كل من هذه الخوارزميات عليها.
أولاً ، كل من هذه الخوارزميات تخضع للإشراف في التعلم في الطبيعة. بمعنى ، يجب أن تكون البيانات التي ستقدمها في كل من هذه الخوارزميات مصنفة جيدًا. شيء مهم آخر يجب ملاحظته هو حالات الاستخدام. بعيدًا عن الخفاش ، هناك اختلاف صارخ بين هاتين الخوارزميتين وهو حالات استخدام كلاهما. يُستخدم الانحدار الخطي كلما أردنا إجراء الانحدار. بمعنى ، نستخدم الانحدار الخطي عندما نريد توقع أرقام مستمرة ، مثل أسعار المنازل في منطقة معينة.
ومع ذلك ، فإن استخدام الانحدار اللوجستي يتم في مشاكل التصنيف. بمعنى ، إذا أردنا التنبؤ بما إذا كان منزل معين باهظ الثمن أو غير مكلف (بدلاً من السعر) ، فإننا نستخدم خوارزمية الانحدار اللوجستي. نعم ، على الرغم من أن الانحدار اللوجستي يحتوي على كلمة الانحدار في اسمه ، إلا أنه يُستخدم للتصنيف.
هناك المزيد من التفاصيل الدقيقة المثيرة التي ستجدها مدرجة أدناه. ولكن قبل مقارنة الانحدار الخطي مقابل الانحدار اللوجستي ، دعونا أولاً نتعلم المزيد عن كل من هذه الخوارزميات.
جدول المحتويات
الانحدارالخطي
الانحدار الخطي هو أسهل وأبسط خوارزمية للتعلم الآلي للفهم والنشر. إنها خوارزمية تعلم خاضعة للإشراف ، لذلك إذا أردنا التنبؤ بالقيم المستمرة (أو إجراء الانحدار) ، فسيتعين علينا خدمة هذه الخوارزمية بمجموعة بيانات جيدة التسمية. تعد خوارزمية التعلم الآلي هذه أكثر وضوحًا بسبب طبيعتها الخطية. للتنبؤ بنجاح بالقيم المستقبلية ، يحاول الانحدار الخطي الوصول إلى خط مستقيم من خلال البيانات التي يتم إدخالها في الخوارزمية.
لذلك ، كلما تم إدخال أي معلومات في خوارزمية الانحدار الخطي ، فإنها تأخذ البيانات وتأخذ معادلة الخط المستقيم ، وتختار بشكل عشوائي الميل والتقاطع حتى تجد الخط الأنسب. إذا كانت البيانات التي نقوم بإدخالها في هذه الخوارزمية تحتوي فقط على متغير مستقل واحد ، فإنه يسمى الانحدار الخطي البسيط.

من ناحية أخرى ، إذا كانت البيانات تحتوي على متغيرات مستقلة متعددة ، فإن الانحدار يصبح انحدارًا خطيًا متعددًا. الشكل الرياضي للانحدار الخطي هو ببساطة شكل الخط المستقيم ، كما هو موضح أدناه.
ص = أ 0 + أ 1 س + ج
هنا ، y هو المتغير التابع ، a0 و a1 هو المعامل الذي تم تكليف هذه الخوارزمية بإيجاده ، x هو المتغير التابع ، و c هي قيمة التقاطع لهذا الخط المستقيم.
الانحدار اللوجستي
لا داعي للقول إن الانحدار اللوجستي هو أحد خوارزميات التعلم الآلي الأكثر وضوحًا لكنها قوية جدًا في التصنيف تحت مظلة خوارزمية تعلم خاضعة للإشراف. يمكن استخدام هذه الخوارزمية لمشاكل الانحدار ، ولكنها تستخدم في الغالب لحل مشاكل التصنيف بدلاً من ذلك. دائمًا ما يكون الناتج الذي نحصل عليه من هذه الخوارزمية بين 0 و 1 ، مما يجعل من السهل تصنيف الحالات إلى فئات باستخدام قيمة تصنيف العتبة.

كلمة لوجستية في الاسم تشير إلى وظيفة التنشيط ، والتي تستخدم في هذا الانحدار. وظيفة التنشيط أو الوظيفة اللوجستية ، في هذه الحالة ، ليست في الواقع سوى وظيفة السيني. إنها خاصية هذه الدالة السينية ، والتي تحافظ على قيمة الانحدار اللوجستي دائمًا بين صفر وواحد. تبدو الدالة السينية كما يلي:
هنا ، y هو الناتج من خلال الدالة السينية ، و x هو المتغير المستقل. في حالة الانحدار اللوجستي ، سيكون المتغير x هو في الواقع معادلة الانحدار الخطي بأكملها. ومن ثم يمكن تطوير معادلة الانحدار اللوجستي ، وهي مكتوبة أدناه:

هنا ، يشبه معنى المتغيرات المعنى الموجود في الانحدار اللوجستي ، و x هو المتغير المستقل ، و y هو المتغير التابع ، و b0 ، و b1 ، و b2 ، وما إلى ذلك ، هي المعامل الذي تحدده هذه الخوارزمية.
الفرق بين الانحدار الخطي واللوجستي
المدرجة أدناه ، ستجد مقارنة شاملة للانحدار الخطي مقابل الانحدار اللوجستي جنبًا إلى جنب:
الانحدارالخطي | الانحدار اللوجستي |
يتطلب بيانات مُصنَّفة جيدًا مما يعني أنه يحتاج إلى الإشراف ، ويتم استخدامه للانحدار. وبالتالي ، فإن الانحدار الخطي هو خوارزمية انحدار خاضعة للإشراف. | كما يتطلب أيضًا تسمية البيانات التي يتم إدخالها فيه بشكل جيد. ومع ذلك ، يتم استخدام هذه الخوارزمية للتصنيف بدلاً من الانحدار. لذا فإن الانحدار اللوجستي هو خوارزمية تصنيف خاضعة للإشراف. |
عادة ما يكون التنبؤ المكتسب من خلال خوارزمية الانحدار الخطي قيمة يمكن أن تكون في نطاق اللانهاية السالبة إلى اللانهاية الموجبة. | إن التنبؤ الذي يتم الحصول عليه من خلال الانحدار اللوجستي يقع في الواقع في نطاق من صفر إلى واحد فقط. تسمح هذه الميزة بتصنيف سهل بمساعدة قيمة عتبة. |
لا يتطلب الانحدار الخطي أي وظيفة التنشيط. | نحن هنا بحاجة إلى وظيفة التنشيط. في هذه الحالة ، هذه الوظيفة هي الدالة السينية. |
لا توجد قيمة حدية في الانحدار الخطي. | في الانحدار اللوجستي ، هناك حاجة إلى قيمة عتبة لتحديد فئات كل حالة بشكل صحيح. |
يجب أن يكون المتغير التابع في حالة الانحدار الخطي مستمراً بطبيعته. بمعنى أننا لا نستطيع المرور في المتغير ، وهو قاطع ونتوقع قيمة مستمرة في التنبؤ. | يجب أن يكون المتغير التابع في حالة الانحدار اللوجستي قاطعًا. بمعنى أنه يجب أن يحتوي على فئات مختلفة (لا تزيد عن فئتين). |
الهدف من هذه الخوارزمية هو العثور على الخط الأنسب من خلال نقاط بيانات التدريب. وبالتالي ، يجب أن يلمس الخط المستقيم الناتج ، الذي نرسمه ، جميع نقاط التدريب تقريبًا إذا لم يكن الملاءمة منتهية ولا تحت. | إذا قمنا بإجراء أي تغييرات على معامل منحنى الانحدار اللوجستي ، فإن مخططه بالكامل سيغير شكله. |
للتنبؤ بالقيم ، تقوم خوارزمية الانحدار الخطي بافتراض أساسي. يفترض أن القيم التي يتم تمريرها في هذه الخوارزمية تتبع التوزيع الطبيعي القياسي أو يتم توزيعها وفقًا للتوزيع الغاوسي. | تقوم خوارزمية الانحدار اللوجستي أيضًا بافتراض توزيع البيانات التي يتم تمريرها إلى الدالة السينية. يفترض أن البيانات تتبع التوزيع ذي الحدين. |
تريد معرفة المزيد؟
إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.
ما هي سلبيات استخدام الانحدار اللوجستي؟
يتوقع نموذج الانحدار اللوجستي متغير بيانات تابع من خلال فحص الاتصال بين واحد أو أكثر من المتغيرات المستقلة الموجودة مسبقًا. الانحدار اللوجستي ، الذي يشيع استخدامه في مهام التصنيف ، له مزايا عديدة ، ولكن له أيضًا بعض العيوب. عند العمل مع مجموعات البيانات عالية الأبعاد ، قد يحدث فرط في النموذج ، مما يؤدي إلى استنتاجات غير دقيقة. نظرًا لأن إعداد البيانات هو إجراء يستغرق وقتًا طويلاً عند استخدام الانحدار اللوجستي ، فإن صيانة البيانات تصبح صعبة أيضًا. تتمثل إحدى العوائق الرئيسية للانحدار اللوجستي في أنه لا يمكنه التعامل مع المشكلات غير الخطية.
ما المقصود بالانحدار اللوجستي متعدد الحدود؟
الانحدار اللوجستي متعدد الحدود هو امتداد انحدار لوجستي ثنائي يمكنه التعامل مع أكثر من متغيرين تابعين أو متغيرين للنتائج. إنه مشابه للانحدار اللوجستي ، باستثناء أن هناك العديد من النتائج المحتملة بدلاً من واحدة فقط. إنه نهج تعلم آلي تقليدي خاضع للإشراف مع إمكانات تصنيف متعددة الفئات. يشتمل النموذج اللوجستي متعدد الحدود على افتراضات مختلفة ، أحدها أنه يُعتقد أن البيانات خاصة بكل حالة ، مما يعني أن كل متغير مستقل له قيمة واحدة لكل حالة. يفترض النموذج اللوجستي متعدد الحدود أيضًا أنه في أي سيناريو معين ، لا يمكن التنبؤ بالمتغير التابع بدقة من المتغيرات المستقلة.
كيف يمكن استخدام الانحدار الخطي لحل مشاكل الحياة الواقعية؟
يستخدم الانحدار الخطي على نطاق واسع في مجموعة متنوعة من مواقف وقطاعات العالم الحقيقي. تستخدم الشركات عادةً الانحدار الخطي لفهم العلاقة بين الإعلان والإنفاق والربح. كثيرًا ما يستخدم الباحثون الطبيون الانحدار الخطي لفحص الارتباط بين جرعة الدواء وضغط دم المريض. كثيرًا ما يستخدم علماء الزراعة الانحدار الخطي لتقييم تأثير الأسمدة والمياه على غلات المحاصيل. وبالتالي ، تتنوع استخدامات الانحدار الخطي في حل مشاكل الحياة الواقعية.