أسئلة وأجوبة مقابلة الانحدار اللوجستي [للمستجدين وذوي الخبرة]

نشرت: 2020-09-24

عندما يتعلق الأمر بالتعلم الآلي ، وبالتحديد التصنيف ، ربما يكون الانحدار اللوجستي هو الخوارزمية الأكثر مباشرة والأكثر استخدامًا. نظرًا لأن الانحدار اللوجستي سهل الفهم والتنفيذ ، فإن هذه الخوارزمية مثالية للمبتدئين والأشخاص الذين بدأوا للتو تعلم الآلة أو رحلة علم البيانات.

على الرغم من أن اسم الانحدار اللوجستي قد يبدو مثل الخوارزمية التي قد يستخدمها المرء لتنفيذ الانحدار ، إلا أن الحقيقة بعيدة كل البعد عن ذلك. يعد الانحدار اللوجستي ، بسبب فروقه الدقيقة ، أكثر ملاءمة لتصنيف الحالات إلى فئات محددة جيدًا أكثر من أداء مهام الانحدار في الواقع.

باختصار ، تأخذ هذه الخوارزمية ناتج الانحدار الخطي وتطبق وظيفة التنشيط قبل إعطائنا النتيجة. وظيفة التنشيط التي يستخدمها الانحدار اللوجستي هي الوظيفة السينية (المعروفة أيضًا باسم الوظيفة اللوجستية). التمسك بخصائص الدالة السينية ، بدلاً من توفير قيم متصلة ، يعطي فقط رقمًا في نطاق صفر وواحد. بعد تحديد قيمة العتبة ، يصبح التصنيف من ناتج الانحدار اللوجستي نسيمًا.

نعلم جميعًا كيف يتطور مجال علم البيانات والتعلم الآلي. يتم إنشاء المزيد من الفرص يوميًا. لذلك ، في هذا العالم التنافسي ، فإن التأكد من أن لديك المعرفة الصحيحة هو المفتاح لضمان مكانة جيدة في شركة أحلامك. لمساعدتك في هذا المسعى الخاص بك ، قمنا بإعداد قائمة بأسئلة مقابلة الانحدار اللوجستي التي ينبغي أن تساعدك على الاستعداد للرحلة لتصبح عالم بيانات محترفًا أو محترفًا في التعلم الآلي.

جدول المحتويات

أسئلة وأجوبة مقابلة الانحدار اللوجستي

س 1. أجب باستخدام إما TRUE أو FALSE. هل الانحدار اللوجستي نوع من خوارزمية التعلم الآلي الخاضعة للإشراف؟

الجواب. نعم ، ستكون الإجابة على هذا السؤال صحيحة لأن الانحدار اللوجستي ، في الواقع ، عبارة عن خوارزمية تعلم آلي خاضعة للإشراف. السبب البسيط يكمن في طريقة عمل هذه الخوارزمية. للحصول على ناتج من الانحدار اللوجستي ، سيتعين عليك إطعامه بالبيانات أولاً.

سيتعين عليك تقديم المثيلات والتسمية الصحيحة لهذه الحالات حتى تتمكن من التعلم منها وإجراء تنبؤات دقيقة. ستحتاج خوارزمية التعلم الآلي الخاضعة للإشراف إلى متغير مستهدف (Y) وحالات الفصل أو المتغير المستخدم لتوفير معلومات الإدخال (X) لتتمكن من التدريب وإجراء التنبؤات بنجاح.

س 2. أجب باستخدام إما TRUE أو FALSE. هل الانحدار اللوجستي يستخدم بشكل رئيسي في التصنيف؟

الجواب. نعم ، الإجابة على هذا السؤال صحيحة. في الواقع ، يستخدم الانحدار اللوجستي بشكل أساسي لمهام التصنيف بدلاً من أداء الانحدار الفعلي. نستخدم الانحدار الخطي للانحدار. بسبب التشابه بين الاثنين ، من السهل الخلط. لا تفعل هذا الخطا. في الانحدار اللوجستي ، نستخدم الوظيفة اللوجيستية ، وهي ليست سوى وظيفة تنشيط السيني ، مما يجعل مهام التصنيف أكثر راحة.

س 3. أجب عن هذا السؤال باستخدام TRUE أو FALSE. هل يمكن تنفيذ شبكة عصبية تحاكي سلوك خوارزمية الانحدار اللوجستي؟

الجواب. نعم ، ستكون الإجابة صحيحة. تُعرف الشبكات العصبية أيضًا باسم المقربين العامين. يمكن استخدامها لتقليد أي خوارزمية للتعلم الآلي تقريبًا. لوضع الأشياء في منظورها الصحيح ، إذا كنت تستخدم Keras API لـ TensorFlow 2.0 ، فكل ما عليك فعله هو إضافة طبقة واحدة إلى النموذج المتسلسل وجعل هذه الطبقة بوظيفة التنشيط السيني.

س 4. أجب عن هذا السؤال باستخدام إما TRUE أو FALSE. هل يمكننا استخدام الانحدار اللوجستي لحل مشكلة التصنيف متعدد الفئات؟

الجواب. ستكون الإجابة المختصرة صحيحة. ومع ذلك ، فإن الإجابة الطويلة تجعلك تفكر قليلاً. لا توجد طريقة يمكنك من خلالها تنفيذ تصنيف متعدد الفئات بمجرد استخدام نموذج انحدار لوجستي واحد. ستحتاج إما إلى استخدام شبكة عصبية بوظيفة تنشيط softmax أو استخدام خوارزمية معقدة للتعلم الآلي للتنبؤ بالعديد من فئات متغير الإدخال بنجاح.

ومع ذلك ، هناك طريقة واحدة يمكنك من خلالها استخدام الانحدار اللوجستي لحل مشكلة التصنيف متعدد الفئات. سيكون ذلك باستخدام نهج واحد مقابل الكل. سوف تحتاج إلى تدريب n المصنفات (حيث n هو عدد الفصول) ، كل واحد منهم يتوقع فئة واحدة فقط. لذلك ، في حالة التصنيف من ثلاث فئات (دعنا نقول A و B و C) ، ستحتاج إلى تدريب مصنفين أحدهما للتنبؤ A وليس A ، والآخر للتنبؤ B وليس B ، والمصنف النهائي توقع C وليس C. ثم سيتعين عليك أخذ مخرجات كل هذه النماذج الثلاثة ودمجها معًا لتكون قادرًا على القيام بتصنيف متعدد الفئات باستخدام لا شيء سوى الانحدار اللوجستي.

س 5. اختر أحد الخيارات من القائمة أدناه. ما هي الطريقة الأساسية المستخدمة لملاءمة بيانات التدريب في خوارزمية الانحدار اللوجستي؟

  1. مسافة الجاكار
  2. أقصى احتمال
  3. خطأ المربع الأقل
  4. لا شيء من الخيارات المذكورة أعلاه.

الجواب. الإجابة هي (ب) من السهل تحديد الخيار (ج) وهو خطأ المربع الصغرى لأن هذه هي نفس الطريقة المستخدمة في الانحدار الخطي. ومع ذلك ، في الانحدار اللوجستي ، لا نستخدم تقريب المربعات الصغرى لملاءمة مثيلات التدريب في النموذج ؛ نستخدم الحد الأقصى للاحتمالية بدلاً من ذلك.

الخروج: أفكار مشروع التعلم الآلي

س 6. اختر أحد الخيارات من القائمة أدناه. ما هو المقياس الذي لن نتمكن من استخدامه لقياس صحة نموذج الانحدار اللوجستي؟

  1. المنطقة الواقعة تحت منحنى خصائص تشغيل جهاز الاستقبال (أو درجة AUC-ROC)
  2. سجل الخسارة
  3. متوسط ​​الخطأ التربيعي (أو MSE)
  4. صحة

الجواب. الخيار الصحيح الذي يجب أن تختاره هو C ، أي يعني خطأ مربع ، أو MSE. نظرًا لأن خوارزمية الانحدار اللوجستي هي في الواقع خوارزمية تصنيف وليست خوارزمية انحدار أساسية ، فلا يمكننا استخدام خطأ مربع القياس لتحديد أداء نموذج الانحدار اللوجستي الذي كتبناه. السبب الرئيسي هو بسبب المخرجات التي نتلقاها من النموذج وعدم القدرة على تعيين قيمة رقمية ذات مغزى لمثيل فئة.

س 7. اختر أحد الخيارات من القائمة أدناه. صادف أن AIC مقياس ممتاز للحكم على أداء نموذج الانحدار اللوجستي. تشبه AIC طريقة R-squared المستخدمة لتحديد أداء خوارزمية الانحدار الخطي. ما هو صحيح بالفعل حول هذا AIC؟

  1. يفضل بشكل عام النموذج ذو الدرجة المنخفضة من AIC.
  2. يُفضل النموذج الذي يحتوي على درجة عالية من AIC في الواقع.
  3. يعتمد اختيار النموذج فقط من أساس درجة AIC بشكل كبير على الموقف.
  4. لا شيء من الخيارات المذكورة أعلاه.

الجواب. يُفضل النموذج الذي يحتوي على أقل قيمة لـ AIC. لذا ، فإن إجابة السؤال ستكون الخيار (أ). السبب الرئيسي لاختيارنا النموذج بأقل قيمة ممكنة لـ AIC هو أن العقوبة ، التي تمت إضافتها لتنظيم أداء النموذج ، لا تشجع في الواقع الملاءمة يتخطى. نعم ، معيار معلومات AIC أو Akaike هو ذلك المقياس الذي كلما انخفضت القيمة ، كان الملاءمة أفضل.

من الناحية العملية ، نفضل النماذج التي ليست تحت التجهيز (مما يعني أنه لا يمكن التعميم جيدًا لأن النموذج الذي اخترناه ليس معقدًا بما يكفي للعثور على التعقيدات الموجودة في البيانات) ولا زيادة في التجهيز (بمعنى أن النموذج مناسب تمامًا للتدريب البيانات وفقدت القدرة على عمل تنبؤات أكثر عمومية). لذلك ، نختار درجة منخفضة بشكل معقول لتجنب كل من التحسين والإفراط في التجهيز.

س 8. أجب باستخدام إما TRUE أو FALSE. هل نحتاج إلى توحيد القيم الموجودة في أعمدة الميزات قبل أن نقوم بتغذية البيانات في نموذج الانحدار اللوجستي التدريبي؟

الجواب. لا ، لا نحتاج إلى توحيد القيم الموجودة في فضاء الميزة ، والتي يتعين علينا استخدامها لتدريب نموذج الانحدار اللوجستي. لذا ، فإن الإجابة على هذا السؤال ستكون خاطئة. نختار توحيد جميع قيمنا لمساعدة الوظيفة (عادةً نزول التدرج) ، وهي المسؤولة عن جعل الخوارزمية تتقارب على قيمة. نظرًا لأن هذه الخوارزمية بسيطة نسبيًا ، فهي لا تحتاج إلى قياس المبالغ حتى يكون لها في الواقع فرق كبير في أدائها.

تعلم: شرح أفضل 5 نماذج للتعلم الآلي للمبتدئين

س 9. اختر أحد الخيارات من القائمة أدناه. ما هي التقنية التي نستخدمها لأداء مهمة الاختيار المتغير؟

  1. انحدار ريدج
  2. انحدار اللاسو
  3. لا شيء من الخيارات المذكورة
  4. كلا من LASSO و Ridge Regression

الجواب. الجواب على هذا السؤال هو انحدار B. LASSO. السبب بسيط ، عقوبة l2 ، التي يتم تكبدها في دالة الانحدار LASSO ، لديها القدرة على جعل معامل بعض الميزات صفرًا. بما أن المعامل هو صفر ، فهذا يعني أنه لن يكون لها أي تأثير في النتيجة النهائية للدالة. هذا يعني أن هذه المتغيرات ليست بنفس الأهمية التي اعتقدناها ، وبهذه الطريقة ، بمساعدة انحدار LASSO ، يمكننا إجراء اختيار متغير.

س 10. اختر أحد الخيارات من القائمة أدناه. افترض أن لديك عملة عادلة في حوزتك بهدف اكتشاف احتمالات الحصول على الوجه. ماذا ستكون احتمالاتك المحسوبة؟

  1. هل احتمالات الحصول على الرأس هي 0
  2. هل احتمالات الحصول على رأس هو 1
  3. هل احتمالات الحصول على رأس هو 0.5
  4. لا شيء من الخيارات المذكورة أعلاه.

الجواب. للإجابة على هذا السؤال بنجاح ، ستحتاج إلى فهم معنى وتعريف الاحتمالات. يتم تعريف الاحتمالات في الواقع على أنها نسبة احتمالين - احتمال حدوث احتمال عدم حدوث أي حدث معين. في حالة أي عملة معدنية ، وهذا أمر عادل ، فإن احتمالية الرأس واحتمال عدم الوجود هي نفسها. لذا ، فإن احتمالات الحصول على الرؤوس واحدة.

س 11. اختر الإجابة الصحيحة من الخيارات أدناه. يتم تعريف وظيفة السجل على أنها سجل وظيفة الاحتمالات. ما رأيك في نطاق وظيفة السجل هذه في مجال [0،1]؟

  1. (- اللانهاية ، + اللانهاية)
  2. (0 ، + ما لا نهاية)
  3. (- اللانهاية، 0)
  4. (0 ، 1)

الجواب. تأخذ دالة الاحتمال القيمة التي يتم تمريرها معها وتحولها إلى احتمال. بمعنى أن نطاق أي دالة مثبت بين صفر وواحد. ومع ذلك ، فإن دالة الاحتمالات تفعل شيئًا واحدًا وهي تأخذ القيمة من دالة الاحتمال وتجعل النطاق من صفر إلى ما لا نهاية.

لذلك ، سيكون الإدخال الفعال لوظيفة السجل من صفر إلى ما لا نهاية. نحن نعلم أن نطاق دالة السجل في هذا المجال هو خط الأعداد الحقيقي بأكمله أو ما لا نهاية سالب إلى ما لا نهاية موجب. إذن ، إجابة هذا السؤال هي الخيار أ.

س 12. اختر الخيار الذي تعتقد أنه صحيح من القائمة أدناه:

  1. يجب أن تتبع قيم الخطأ في حالة الانحدار الخطي التوزيع الطبيعي ، ولكن في حالة الانحدار اللوجستي ، لا يجب أن تتبع القيم التوزيع الطبيعي القياسي.
  2. يجب أن تتبع قيم الخطأ في حالة الانحدار اللوجستي التوزيع الطبيعي ، ولكن في حالة الانحدار الخطي ، لا يجب أن تتبع القيم التوزيع الطبيعي القياسي.
  3. يجب أن تتبع قيم الخطأ في حالة كل من الانحدار الخطي والانحدار اللوجستي التوزيع الطبيعي.
  4. لا يجب أن تتبع قيم الخطأ في حالة كل من الانحدار الخطي والانحدار اللوجستي التوزيع الطبيعي.

الجواب. البيان الوحيد الصادق في مجموعة هذه العبارات هو البيان الأول. إذن ، تصبح إجابة السؤال هي الخيار (أ).

س 13. اختر الخيار الصحيح (S) من قائمة الخيارات أدناه. لذلك ، دعنا نقول أنك طبقت نموذج الانحدار اللوجستي في أي بيانات معينة. نتائج الدقة التي حصلت عليها هي X لمجموعة التدريب و Y لمجموعة الاختبار. الآن ، تريد إضافة المزيد من نقاط البيانات إلى نموذجك. إذن ، ما الذي يجب أن يحدث ، حسب رأيك؟

  1. يجب زيادة الدقة X ، التي حصلنا عليها في بيانات التدريب.
  2. يجب أن تنخفض الدقة X ، التي حصلنا عليها من بيانات التدريب.
  3. يجب أن تنخفض الدقة Y ، التي حصلنا عليها من بيانات الاختبار.
  4. يجب أن تزيد الدقة Y ، التي حصلنا عليها من بيانات الاختبار ، أو تظل كما هي.

الجواب. تعتمد دقة التدريب بشكل كبير على ملاءمة النموذج للبيانات التي شاهدها وتعلمها بالفعل. لذلك ، لنفترض أننا قمنا بزيادة عدد الميزات التي يتم إدخالها في النموذج ، فإن دقة التدريب X تزداد. في هذه الحالة ، ستنمو دقة التدريب لأن النموذج يجب أن يصبح أكثر تعقيدًا لملاءمة البيانات مع عدد متزايد من الميزات بشكل صحيح.

في حين أن دقة الاختبار ستزداد فقط إذا كانت الميزة التي تمت إضافتها إلى النموذج ميزة ممتازة وهامة وإلا ستظل دقة النموذج أثناء الاختبار كما هي. لذا ، فإن إجابة هذا السؤال ستكون كلا الخيارين (أ) و (د).

س 14. اختر الخيار الصحيح من الخيار التالي فيما يتعلق بأسلوب واحد مقابل الكل من حيث الانحدار اللوجستي.

  1. سنحتاج إلى إجمالي عدد n من النماذج للتصنيف بين عدد n من الفئات بشكل صحيح.
  2. سنحتاج إلى عدد n-1 من النماذج للتصنيف بين عدد n من الفئات.
  3. سنحتاج إلى نموذج واحد فقط للتصنيف بين عدد n من الفئات بنجاح.
  4. لا شيء من الخيارات المذكورة أعلاه.

الجواب. للتصنيف بين n فئات مختلفة ، سنحتاج إلى نماذج n في نهج واحد مقابل الكل.

س 15. انظر إلى الرسم البياني أدناه وأجب عن السؤال باختيار خيار واحد من الخيارات المدرجة أدناه. كم عدد الحدود الدنيا المحلية التي تراها في الرسم البياني؟

  1. يوجد حد أدنى محلي واحد فقط في الرسم البياني.
  2. هناك نوعان من الحدود الدنيا المحلية في هذا الرسم البياني.
  3. هناك ثلاثة حدود دنيا محلية في هذا الرسم البياني.
  4. يوجد أربعة أرقام دنيا محلية في هذا الرسم البياني.

الجواب. نظرًا لأن ميل الرسم البياني يصبح صفرًا عند أربع نقاط مميزة (حيث يكون الرسم البياني على شكل حرف U) ، فمن الآمن القول أنه سيحتوي على أربع نقاط دنيا محلية بحيث تكون الإجابة هي D.

اقرأ أيضًا: الانحدار الخطي مقابل الانحدار الخطي. الانحدار اللوجستي

ماذا بعد؟

إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.

هل من الصعب تعلم الانحدار اللوجستي؟

عندما يتعلق الأمر بعلم البيانات ، يتم استخدام كل من الانحدار اللوجستي والخطي على نطاق واسع لحل أنواع مختلفة من المشكلات الحسابية. وللعمل بكفاءة في مجال علم البيانات ، يجب أن تفهم هذين النوعين من نماذج الانحدار وأن تكون مرتاحًا لهما. قد تخمن من الاسم أن الانحدار اللوجستي يستخدم نموذجًا أكثر تقدمًا من المعادلات. لذلك يعد التعلم أكثر صعوبة مقارنةً بالانحدار الخطي. ومع ذلك ، إذا كان لديك فهم أساسي لكيفية عمل الرياضيات ، فيمكنك البناء عليها لإنشاء حزم في برمجة R أو Python.

ما هي أهمية الانحدار اللوجستي في علم البيانات؟

لكي تصبح عالم بيانات ناجحًا ، من الضروري فهم مسار الحصول على البيانات ومعالجتها ، وفهم البيانات وبناء نموذج ، وتقييم النتائج ، ونشرها. والانحدار اللوجستي لا يقدر بثمن لفهم مفهوم خط الأنابيب بأكمله. عندما تفهم الانحدار اللوجستي ، فإنك تطور تلقائيًا فهمًا أفضل لمفاهيم التعلم الآلي. علاوة على ذلك ، في بعض الأحيان يمكنك بسهولة حل المشكلات المعقدة للغاية باستخدام الانحدار اللوجستي فقط ، خاصةً بالنسبة للمسائل غير الخطية. يعد الانحدار اللوجستي أداة إحصائية حيوية ، والإحصاءات جزء لا يتجزأ من التعلم الآلي. وإذا كنت ترغب في دراسة الشبكات العصبية ، فإن معرفة الانحدار اللوجستي سيوفر لك بداية ممتازة.

هل الانحدار اللوجستي مفيد بالفعل؟

على الرغم من اسمه ، فإن الانحدار اللوجستي هو إطار تصنيف ، في الواقع ، أكثر من انحدار. يقدم طريقة أو خوارزمية أكثر كفاءة وبساطة يمكن استخدامها لحل مشاكل التصنيف الثنائي في التعلم الآلي. يمكنك إدراك ذلك بسهولة وتحقيق أداء ممتاز للفئات التي يمكن فصلها خطيًا. ومع ذلك ، عندما يكون هناك العديد من حدود القرار غير الخطية ، فإن الانحدار اللوجستي يميل إلى الأداء الضعيف. في بعض الحالات ، يُقال إن الخوارزميات الأكثر إحكاما مثل الشبكات العصبية أكثر كفاءة وقوة.