أسئلة وأجوبة مقابلة شجرة القرار [للمبتدئين وذوي الخبرة]

نشرت: 2020-09-22

في عالم التعلم الآلي ، تكون أشجار القرار من خلال خوارزمية واحدة منها ، إن لم تكن الأكثر احترامًا. أشجار القرار قوية أيضًا. تُستخدم أشجار القرار للتنبؤ بالقيم المستمرة (الانحدار) أو التنبؤ بالفئات (إجراء التصنيف أو التصنيف) للحالات المقدمة للخوارزمية.

تشبه أشجار القرار مخطط انسيابي في هيكلها. تمثل عقدة أي شجرة قرارات اختبارًا تم إجراؤه على السمة. يمثل كل فرع من فروع شجرة القرار نتائج الفحص الذي تم إجراؤه على كل عقدة. تحمل عقدة كل ورقة (والتي تُعرف أيضًا باسم العقد الطرفية) تسمية الفئة.

كان هذا عن هيكل الشجرة. ومع ذلك ، فإن الزيادة الكبيرة في شعبية أشجار القرار لا ترجع إلى طريقة إنشائها. تمنحها شفافية الشجرة مكانة خاصة بها في العالم الذي تهيمن عليه خوارزميات قوية ومفيدة. يمكنك فعل كل شيء يدويًا للحصول على شجرة قرارات صغيرة ، ويمكنك التنبؤ بكيفية تشكيل شجرة القرار. بالنسبة للأشجار الأكبر حجمًا ، يصبح هذا التمرين مملاً للغاية.

ومع ذلك ، هذا لا يعني أنك لن تكون قادرًا على فهم ما تفعله الشجرة في كل عقدة. إن القدرة على فهم ما يحدث خلف الكواليس أو تحت غطاء محرك السيارة يميز بالفعل أشجار القرار مع أي خوارزمية أخرى للتعلم الآلي.

كما رأينا مدى أهمية أشجار القرار ، فمن الطبيعي أن تكون أشجار القرار مهمة أيضًا لأي متخصص في التعلم الآلي أو عالم بيانات. لمساعدتك على فهم هذا المفهوم وفي نفس الوقت لمساعدتك في الحصول على هذا الزخم الإضافي في أسلوب المقابلة ، قمنا بإعداد قائمة شاملة بأسئلة مقابلة شجرة القرار وأسئلة وأجوبة مقابلة شجرة القرار. يجب أن تساعدك هذه الأسئلة في الحصول على أي مقابلة. حاول حل كل من هذه الأسئلة أولاً قبل قراءة الحلول لتحقيق أقصى استفادة من هذه الأسئلة.

جدول المحتويات

أسئلة وأجوبة مقابلة شجرة القرار

س 1. سترى بيانين مدرجين أدناه. سيتعين عليك قراءة كلاهما بعناية ثم اختيار أحد الخيارين من خياري العبارتين. السؤال السياقي هو ، اختر العبارات الصحيحة حول تعبئة الأشجار.

لا تعتمد الأشجار الفردية على بعضها البعض على الإطلاق لشجرة التعبئة.
لتحسين الأداء العام للنموذج ، يتم أخذ المجموع من المتعلمين الضعفاء. تُعرف هذه الطريقة بتعبئة الأشجار.
العبارة رقم واحد فقط هي TRUE.
العبارة رقم اثنين فقط هي TRUE.
كلا العبارتين الأول والثاني صحيحان.
لا شيء من الخيارات المذكورة أعلاه.

الجواب. الإجابة الصحيحة على هذا السؤال هي C لأن كلا العبارتين صحيحتان بالنسبة لشجرة التعبئة. في تعبئة الأشجار أو تجميع التمهيد ، فإن الهدف الرئيسي لتطبيق هذه الخوارزمية هو تقليل مقدار التباين الموجود في شجرة القرار. تتمثل آلية إنشاء شجرة التعبئة في أنه مع الاستبدال ، يتم أخذ عدد من المجموعات الفرعية من العينة الموجودة لتدريب البيانات.

الآن ، يتم استخدام كل مجموعة من هذه المجموعات الفرعية الصغيرة من البيانات لتدريب شجرة قرار منفصلة. نظرًا لأن المعلومات التي يتم إدخالها في كل شجرة تبدو فريدة من نوعها ، فإن احتمال وجود أي شجرة لها أي تأثير على الأخرى يصبح منخفضًا للغاية. يتم جمع النتيجة النهائية التي تعطيها كل هذه الأشجار ثم معالجتها لتوفير المخرجات. وبالتالي ، فإن البيان الثاني يصبح صحيحًا أيضًا.

س 2. سترى بيانين مدرجين أدناه. سيتعين عليك قراءة كلاهما بعناية ثم اختيار أحد الخيارين من خياري العبارتين. السؤال السياقي هو ، اختر العبارات الصحيحة حول تعزيز الأشجار.

المتعلمون الضعفاء في شجرة التعزيز مستقلون عن بعضهم البعض.
يتم جمع أداء المتعلمين الضعفاء وتجميعه لتحسين الأداء العام للشجرة المعززة.
العبارة رقم واحد فقط هي TRUE.
العبارة رقم اثنين فقط هي TRUE.
كلا العبارتين الأول والثاني صحيحان.
لا شيء من الخيارات المذكورة أعلاه.

الجواب. إذا فهمت كيف يتم تعزيز الأشجار ، فستفهم وستكون قادرًا على التمييز بين العبارة الصحيحة والبيان الخاطئ. لذلك ، يتم إنشاء شجرة معززة عندما يتصل العديد من المتعلمين الضعفاء في سلسلة. كل شجرة موجودة في هذا التسلسل لها هدف واحد: تقليل الخطأ الذي ارتكبته سابقتها.

إذا كانت الأشجار متصلة بهذه الطريقة ، فلا يمكن أن تكون جميع الأشجار مستقلة عن بعضها البعض ، مما يجعل العبارة الأولى خاطئة. عند الوصول إلى العبارة الثانية ، يكون هذا صحيحًا بشكل أساسي لأنه ، في الشجرة المعززة ، هذه هي الطريقة التي يتم تطبيقها لتحسين الأداء العام للنموذج. سيكون الخيار الصحيح هو B ، أي أن العبارة رقم اثنين فقط هي TRUE ، والبيان رقم واحد هو FALSE.

س 3. سترى أربعة بيانات مدرجة أدناه. سيتعين عليك قراءتها جميعًا بعناية ثم اختيار أحد الخيارات من الخيارات التي تلي العبارات الأربعة. السؤال السياقي هو ، اختر العبارات الصحيحة حول غابات Radom وطريقة مجموعة تعزيز التدرج.

يمكن استخدام كل من طرق مجموعات تعزيز التدرج والغابة العشوائية لإجراء التصنيف.
يمكن استخدام الغابات العشوائية لأداء مهام التصنيف ، في حين أن طريقة تعزيز التدرج يمكن أن تؤدي فقط الانحدار.
يمكن استخدام تعزيز التدرج لأداء مهام التصنيف ، في حين أن طريقة Random Forest يمكن أن تؤدي فقط الانحدار.
يمكن استخدام كل من أساليب مجموعة تعزيز الغابة العشوائية والتدرج لأداء الانحدار.
العبارة رقم واحد فقط هي TRUE.
العبارة رقم اثنين فقط هي TRUE.
كلا العبارتين الأول والثاني صحيحان.
العبارة رقم ثلاثة فقط هي TRUE
العبارة رقم أربعة فقط هي TRUE
العبارة رقم واحد وأربعة فقط هي TRUE

الجواب. الجواب على هذا السؤال مباشر. كلتا طريقتين المجموعة في الواقع قادرة جدًا على القيام بمهام التصنيف والانحدار. لذا ، فإن الإجابة على هذا السؤال ستكون F لأن العبارتين رقم واحد وأربعة فقط هي TRUE.

س 4 سترى أربع بيانات مدرجة أدناه. سيتعين عليك قراءتها جميعًا بعناية ثم اختيار أحد الخيارات من الخيارات التي تلي العبارات الأربعة. السؤال السياقي هو ، ضع في اعتبارك غابة عشوائية من الأشجار. إذن ما الذي سيكون صحيحًا بشأن كل شجرة أو أي من الأشجار في الغابة العشوائية؟

تعتمد كل شجرة تشكل الغابة العشوائية على مجموعة فرعية من جميع الميزات.
كل من الغابة العشوائية مبنية على جميع الميزات.
تم بناء كل شجرة في غابة عشوائية على مجموعة فرعية من جميع الملاحظات الموجودة.
كل شجرة في الغابة العشوائية مبنية على مجموعة المراقبة الكاملة.
العبارة رقم واحد فقط هي TRUE.
العبارة رقم اثنين فقط هي TRUE.
كلا العبارتين الأول والثاني صحيحان.
العبارة رقم ثلاثة فقط هي TRUE
العبارة رقم أربعة فقط هي TRUE
كلتا العبارتين رقم واحد وأربعة صحيحة
كلا العبارتين رقم واحد وثلاثة صحيحة
كلا العبارتين رقم اثنين وثلاثة صحيحة
كلا العبارتين رقم اثنين وأربعة صحيحة

الجواب. يعتمد توليد الغابات العشوائية على مفهوم التعبئة. لإنشاء غابة عشوائية ، يتم أخذ مجموعة فرعية صغيرة من الملاحظات والميزات. القيم التي يتم الحصول عليها بعد إخراج المجموعات الفرعية يتم إدخالها بعد ذلك في أشجار القرار الفردي. ثم يتم جمع كل القيم من جميع أشجار القرار هذه لاتخاذ القرار النهائي. هذا يعني أن العبارات الوحيدة الصحيحة ستكون واحدة وثلاثة. لذلك ، سيكون الخيار الصحيح هو G.

س 5 سترى أربع بيانات مدرجة أدناه. سيتعين عليك قراءتها جميعًا بعناية ثم اختيار أحد الخيارات من الخيارات التي تلي العبارات الأربعة. السؤال السياقي هو ، حدد العبارات الصحيحة حول المعلمة الفائقة المعروفة باسم "max_depth" لخوارزمية تعزيز التدرج.

من الأفضل اختيار قيمة أقل للمعلمة التشعبية هذه إذا كانت دقة مجموعة التحقق من الصحة مماثلة.
من الأفضل اختيار قيمة أعلى للمعلمة التشعبية هذه إذا كانت دقة مجموعة التحقق من الصحة مماثلة.
إذا أردنا زيادة قيمة هذا المعامل الفائق ، فإن فرص هذا النموذج في زيادة ملاءمة البيانات.
إذا أردنا زيادة قيمة هذا المعامل الفائق ، فإن فرص هذا النموذج في عدم ملاءمة البيانات بالفعل تزداد.
العبارة رقم واحد فقط هي TRUE.
العبارة رقم اثنين فقط هي TRUE.
كلا العبارتين الأول والثاني صحيحان.
العبارة رقم ثلاثة فقط هي TRUE
العبارة رقم أربعة فقط هي TRUE
كلتا العبارتين رقم واحد وأربعة صحيحة
كلا العبارتين رقم واحد وثلاثة صحيحة
كلا العبارتين رقم اثنين وثلاثة صحيحة
كلا العبارتين رقم اثنين وأربعة صحيحة

الجواب. يتحكم أقصى عمق للمعلمة الفائقة في العمق حتى يقوم تعزيز التدرج بنمذجة البيانات المقدمة أمامه. إذا واصلت زيادة قيمة هذا المعامل الفائق ، فإن النموذج لا بد أن يكون أكثر من اللازم. إذن ، العبارة رقم ثلاثة صحيحة. إذا كانت لدينا نفس الدرجات في بيانات التحقق من الصحة ، فإننا نفضل عمومًا النموذج ذي العمق الأقل. إذن ، العبارتان رقم واحد وثلاثة صحيحة ، وبالتالي فإن الإجابة على أسئلة مقابلة شجرة القرار هذه هي g.

س 6. سترى أربعة بيانات مدرجة أدناه. سيتعين عليك قراءتها جميعًا بعناية ثم اختيار أحد الخيارات من الخيارات التي تلي العبارات الأربعة. السؤال السياقي هو أي من الطرق التالية ليس لها معدل تعلم كواحد من معلماتها الفائقة القابلة للضبط.

أشجار إضافية.
AdaBoost
غابة عشوائية
تعزيز التدرج.
العبارة رقم واحد فقط هي TRUE.
العبارة رقم اثنين فقط هي TRUE.
كلا العبارتين الأول والثاني صحيحان.
العبارة رقم ثلاثة فقط هي TRUE
العبارة رقم أربعة فقط هي TRUE
كلتا العبارتين رقم واحد وأربعة صحيحة
كلا العبارتين رقم واحد وثلاثة صحيحة
كلا العبارتين رقم اثنين وثلاثة صحيحة
كلا العبارتين رقم اثنين وأربعة صحيحة

الجواب. فقط الأشجار الإضافية والغابات العشوائية ليس لديها معدل تعلم كواحد من معلماتها الفائقة القابلة للضبط. إذن ، ستكون الإجابة هي g لأن العبارة رقم واحد وثلاثة هي TRUE.

س 7. اختر الخيار ، وهذا صحيح.

فقط في خوارزمية الغابة العشوائية ، يمكن معالجة القيم الحقيقية بجعلها منفصلة.
فقط في خوارزمية تعزيز التدرج ، يمكن التعامل مع القيم الحقيقية بجعلها منفصلة.
في كل من الغابة العشوائية وتعزيز التدرج ، يمكن التعامل مع القيم الحقيقية بجعلها منفصلة.
لا شيء من الخيارات المذكورة أعلاه.

الجواب. كل من الخوارزميات قادرة على ذلك. يمكن لكليهما التعامل بسهولة مع الميزات التي لها قيم حقيقية فيها. لذا ، فإن الإجابة على أسئلة وأجوبة مقابلة شجرة القرار هذه هي C.

س 8. اختر خيارًا واحدًا من القائمة أدناه. السؤال هو ، اختر الخوارزمية التي ليست خوارزمية تعلم المجموعة.

تعزيز التدرج
AdaBoost
أشجار إضافية
غابة عشوائية
أشجار القرار

الجواب. هذا السؤال مباشر. واحدة فقط من هذه الخوارزميات ليست خوارزمية تعلم المجموعة. هناك قاعدة واحدة يجب وضعها في الاعتبار وهي أن أي طريقة تعلم جماعية ستشمل استخدام أكثر من شجرة قرار واحدة. نظرًا لأنه في الخيار هـ ، توجد فقط شجرة قرار فردية ، فهذه ليست خوارزمية تعلم جماعية. لذا ، فإن الإجابة على هذا السؤال ستكون E (أشجار القرار).

س 9. سترى بيانين مدرجين أدناه. سيتعين عليك قراءة كلاهما بعناية ثم اختيار أحد الخيارين من خياري العبارتين. السؤال السياقي هو ، أي مما يلي سيكون صحيحًا في نموذج التعلم الجماعي.

يجب أن يكون عدد الأشجار في المجموعة على أعلى مستوى ممكن.
ستظل قادرًا على تفسير ما يحدث حتى بعد تنفيذ خوارزمية Random Forest.
العبارة رقم واحد فقط هي TRUE.
العبارة رقم اثنين فقط هي TRUE.
كلا العبارتين الأول والثاني صحيحان.
لا شيء من الخيارات المذكورة أعلاه.

الجواب. نظرًا لأن أي طريقة لتعلم المجموعة تعتمد على اقتران عدد هائل من أشجار القرار (والتي تعتبر بحد ذاتها متعلمًا ضعيفًا جدًا) معًا ، لذلك سيكون من المفيد دائمًا أن يكون لديك عدد أكبر من الأشجار لإنشاء طريقة مجموعتك. ومع ذلك ، فإن خوارزمية الغابة العشوائية تشبه الصندوق الأسود. لن تعرف ما يحدث داخل النموذج. لذلك ، لا بد أن تفقد كل قابلية التفسير بعد تطبيق خوارزمية الغابة العشوائية. لذا ، فإن الإجابة الصحيحة على هذا السؤال ستكون "أ" لأن العبارة الصحيحة فقط هي العبارة رقم واحد.

س 10. الإجابة باللغة TRUE أو FALSE فقط. تعمل خوارزمية التعبئة بشكل أفضل مع الطرز ذات التباين العالي والمنخفض التحيز؟

الجواب. صحيح. التعبئة في الواقع هي الأكثر ملاءمة لاستخدامها للتباين العالي ونموذج التحيز المنخفض.

س 11. . سترى بيانين مدرجين أدناه. سيتعين عليك قراءة كلاهما بعناية ثم اختيار أحد الخيارين من خياري العبارتين. السؤال السياقي هو ، اختر الأفكار الصحيحة للأشجار المعززة للتدرج.

في كل مرحلة من مراحل التعزيز ، تقدم الخوارزمية شجرة أخرى لضمان تعويض جميع مشكلات النموذج الحالية.
يمكننا تطبيق خوارزمية نزول التدرج لتقليل وظيفة الخسارة.
العبارة رقم واحد فقط هي TRUE.
العبارة رقم اثنين فقط هي TRUE.
كلا العبارتين الأول والثاني صحيحان.
لا شيء من الخيارات المذكورة أعلاه.

الجواب. الإجابة على هذا السؤال هي C بمعنى أن كلا الخيارين صحيحان. بالنسبة للبيان الأول ، هذه هي الطريقة التي تعمل بها خوارزمية التعزيز. إن الأشجار الجديدة التي تم إدخالها في النموذج هي فقط لزيادة أداء الخوارزمية الحالية. نعم ، خوارزمية النسب المتدرج هي الوظيفة التي يتم تطبيقها لتقليل دالة الخسارة.

س 12. في خوارزمية تعزيز التدرج اللوني ، أي العبارات أدناه صحيحة بشأن معدل التعلم؟

يجب أن يكون معدل التعلم الذي تحدده أعلى ما يمكن.
يجب ألا يكون معدل التعلم الذي تحدده مرتفعًا قدر الإمكان بل يجب أن يكون منخفضًا قدر الإمكان.
يجب أن يكون معدل التعلم منخفضًا ولكن ليس منخفضًا جدًا.
يجب أن يكون معدل التعلم الذي تحدده مرتفعًا ولكن ليس مرتفعًا للغاية.

الجواب. يجب أن يكون معدل التعلم منخفضًا ، ولكن ليس منخفضًا جدًا ، لذا فإن الإجابة على أسئلة وأجوبة مقابلة شجرة القرار هذه ستكون الخيار (ج).

تحقق من: أسئلة مقابلة التعلم الآلي

ماذا بعد؟

إذا كنت مهتمًا بمعرفة المزيد حول شجرة القرار ، التعلم الآلي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة و المهام ، وحالة خريجي IIIT-B ، وأكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع كبرى الشركات.

كيف يمكن تحسين شجرة القرار؟

شجرة القرار هي أداة لإنشاء مساعدة مرئية بسيطة يتم فيها تمثيل نقاط الحكم الذاتي أو القرار الشرطي كعقد والنتائج المحتملة المختلفة كأوراق. بكلمات بسيطة ، شجرة القرار هي نموذج لعملية صنع القرار. يمكنك تحسين شجرة القرار من خلال التأكد من أن معايير الإيقاف واضحة دائمًا. عندما لا تكون معايير التوقف صريحة ، فإنه يترك المرء يتساءل عما إذا كان هناك حاجة لمزيد من الاستكشاف ، كما يترك الشكوك حول ما إذا كان ينبغي على المرء التوقف أم لا. يجب أيضًا إنشاء شجرة القرار بطريقة تجعل من السهل متابعتها وعدم إرباك القارئ.

لماذا دقة شجرة القرار منخفضة للغاية؟

دقة شجرة القرار أقل مما كنا نتوقعه. يمكن أن يحدث هذا للأسباب التالية: البيانات السيئة - من المهم جدًا استخدام البيانات الصحيحة لخوارزميات التعلم الآلي. يمكن أن تؤدي البيانات السيئة إلى نتائج خاطئة. العشوائية - في بعض الأحيان يكون النظام معقدًا لدرجة أنه من المستحيل التنبؤ بما سيحدث في المستقبل. في هذه الحالة ، ستنخفض دقة شجرة القرار أيضًا. overfitting - قد لا تتمكن شجرة القرار من التقاط تفرد البيانات ، وبالتالي يمكن اعتبارها تعميمًا. إذا تم استخدام نفس البيانات لضبط الشجرة ، فيمكنها احتواء البيانات بشكل زائد.

كيف يتم تقليم شجرة القرار؟

يتم تقليم شجرة القرار باستخدام خوارزمية متفرعة ومنضمة. يجد الفرع والخوارزمية المنضمة الحل الأمثل لشجرة القرار عن طريق التكرار خلال عقد الشجرة وربط قيمة الوظيفة الهدف في كل تكرار. الوظيفة الهدف هي قيمة شجرة القرار للأعمال. في كل عقدة ، تقوم الخوارزمية إما بإزالة فرع من الشجرة أو تقليم فرع إلى عقدة جديدة. أفضل جزء هو أنه يمكن تقليم الفرع حتى لو أدى إلى حل غير مثالي.