إيجابيات وسلبيات انحدار شجرة القرار في التعلم الآلي
نشرت: 2020-12-24يستخدم كل من المنافسين والمتخصصين في علوم البيانات أحد أكثر خوارزميات التعلم الآلي شيوعًا ، وهو انحدار شجرة القرار . هذه نماذج تنبؤية تحسب القيمة المستهدفة بناءً على مجموعة من القواعد الثنائية.
يتم استخدامه لبناء كل من نماذج الانحدار والتصنيف في شكل هيكل شجرة. يتم تقسيم مجموعات البيانات إلى مجموعات فرعية أصغر في شجرة القرار ، بينما يتم إنشاء شجرة القرار المرتبطة بشكل متزايد في وقت واحد.
تُستخدم شجرة القرار للوصول إلى تقدير بناءً على تنفيذ سلسلة من الأسئلة في مجموعة البيانات. من خلال طرح أسئلة الصواب / الخطأ هذه ، يكون النموذج قادرًا على تضييق نطاق القيم الممكنة والتنبؤ. يتم تحديد ترتيب ومحتوى السؤال من خلال النموذج نفسه.
جدول المحتويات
ما هي شروط شجرة القرار؟
تحتوي شجرة القرار على فروع وعقد وأوراق وما إلى ذلك. العقدة الجذرية هي عقدة أولية تمثل العينة بأكملها أو المجتمع ، ويمكن تقسيمها إلى عقد أخرى أو مجموعات متجانسة. تتكون عقدة القرار من عقدتين أو أكثر تمثلان قيمًا منفصلة للسمة التي تم اختبارها.
لا تنقسم العقدة الطرفية / الطرفية إلى عقد أخرى ، وهي تمثل قرارًا. الفرع أو الشجرة الفرعية هو قسم فرعي من شجرة بأكملها. الانقسام هو عملية تقسيم العقدة إلى عقدتين فرعيتين أو أكثر. يسمى عكس التقسيم التقليم ، أي إزالة العقد الفرعية لعقدة القرار. العقدة الأصلية هي عقدة تنقسم إلى عقد فرعية ، والعقدة الفرعية هي العقدة الفرعية.
ذات صلة: دليل خوارزمية شجرة القرار

كيف يعمل؟
تستخدم خوارزمية شجرة القرار نقطة بيانات وتعمل عبر الشجرة بأكملها عن طريق طرح أسئلة صواب / خطأ. بدءًا من عقدة الجذر ، يتم طرح الأسئلة ، ويتم إنشاء فروع منفصلة لكل إجابة ، ويستمر هذا حتى الوصول إلى العقدة الطرفية. يستخدم التقسيم العودي لبناء الشجرة.
شجرة القرار هي نموذج تعلم آلي خاضع للإشراف ، وبالتالي ، فهي تتعلم كيفية تعيين البيانات إلى المخرجات في مرحلة التدريب لبناء النموذج. يتم ذلك عن طريق ملاءمة النموذج بالبيانات التاريخية التي يجب أن تكون ذات صلة بالمشكلة ، إلى جانب قيمتها الحقيقية التي يجب أن يتعلمها النموذج للتنبؤ بدقة. يساعد هذا النموذج في التعرف على العلاقات بين البيانات والمتغير المستهدف.
بعد هذه المرحلة ، تكون شجرة القرار قادرة على بناء شجرة مماثلة عن طريق حساب الأسئلة وترتيبها ، مما سيساعدها في إجراء التقدير الأكثر دقة. وبالتالي ، يعتمد التنبؤ على بيانات التدريب التي يتم إدخالها في النموذج.
كيف تقرر الانقسام؟
يختلف قرار التقسيم بالنسبة لأشجار التصنيف والانحدار ، وتعتمد دقة تنبؤ الشجرة عليها بشكل كبير. عادةً ما يتم استخدام متوسط الخطأ التربيعي (MSE) لتقرير ما إذا كان سيتم تقسيم عقدة إلى عقدتين فرعيتين أو أكثر في انحدار شجرة القرار . في حالة الشجرة الثنائية ، تختار الخوارزمية قيمة وتقسيم البيانات إلى مجموعتين فرعيتين ، وتحسب MSE لكل مجموعة فرعية ، وتختار أصغر قيمة MSE نتيجة لذلك.
تنفيذ انحدار شجرة القرار
يتم توفير الهيكل الأساسي لتنفيذ خوارزمية انحدار شجرة القرار في الخطوات التالية.
استيراد مكتبات
تتمثل الخطوة الأولى لتطوير أي نموذج للتعلم الآلي في استيراد جميع المكتبات اللازمة للتطوير.
تحميل البيانات
بعد استيراد المكتبات ، فإن الخطوة التالية هي تحميل مجموعة البيانات. يمكن تنزيل البيانات أو استخدامها من المجلدات المحلية للمستخدم.
تقسيم مجموعة البيانات
بمجرد تحميل البيانات ، يجب تقسيمها إلى مجموعة تدريب ومجموعة اختبار وإنشاء متغيري x و y. تحتاج القيم أيضًا إلى إعادة تشكيلها لجعل البيانات في التنسيق المطلوب.
تدريب النموذج
هنا يتم تدريب نموذج انحدار شجرة البيانات باستخدام مجموعة التدريب التي تم إنشاؤها في الخطوة السابقة.

توقع النتائج
هنا يتم توقع نتائج مجموعة الاختبار باستخدام النموذج المدرب على مجموعة التدريب.
تقييم النموذج
يتم التحقق من أداء النموذج بمقارنة القيم الحقيقية والقيم المتوقعة في الخطوة النهائية. يمكن الاستدلال على دقة النموذج بمقارنة هذه القيم. يساعد تصور النتائج من خلال إنشاء رسم بياني للقيم أيضًا في قياس دقة النموذج.

قراءة: كيف تصنع شجرة قرار مثالية؟
مزايا
- يمكن استخدام نموذج شجرة القرار لكل من مشاكل التصنيف والانحدار ، ومن السهل تفسيره وفهمه وتصوره.
- يمكن أيضًا فهم ناتج شجرة القرار بسهولة.
- بالمقارنة مع الخوارزميات الأخرى ، فإن إعداد البيانات أثناء المعالجة المسبقة في شجرة القرار يتطلب جهدًا أقل ولا يتطلب تطبيع البيانات.
- يمكن أيضًا أن يتم التنفيذ بدون قياس البيانات.
- تعتبر شجرة القرار واحدة من أسرع الطرق لتحديد العلاقات بين المتغيرات والمتغير الأكثر أهمية.
- يمكن أيضًا إنشاء ميزات جديدة لتحسين توقع متغير الهدف.
- لا تتأثر أشجار القرار إلى حد كبير بالقيم المتطرفة أو القيم المفقودة ، ويمكنها التعامل مع كل من المتغيرات العددية والفئوية.
- نظرًا لأنها طريقة غير معلمية ، فليس لها أي افتراضات حول توزيعات الفضاء وبنية المصنف.
سلبيات
- يعد التجهيز الإضافي أحد الصعوبات العملية لنماذج شجرة القرار. يحدث ذلك عندما تستمر خوارزمية التعلم في تطوير فرضيات تقلل من خطأ مجموعة التدريب ولكن على حساب زيادة خطأ مجموعة الاختبار. ولكن يمكن حل هذه المشكلة عن طريق التقليم ووضع قيود على معلمات النموذج.
- لا يمكن استخدام أشجار القرار بشكل جيد مع المتغيرات العددية المستمرة.
- يؤدي التغيير البسيط في البيانات إلى إحداث اختلاف كبير في بنية الشجرة ، مما يؤدي إلى عدم الاستقرار.
- يمكن أن تصبح الحسابات المعنية معقدة أيضًا مقارنة بالخوارزميات الأخرى ، ويستغرق تدريب النموذج وقتًا أطول.
- كما أنها مكلفة نسبيًا نظرًا لأن مقدار الوقت المستغرق ومستويات التعقيد أكبر.
خاتمة
تم شرح خوارزمية انحدار شجرة القرار من خلال هذه المقالة من خلال وصف كيفية إنشاء الشجرة مع تعريفات موجزة للمصطلحات المختلفة المتعلقة بها. يتم أيضًا تضمين وصف موجز لكيفية عمل شجرة القرار وكيفية اتخاذ قرار تقسيم أي عقدة.
تم شرح كيفية تنفيذ انحدار شجرة القرار الأساسي من خلال سلسلة من الخطوات. أخيرًا ، تم توفير مزايا وعيوب خوارزمية شجرة القرار.
إذا كنت مهتمًا بمعرفة المزيد عن أشجار القرار ، والتعلم الآلي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، حالة خريجي IIIT-B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع كبرى الشركات.
يستخدم الانحدار للتنبؤ بالمتغيرات المستمرة. إنه عندما يتعين علينا توقع رقم. على سبيل المثال ، إذا كنت تريد توقع أسعار المنازل في مدينة ما ، بناءً على ميزات مثل حجم المنزل ومساحة المدينة ، فسيتم استخدام الانحدار. من السهل جدًا حل مسائل الانحدار باستخدام الانحدار الخطي. باختصار ، الانحدار هو فعل تقدير قيمة مخرجات غير معروفة بناءً على قيمة إدخال. شجرة القرار عبارة عن رسم بياني يوضح جميع القرارات الممكنة والنتائج المحتملة. غالبًا ما تُستخدم أشجار القرار لفحص كيفية تأثير القرارات على النتائج المستقبلية. على سبيل المثال ، يمكن لشجرة القرار أن تساعد الشركة في تحليل ما إذا كان ينبغي عليها شراء مستودعات إضافية أو بناء مركز توزيع جديد. بشكل عام ، تُستخدم أشجار القرار في بحوث العمليات وعلوم الإدارة. تعتبر أشجار القرار مفهومًا شائعًا وشائعًا في صنع القرار وتخطيط البرامج. يمكن استخدامها في الاختيار بين مسارات العمل عندما تكون بعض الدورات الممكنة متعارضة ، وعندما تعتمد نتيجة كل مسار عمل على حالة العالم. يمكن استخدام نموذج أشجار القرار لأي فئة من المشاكل ، إما للتصنيف أو التنبؤ الرقمي. يمكن أن تمتد إلى أي فئة من المشاكل. يمكن استخدامه لكل من التصنيف الخاضع للإشراف وغير الخاضع للإشراف. يمكنه التعامل مع مزيج من الميزات الرقمية والفئوية. يعطي نتائج مستقرة. ومع ذلك ، من الصعب فهم السبب وراء التنبؤ. يجب أن يكون مفهوما أن النموذج لا يتعلم أفضل تقسيم في كل عقدة في الشجرة ، بل هو يتعلم توزيع الاحتمالات للفئة داخل كل عقدة. هذا المطلب يجعل النموذج مكثفًا من الناحية الحسابية ويمنعه من معالجة كميات كبيرة من البيانات.ما هو الانحدار في التعلم الآلي؟
ما هي أشجار القرار؟
ما هي مزايا وعيوب أشجار القرار؟
