شجرة الغابة العشوائية مقابل شجرة القرار: الفرق بين الغابة العشوائية وشجرة القرار
نشرت: 2020-12-30مهدت التطورات الأخيرة نمو خوارزميات متعددة. أدت هذه الخوارزميات الجديدة والمتوهجة إلى اشتعال البيانات. أنها تساعد في التعامل مع البيانات واتخاذ القرارات معهم بشكل فعال. لأن العالم يتعامل مع موجة الإنترنت. كل شيء تقريبا موجود على الإنترنت. للتعامل مع مثل هذه البيانات ، نحتاج إلى خوارزميات صارمة لاتخاذ القرارات والتفسيرات. الآن ، في ظل وجود قائمة واسعة من الخوارزميات ، من الصعب اختيار الأنسب.
تستخدم معظم المنظمات خوارزميات اتخاذ القرار على نطاق واسع. عليهم اتخاذ قرارات تافهة وكبيرة كل ساعة. من تحليل المادة التي يجب اختيارها للحصول على مساحات إجمالية عالية ، يتم اتخاذ قرار في الخلفية. دفعت التطورات الأخيرة في Python و ML إلى دفع العوائق للتعامل مع البيانات. وبالتالي ، فإن البيانات موجودة بكميات ضخمة. العتبة تعتمد على المنظمة. هناك نوعان من خوارزميات القرار الرئيسية المستخدمة على نطاق واسع. شجرة القرار والغابة العشوائية - تبدو مألوفة ، أليس كذلك؟
الأشجار والغابات!
دعنا نستكشف هذا بمثال سهل.
لنفترض أن عليك شراء علبة روبية. 10 بسكويت حلو. الآن ، عليك أن تختار واحدة من بين العديد من ماركات البسكويت.
اخترت خوارزمية شجرة القرار. الآن ، سوف يتحقق من روبية. 10 باكيت وهو حلو. سيختار على الأرجح البسكويت الأكثر مبيعًا. سوف تقرر الذهاب لروبية. 10 بسكويت شوكولاتة. أنت سعيد!

لكن صديقك استخدم خوارزمية Random Forest. الآن ، اتخذ عدة قرارات. علاوة على ذلك ، اختيار قرار الأغلبية. يختار من بين نكهات مختلفة من الفراولة والفانيليا والتوت والبرتقال. يتحقق من أن روبية معينة. 10 باكيت تخدم 3 وحدات أكثر من الأصلي. تم تقديمه في شوكولاتة الفانيليا. لقد اشترى ذلك البسكويت بالشوكولاتة بالفانيليا. هو الأسعد ، بينما تركت لتندم على قرارك.
انضم إلى دورة التعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم - الماجستير ، وبرامج الدراسات العليا التنفيذية ، وبرنامج الشهادة المتقدم في ML & AI لتسريع حياتك المهنية.
جدول المحتويات
ما الفرق بين شجرة القرار والغابة العشوائية؟
1. شجرة القرار
مصدر
شجرة القرار هي خوارزمية تعلم خاضعة للإشراف تستخدم في التعلم الآلي. عملت في كل من خوارزميات التصنيف والانحدار. كما يوحي الاسم ، فهي تشبه الشجرة ذات العقد. الفروع تعتمد على عدد المعايير. يقوم بتقسيم البيانات إلى فروع مثل هذه حتى تصل إلى وحدة عتبة. تحتوي شجرة القرار على عقد جذر وعقد فرعية وعقد طرفية.
تُستخدم العودية للعبور عبر العقد. لا تحتاج إلى خوارزمية أخرى. يعالج البيانات بدقة ويعمل بشكل أفضل مع النمط الخطي. يتعامل مع البيانات الكبيرة بسهولة ويستغرق وقتًا أقل.
كيف يعمل؟
1. الانقسام
تخضع البيانات ، عند تقديمها إلى شجرة القرار ، للتقسيم إلى فئات مختلفة تحت الفروع.
يجب أن تقرأ: مصنف بايز ساذج: شرح إيجابيات وسلبيات ، والتطبيقات والأنواع
2. التقليم
التقليم هو تمزيق تلك الفروع علاوة على ذلك. يعمل كتصنيف لدعم البيانات بطريقة أفضل. مثل ، بالطريقة نفسها التي نقول بها تقليم الأجزاء الزائدة ، فإنها تعمل بنفس الطريقة. يتم الوصول إلى العقدة الورقية ، وينتهي التقليم. إنه جزء مهم جدًا من أشجار القرار.
3. اختيار الأشجار
الآن ، عليك اختيار أفضل شجرة يمكنها العمل مع بياناتك بسلاسة.
فيما يلي العوامل التي يجب أخذها في الاعتبار:
4. الانتروبيا
للتحقق من تجانس الأشجار ، يجب استنتاج الكون. إذا كانت الإنتروبيا صفراً ، فهي متجانسة ؛ وإلا لا.
5. اكتساب المعرفة
بمجرد تقليل الانتروبيا ، يتم الحصول على المعلومات. تساعد هذه المعلومات في تقسيم الفروع بشكل أكبر.
- تحتاج إلى حساب الانتروبيا.
- قسّم البيانات على أساس معايير مختلفة
- اختر أفضل المعلومات.
عمق الشجرة هو جانب مهم. يُعلمنا العمق بعدد القرارات التي يجب على المرء اتخاذها قبل أن نتوصل إلى نتيجة. تعمل أشجار العمق الضحلة بشكل أفضل باستخدام خوارزميات شجرة القرار.
مزايا وعيوب شجرة القرار
مزايا
- سهل
- عملية شفافة
- التعامل مع البيانات العددية والفئوية
- كلما كبرت البيانات ، كانت النتيجة أفضل
- سرعة
سلبيات
- قد يزيد
- عملية التقليم كبيرة
- التحسين غير مضمون
- حسابات معقدة
- ارتفاع الانحراف
الخروج: شرح نماذج التعلم الآلي

2. الغابة العشوائية
مصدر
يتم استخدامه أيضًا للتعلم تحت الإشراف ولكنه قوي جدًا. يستخدم على نطاق واسع. الاختلاف الأساسي هو أنه لا يعتمد على قرار فردي. يجمع قرارات عشوائية بناءً على عدة قرارات ويتخذ القرار النهائي بناءً على الأغلبية.
لا يبحث عن أفضل تنبؤ. بدلاً من ذلك ، يقوم بعمل تنبؤات عشوائية متعددة. وبالتالي ، يتم إرفاق المزيد من التنوع ، ويصبح التنبؤ أكثر سلاسة.
يمكنك استنتاج الغابة العشوائية لتكون مجموعة من أشجار القرار المتعددة!
التعبئة هي عملية إنشاء غابات عشوائية بينما تعمل القرارات بشكل متوازي.
1. التعبئة
- خذ بعض مجموعة بيانات التدريب
- اصنع شجرة قرار
- كرر العملية لفترة محددة
- الآن خذ التصويت الرئيسي. الذي يفوز هو قرارك أن تتخذه.
2. التمهيد
Bootstrapping هو اختيار عينات عشوائية من بيانات التدريب. هذا إجراء عشوائي.
خطوة بخطوة

- اختيار شروط عشوائية
- احسب عقدة الجذر
- انشق، مزق
- يكرر
- تحصل على غابة
قراءة: شرح بايز ساذج
مزايا وعيوب Random Forest
مزايا
- قوي ودقيق للغاية
- لا حاجة للتطبيع
- يمكنه التعامل مع العديد من الميزات في وقت واحد
- قم بتشغيل الأشجار بطرق متوازية
سلبيات
- هم منحازون لبعض الميزات في بعض الأحيان
- بطيء
- لا يمكن استخدامها للطرق الخطية
- أسوأ بالنسبة للبيانات عالية الأبعاد
خاتمة
تعتبر أشجار القرار سهلة للغاية مقارنة بالغابات العشوائية. تجمع شجرة القرار بين بعض القرارات ، بينما تجمع مجموعة التفرعات العشوائية العديد من أشجار القرار. وبالتالي ، فهي عملية طويلة ، لكنها بطيئة.
حيث أن شجرة القرار سريعة وتعمل بسهولة على مجموعات البيانات الكبيرة ، وخاصة الخطية. يحتاج نموذج الغابة العشوائية إلى تدريب صارم. عندما تحاول طرح مشروع ، قد تحتاج إلى أكثر من نموذج. وهكذا ، فإن عددا كبيرا من الغابات العشوائية ، أكثر من مرة.
ذلك يعتمد على الاحتياجات الخاصة بك. إذا كان لديك وقت أقل للعمل على نموذج ، فأنت ملزم باختيار شجرة قرار. ومع ذلك ، فإن الاستقرار والتنبؤات الموثوقة موجودة في سلة الغابات العشوائية.
إذا كان لديك شغف وترغب في معرفة المزيد عن الذكاء الاصطناعي ، فيمكنك الحصول على دبلوم PG في IIIT-B & upGrad في التعلم الآلي والتعلم العميق الذي يوفر أكثر من 400 ساعة من التعلم والجلسات العملية والمساعدة في العمل وغير ذلك الكثير.
كيف تختلف Random Forest عن شجرة القرار العادية؟
في التعلم الآلي ، تعتبر شجرة القرار تقنية تعلم خاضعة للإشراف. إنه قادر على العمل مع كل من تقنيات التصنيف والانحدار. وهي تشبه الشجرة ذات العقد ، كما يوحي الاسم. مقدار المعايير يحدد الفروع. يقسم البيانات إلى هذه الفروع حتى تصل إلى وحدة عتبة. هناك عقد جذر وعقد فرعية وعقد طرفية في شجرة القرار. تُستخدم Random Forest أيضًا للتعلم الخاضع للإشراف ، على الرغم من أنها تتمتع بقوة كبيرة. إنها تحظى بشعبية كبيرة. الفرق الرئيسي هو أنه لا يعتمد على قرار واحد. يقوم بتجميع القرارات العشوائية بناءً على العديد من القرارات ثم يتخذ قرارًا نهائيًا بناءً على الأغلبية.
ما هي المزايا الرئيسية لاستخدام الغابة العشوائية مقابل شجرة قرار واحدة؟
في عالم مثالي ، نود تقليل كل من الأخطاء المتعلقة بالتحيز والأخطاء المتعلقة بالتباين. تتم معالجة هذه المشكلة بشكل جيد من خلال مجموعة التفرعات العشوائية. الغابة العشوائية ليست أكثر من سلسلة من أشجار القرار مع دمج نتائجها في نتيجة نهائية واحدة. إنها قوية جدًا نظرًا لقدرتها على تقليل فرط التجهيز دون زيادة كبيرة في الخطأ بسبب التحيز. من ناحية أخرى ، تعد الغابات العشوائية أداة نمذجة قوية وأكثر مرونة بكثير من شجرة قرار واحدة. إنها تجمع بين العديد من أشجار القرار لتقليل عدم الدقة المتوافقة مع التحيز وعدم الدقة ، وبالتالي تنتج نتائج قابلة للاستخدام.
ما هو حدود أشجار القرار؟
تتمثل إحدى عيوب أشجار القرار في أنها غير مستقرة للغاية عند مقارنتها بمنبئات الاختيار الأخرى. قد يتسبب تغيير طفيف في البيانات في حدوث تغيير كبير في هيكل شجرة القرار ، مما يؤدي إلى نتيجة تختلف عما يتوقعه المستهلكون في حدث نموذجي. علاوة على ذلك ، عندما يكون الغرض الرئيسي هو التنبؤ بنتيجة متغير مستمر ، فإن أشجار القرار تكون أقل فائدة في عمل التنبؤات.