شجرة القرار في R: المكونات والأنواع وخطوات البناء والتحديات
نشرت: 2020-04-02"شجرة القرار في R" هو التمثيل الرسومي للخيارات التي يمكن اتخاذها وماذا يمكن أن تكون نتائجها. يتم تمثيله في شكل شجرة رسومية. تمثل الأجزاء المختلفة من الشجرة أنشطة مختلفة لصانع القرار. إنها طريقة فعالة لوضع الاحتمالات والنتائج المختلفة لعمل معين بصريًا.
جدول المحتويات
لماذا يجب علي استخدام شجرة القرار في R؟
قد تتساءل عن أهمية أشجار القرار في R. لا تحدد أشجار القرار المشكلة والحلول المختلفة فحسب ، بل تحدد أيضًا جميع الخيارات الممكنة. يمكن أن تكون هذه الخيارات هي التحديات التي يواجهها صانع القرار للتوصل إلى مجموعة أوسع من الحلول.
كما أنه يساعد في تحليل النتائج المحتملة المختلفة لمشكلة ما والتخطيط مسبقًا. إنه يوفر إطارًا شاملاً بحيث يمكنك بسهولة تحديد قيم النتائج المختلفة أيضًا. هذا مهم بشكل خاص عندما يأتي الاحتمال الشرطي في الصورة.
ما هي الأجزاء المختلفة لشجرة القرار في R؟
لفهم وتفسير ما تعنيه شجرة القرار ، عليك أن تفهم ماهية الأجزاء المختلفة لشجرة القرار. قد تصادف هذه المصطلحات كثيرًا عندما تنظر إلى أشجار القرار.
- العقد: تمثل عُقد الشجرة حدثًا أو خيارًا يتعين على صانع القرار اتخاذه.
- الحواف: هذه هي الشروط أو القواعد المختلفة التي تم تعيينها.
- عقدة الجذر: تُظهر المجموعة السكانية أو العينة بأكملها في حالة تصور عينة.
- الانقسام: يحدث هذا عندما تنقسم العقدة إلى عقد فرعية.
- عقد القرار: هذه هي العقد الفرعية المحددة التي تنقسم أكثر.
- الورقة: هذه هي المصطلحات النهائية أو العقد التي لا تنقسم أيضًا.
- التقليم: هذا هو إزالة العقد الفرعية لعقدة القرار.
- الفرع: هذه أقسام فرعية لشجرة قرارات كاملة.
قراءة: علم البيانات مقابل علم القرار
كيف يمكنني استخدام شجرة القرار في R؟
نظرًا لأنه لا يمكن صنع أشجار القرار إلا في R ، فأنت بحاجة إلى تثبيت R أولاً. يمكن القيام بذلك بسرعة كبيرة عبر الإنترنت. بعد تنزيل R ، يجب عليك إنشاء وتصور الحزم لاستخدام أشجار القرار. الحزمة الوحيدة التي تسمح بذلك هي "الحفلة". عندما تكتب الأمر install.package ("طرف") ، يمكنك استخدام تمثيلات شجرة القرار. تعتبر أشجار القرار أيضًا خوارزميات معقدة وخاضعة للإشراف.
كيف تعمل أشجار القرار في R؟
غالبًا ما يتم استخدام أشجار القرار في التعلم الآلي واستخراج البيانات عند استخدام R. العنصر الأساسي المستخدم في هذه الحالة هو البيانات المرصودة أو التدريبية. بعد ذلك ، يتم إنشاء نموذج شامل. تُستخدم مجموعة من بيانات التحقق أيضًا لترقية شجرة القرار وتحسينها.
تعرف على المزيد: تصور البيانات في برمجة R
ما هي أنواع مختلفة من أشجار القرار؟
أهم أنواع أشجار القرار هي أشجار التصنيف والانحدار. يتم استخدام هذه بشكل عام عندما تكون المدخلات والمخرجات قاطعة.
أشجار التصنيف: هذه نماذج شجرية حيث يمكن للمتغير أن يأخذ مجموعة معينة من القيم. في هذه الحالات ، تمثل الأوراق تسميات الفئة ، بينما تمثل الفروع ارتباطات سمة مختلفة. وهي بشكل عام نوع شجرة "نعم" أو "لا".

أشجار الانحدار: توجد أشجار قرار لها متغير يمكن أن يأخذ قيمًا مستمرة.
عندما تجمع بين كلا النوعين أعلاه من أشجار القرار ، تحصل على CART أو أشجار التصنيف والانحدار. هذا مصطلح شامل قد تصادفه عدة مرات. هذه تشير إلى الإجراءات المذكورة أعلاه. الاختلاف الوحيد في هذين النوعين هو نوع المتغيرات التابعة - سواء كانت فئوية أو رقمية.
ما هي الخطوات المتبعة في بناء شجرة قرار بشأن R؟
الخطوة 1: استيراد- استيراد مجموعة البيانات التي تريد تحليلها.
الخطوة 2: التنظيف- يجب تنظيف مجموعة البيانات.
الخطوة 3: إنشاء قطار أو مجموعة اختبار- هذا يعني أنه يجب تدريب الخوارزمية على التنبؤ بالتسميات ثم استخدامها للاستدلال.
الخطوة 4: بناء النموذج - يستخدم بناء الجملة rpart () لهذا الغرض. هذا يعني أن العقد تستمر في الانقسام حتى يتم الوصول إلى نقطة لا يمكن فيها الانقسام الإضافي.
الخطوة 5: توقع مجموعة البيانات الخاصة بك - استخدم توقع بناء الجملة () لهذه الخطوة.
الخطوة 6: قياس الأداء- توضح هذه الخطوة دقة المصفوفة.
الخطوة 7: ضبط المعلمات الفائقة - للتحكم في جوانب الملاءمة ، تحتوي شجرة القرار على معلمات مختلفة. يمكن التحكم في المعلمات باستخدام وظيفة rpart.control ().
اقرأ أيضًا: برنامج R التعليمي للمبتدئين
ما هي تحديات استخدام شجرة القرار في R؟
يمكن أن يكون التقليم عملية شاقة ويجب إجراؤها بعناية للحصول على تمثيل دقيق. يمكن أن يكون هناك أيضًا عدم استقرار مرتفع في حالة حدوث تغيير بسيط. لذلك ، فهو شديد التقلب ، مما قد يكون مزعجًا للمستخدمين ، وخاصة المبتدئين. علاوة على ذلك ، يمكن أن تفشل في تحقيق نتائج ونتائج مرغوبة في حالات قليلة.
تعلم دورات علوم البيانات من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.
تغليف
إذا كنت ترغب في اتخاذ الخيار الأمثل مع إدراكك للعواقب ، فتأكد من معرفة كيفية استخدام شجرة القرار في R. إنها تمثيل تخطيطي لما قد يحدث وما قد لا يحدث. هناك عدة مكونات مختلفة لشجرة القرار موضحة أعلاه. إنها خوارزمية تعلم آلي شائعة وفعالة للاستخدام.
ما هي شجرة القرار وفئاتها؟
شجرة القرار هي أداة داعمة تمتلك بنية شبيهة بالشجرة لنمذجة النتائج المحتملة ، والعواقب المحتملة ، والمرافق ، وكذلك تكلفة الموارد. تسهل أشجار القرار عرض الخوارزميات المختلفة بمساعدة بيانات التحكم الشرطي. تتضمن شجرة القرار فروعًا لتمثيل خطوات اتخاذ القرار المختلفة التي تؤدي في النهاية إلى نتيجة إيجابية.
بناءً على المتغير المستهدف ، هناك نوعان رئيسيان من أشجار القرار.
1. شجرة القرار المتغيرة الفئوية - في شجرة القرار هذه ، يتم تقسيم المتغيرات الهدف إلى فئات مختلفة. ستحدد الفئات أن كل عملية قرار ستندرج في أي من الفئتين ، ولا توجد فرص في الوسط على أي حال.
2. شجرة القرار المتغير المستمر - يوجد متغير هدف مستمر في شجرة القرار هذه. على سبيل المثال ، إذا كان دخل أي فرد غير معروف ، فيمكن معرفته بمساعدة المعلومات المتاحة مثل العمر والمهنة وأي متغير مستمر آخر.
ما هي تطبيقات أشجار القرار؟
هناك نوعان من التطبيقات الرئيسية لشجرة القرار.
1. استخدام البيانات الديموغرافية للعثور على العملاء المحتملين - يمكن لأي مؤسسة تبسيط ميزانيتها التسويقية لاتخاذ قرارات مستنيرة بحيث يتم إنفاق الأموال في المكان المناسب مع وضع البيانات الديموغرافية المناسبة في الاعتبار.
2. تقييم فرص النمو المحتملة - أشجار القرار مفيدة في تقييم البيانات التاريخية لتقييم فرص النمو المحتملة في أي عمل تجاري والمساعدة في التوسع.
ما هي إيجابيات وسلبيات أشجار القرار؟
مزايا-
1. سهولة القراءة والتفسير - يمكنك بسهولة قراءة وتفسير مخرجات أشجار القرار حتى بدون أي معرفة إحصائية.
2. سهولة التحضير - تتطلب أشجار القرار القليل من الجهد لإعداد البيانات مقارنة بأي تقنية قرار أخرى.
3. متطلبات أقل لتنظيف البيانات - تتطلب أشجار القرار القليل جدًا من تنظيف البيانات حيث تم إنشاء المتغيرات بالفعل.
سلبيات-
1. الطبيعة غير المستقرة - أكبر قيود هي أن أشجار القرار غير مستقرة للغاية مقارنة بتقنيات القرار الأخرى. حتى إذا كان هناك تغيير بسيط في البيانات ، فسوف يعكس تغييرًا كبيرًا في هيكل القرار.
2. أقل فعالية للتنبؤ بنتائج متغير مستمر - عندما يتعين تصنيف المتغيرات إلى عدة فئات ، تميل أشجار القرار إلى فقدان المعلومات.