دليل خوارزمية شجرة القرار: التطبيقات والإيجابيات والسلبيات والمثال
نشرت: 2020-12-10هناك أنواع مختلفة من خوارزميات التعلم الآلي ، ولكل منها تطبيقات فريدة. في هذه المقالة ، سنلقي نظرة على واحدة من أكثر خوارزميات ML شيوعًا وفائدة ، وهي خوارزمية شجرة القرار. لقد ناقشنا مثالاً لشجرة القرار في R لمساعدتك على التعرف على استخدامها. هيا بنا نبدأ.
جدول المحتويات
ما هي خوارزمية شجرة القرار؟
شجرة القرار هي نوع من خوارزمية التعلم الآلي الخاضعة للإشراف والتي تحتوي على عقدة جذر وعقد ورقية. تمثل كل عقدة ميزة ، وتظهر الروابط بين العقد القرار. كل ورقة تمثل نتيجة.
لنفترض أنك تريد الذهاب إلى السوق لشراء الخضار. لديك خياران: إما أن تذهب ، أو لا تذهب. إذا لم تذهب ، فلن تحصل على الخضار ، ولكن إذا قمت بذلك ، فسيتعين عليك الوصول إلى السوق ، مما يؤدي إلى قسم آخر من الخيارات. تعمل شجرة القرار على هذا النحو.
تطبيقات أشجار القرار
فيما يلي بعض تطبيقات أشجار القرار:
تسويق:
يمكن للشركات استخدام أشجار القرار لتعزيز دقة حملاتها الترويجية من خلال مراقبة أداء منتجات وخدمات منافسيها. يمكن أن تساعد أشجار القرار في تجزئة الجمهور ودعم الشركات في إنتاج إعلانات أفضل استهدافًا ذات معدلات تحويل أعلى.
الاحتفاظ بالعملاء:
تستخدم الشركات أشجار القرار للاحتفاظ بالعملاء من خلال تحليل سلوكياتهم وإصدار عروض أو منتجات جديدة لتناسب تلك السلوكيات. باستخدام نماذج شجرة القرار ، يمكن للشركات معرفة مستويات رضا عملائها أيضًا.
تشخيص الأمراض والعلل:
يمكن أن تساعد أشجار القرار الأطباء والمهنيين الطبيين في تحديد المرضى المعرضين لخطر الإصابة بحالات خطيرة (أو يمكن الوقاية منها) مثل مرض السكري أو الخرف. إن قدرة أشجار القرار على تضييق الاحتمالات وفقًا لمتغيرات محددة مفيدة جدًا في مثل هذه الحالات.
كشف الاحتيال:
يمكن للشركات منع الاحتيال باستخدام أشجار القرار لتحديد السلوك الاحتيالي مسبقًا. يمكن أن يوفر الكثير من الموارد للشركات ، بما في ذلك الوقت والمال.
مزايا وعيوب أشجار القرار
مزايا خوارزمية شجرة القرار:
فيما يلي المزايا الرئيسية لاستخدام شجرة القرار في R:
- فهم النتائج أسهل من النماذج الأخرى. يمكنك جعل الفريق الفني يبرمج نموذج شجرة القرار الخاص بك ، بحيث يعمل بشكل أسرع ، ويمكنك تطبيقه على الحالات الجديدة. تشتمل حساباتها على اختبارات تضمين وفقًا لمثيل نوعي أو كمي.
- إنه غير حدودي. لا يجب أن تتبع المتغيرات المستقلة الموجودة في مشكلتنا أي توزيعات احتمالية محددة لهذا السبب. يمكن أن يكون لديك متغيرات تربطها علاقة خطية متداخلة. سواء كانت تمييزية أم لا ، ليس لها تأثير على شجرة قرارك لأنه لا يتعين عليها اختيار تلك المتغيرات.
- إنهم قادرون على العمل بقيم مفقودة. يضع CHAID جميع القيم المفقودة في فئة ، والتي يمكنك دمجها مع فئة أخرى أو الاحتفاظ بها منفصلة عن القيم الأخرى.
- ليس للقيم الفردية المتطرفة (مثل القيم المتطرفة) تأثير كبير على أشجار القرار. يمكنك عزلها في عقد صغيرة بحيث لا تؤثر على التصنيف بأكمله.
- يمنحك تمثيلًا مرئيًا رائعًا لعملية صنع القرار. يمثل كل فرع من فروع شجرة القرار العوامل التي يمكن أن تؤثر على قراراتك ، وستحصل على صورة أكبر. يمكنك استخدام أشجار القرار لتحسين التواصل في فريقك.
- يمكن لأشجار CART التعامل مع جميع الأنواع المتغيرة مباشرةً ، بما في ذلك المتغيرات النوعية والمستمرة والمنفصلة.
عيوب خوارزمية شجرة القرار
- لا يقوم بتحليل جميع المتغيرات المستقلة في وقت واحد. بدلا من ذلك ، يتم تقييمها بالتسلسل. نتيجة لذلك ، لا تراجع الشجرة مطلقًا تقسيم العقدة على أي مستوى ، مما قد يتسبب في انحياز اختيارات الشجرة.
- يمكن أن يؤثر تعديل حتى متغير واحد على الشجرة بأكملها إذا كانت قريبة من القمة. هناك طرق لحل هذه المشكلة. على سبيل المثال ، يمكنك بناء الشجرة على عينات متعددة وتجميعها وفقًا لمتوسط (أو تصويت) ؛ هذا يسمى إعادة التشكيل. ومع ذلك ، فإنه يؤدي إلى مجموعة أخرى من المشاكل لأنه يقلل من قابلية قراءة النموذج بجعله أكثر تعقيدًا. لذلك ، من خلال إعادة التشكيل ، يمكنك التخلص من أفضل صفات أشجار القرار. لماذا هي المشكلة؟ افترض أن متغيرًا واحدًا يحتوي على جميع صفات مجموعة معينة ، ولكنه يتمتع أيضًا بالنوعية التي تنقسم وفقًا لها الشجرة. في هذه الحالة ، ستضعها الشجرة في فئة خاطئة لمجرد أنها تتمتع بهذه الخاصية المهمة.
- تعتمد جميع العقد الخاصة بمستوى معين في شجرة القرار على العقد الموجودة في مستوياتها السابقة. بمعنى آخر ، تعتمد كيفية تعريفك للعقد على المستوى "n +1" كليًا على تعريفك للعقد على المستوى "n". إذا كان تعريفك في المستوى 'n' خاطئًا ، فستكون جميع المستويات اللاحقة والعقد الموجودة في تلك المستويات خاطئة أيضًا.
تعلم: الانحدار الخطي في التعلم الآلي

شجرة القرار في R (مثال)
ستحتاج إلى rpart لبناء شجرة قرار في R. نحن نستخدم rpart للتصنيف. في R ، تقوم ببناء شجرة قرار على أساس خوارزمية التقسيم العودية التي تولد القرار ، ومعها ، أشجار الانحدار. تتكون من خطوتين:
- أولاً ، سيحدد المتغير الذي يقسم البيانات إلى مجموعتين منفصلتين بأفضل طريقة ممكنة.
- ثانيًا ، ستكرر العملية في الخطوة السابقة في كل مجموعة فرعية حتى تصل تلك المجموعات إلى حجم معين أو إذا لم يعد بإمكانها إجراء تحسينات في تلك المجموعات الفرعية بعد الآن.
لدينا البيانات التالية كمثال:
في البيانات أعلاه ، لديك وقت وتسارع الدراجة. علينا أن نتوقع تسارعه حسب الوقت. سنفعل ذلك من خلال القيام بما يلي:
1 مكتبة (rpart)
ثم قم بتحميل البيانات:
1data (دراجة)
الآن ، سننشئ مخطط مبعثر:
1 قطعة (تسريع ~ مرات ، بيانات = دراجة)
مرة واحدة ، لقد فعلنا ذلك ، وسننشئ الشجرة:
1mct <- rpart (تسريع ~ مرات ، بيانات = دراجة)
خطوتنا الأخيرة هي رسم الرسم البياني:
1 قطعة (mct)
قراءة: كيف تصنع شجرة قرار مثالية؟
افكار اخيرة
لدينا الآن نموذج عمل مثالي لشجرة القرار في R. يمكنك العثور على المزيد من البرامج التعليمية المماثلة على مدونتنا.
إذا كنت مهتمًا بمعرفة المزيد عن أشجار القرار ، والتعلم الآلي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، حالة خريجي IIIT-B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع كبرى الشركات.
ما هي أهم ميزة في خوارزمية شجرة القرار؟
تعد خوارزميات شجرة القرار أداة قيمة لتحليل الحسم والمخاطر وغالبًا ما يتم التعبير عنها كرسم بياني أو قائمة قواعد. تعد بساطة استخدام خوارزميات شجرة القرار إحدى أهم خصائصها. فهي سهلة الفهم وذات صلة لأنها مرئية. حتى إذا لم يكن المستخدمون على دراية ببناء خوارزميات شجرة القرار ، فيمكنهم تطبيقها بنجاح. يتم استخدام خوارزميات شجرة القرار بشكل شائع لتوقع الأحداث المستقبلية بناءً على الخبرة السابقة والمساعدة في اتخاذ القرار العقلاني. مجال آخر مهم لخوارزميات شجرة القرار هو استخراج البيانات ، حيث يتم استخدام أشجار القرار كأداة تصنيف ونمذجة ، كما هو موضح أكثر أدناه.
ما مدى أهمية خوارزمية شجرة القرار؟
تتمتع خوارزمية شجرة القرار بميزة مهمة تتمثل في فرض تحليل جميع النتائج التي يمكن تصورها لقرار ما وتتبع كل مسار للوصول إلى نتيجة. يولد دراسة مفصلة عن الآثار المترتبة على كل فرع ويشير إلى عقد القرار التي تتطلب مزيدًا من التحقيق. أيضًا ، يتم تعيين قيمة فريدة لكل صعوبة ومسار القرار والنتيجة بواسطة خوارزميات شجرة القرار. تسلط هذه الطريقة الضوء على طرق اتخاذ القرار المهمة ، وتقلل من عدم اليقين ، وتزيل الغموض ، وتوضح الآثار المالية لمسارات العمل البديلة. عندما لا تتوفر المعلومات الواقعية ، يمكن للمستخدمين استخدام خوارزميات شجرة القرار لوضع الخيارات في منظور مع بعضها البعض لإجراء مقارنات بسيطة باستخدام احتمالات الظروف.
تعتمد خوارزمية شجرة القرار على أي تقنية؟
تعتمد خوارزمية شجرة القرار على تقنية شجرة القرار ، والتي يمكن استخدامها في مسائل التصنيف والانحدار. يشير الاسم إلى استخدام بنية شجرية تشبه المخطط الانسيابي لعرض التوقعات الناتجة عن سلسلة من الانقسامات القائمة على الميزات. يبدأ بعقدة جذر وينتهي بقرار أوراق الشجر. تتكون شجرة القرار من ثلاثة أنواع من العقد ، أي المربعات التي تمثل عادةً عقد القرار ، وعقد الفرصة التي يتم تصويرها عادةً في الدوائر ، والمثلثات التي ترمز إلى العقد النهائية.