شرح شجرة القرار في التعلم الآلي [مع أمثلة]

نشرت: 2020-12-21

مقدمة

يعتبر تعلم شجرة القرار أسلوبًا سائدًا لاستخراج البيانات وهو شكل من أشكال التعلم الآلي الخاضع للإشراف. تشبه شجرة القرار الرسم التخطيطي الذي يستخدمه الأشخاص في تمثيل احتمالية إحصائية أو العثور على مسار الحدث أو الإجراء أو النتيجة. يجعل مثال شجرة القرار فهم المفهوم أكثر وضوحًا.

تُظهر الفروع الموجودة في الرسم التخطيطي لشجرة القرار النتيجة المحتملة أو القرار المحتمل أو رد الفعل. يعرض الفرع الموجود في نهاية شجرة القرار التنبؤ أو النتيجة. تُستخدم أشجار القرار عادةً لإيجاد حل لمشكلة يتعقد حلها يدويًا. دعونا نفهم هذا بالتفصيل بمساعدة بعض أمثلة شجرة القرار.

تعد شجرة القرار واحدة من الأدوات الشائعة والفعالة المستخدمة للتنبؤ بالبيانات أو الأحداث وتصنيفها. إنه مثل مخطط انسيابي ولكن له هيكل شجرة. تمثل العقد الداخلية للأشجار اختبارًا أو سؤالًا حول سمة ؛ كل فرع هو النتيجة المحتملة للسؤال المطروح ، والعقدة الطرفية ، والتي تسمى أيضًا عقدة ورقية ، تشير إلى تسمية فئة.

في شجرة القرار ، لدينا العديد من متغيرات التوقع. اعتمادًا على متغيرات التوقع هذه ، حاول التنبؤ بما يسمى متغير الاستجابة.

قراءة ذات صلة: تصنيف شجرة القرار: كل ما تحتاج إلى معرفته

شجرة القرار في ML

من خلال تمثيل بضع خطوات في شكل تسلسل ، تصبح شجرة القرار طريقة سهلة وفعالة لفهم وتصور خيارات القرار المحتملة والنتائج المحتملة من النطاق. تساعد أشجار القرار أيضًا في تحديد الخيارات الممكنة ووزن المكافآت والمخاطر مقابل كل مسار عمل يمكن تحقيقه.

يتم نشر شجرة القرار في العديد من المؤسسات الصغيرة وكذلك الكبيرة الحجم كنوع من نظام الدعم في اتخاذ القرارات. نظرًا لأن مثال شجرة القرار هو نموذج منظم ، يمكن للقراء فهم المخطط وتحليل كيف ولماذا قد يؤدي خيار معين إلى قرار مطابق. كما يسمح مثال شجرة القرار للقارئ بالتنبؤ والحصول على العديد من الحلول الممكنة لمشكلة واحدة ، وفهم التنسيق ، والعلاقة بين الأحداث والبيانات المختلفة مع القرار.

كل نتيجة في الشجرة لها رقم أو وزن للمكافأة والمخاطر. إذا استخدمت شجرة قرار في أي وقت ، فستحصل على كل نتيجة نهائية مع عيب ومزايا محتملة. لإنهاء شجرتك بشكل صحيح ، يمكنك تمديدها لفترة قصيرة أو طويلة حسب الحاجة اعتمادًا على الحدث وكمية البيانات. دعونا نأخذ مثالًا بسيطًا لشجرة قرارات لفهمها بشكل أفضل.

ضع في اعتبارك البيانات المعطاة التي تتكون من تفاصيل الأشخاص مثل: ما إذا كانوا يشربون ، أو مدخنين ، ووزنهم ، والعمر الذي مات فيه هؤلاء الأشخاص.

اسم شارب المدخن وزن العمر (مات)
سام نعم نعم 120 44
ماري رقم رقم 70 96
جوناس نعم رقم 72 88
تايلور نعم نعم 55 52
جو رقم نعم 94 56
هاري رقم رقم 62 93

دعونا نحاول التكهن بما إذا كان الناس سيموتون في سن أصغر أو في سن أكبر. ستعمل الخصائص مثل الشارب والمدخن والوزن كقيمة تنبؤية. باستخدام هذه ، سننظر في العمر كمتغير استجابة.

دعونا نسمي أن الأشخاص الذين ماتوا قبل سن السبعين ماتوا "صغارًا" والأشخاص الذين ماتوا بعد سن السبعين ماتوا "كبار السن". دعونا الآن نتوقع متغير الاستجابة بناءً على متغير التوقع. فيما يلي شجرة قرار تم إجراؤها بعد تعلم البيانات.

توضح شجرة القرار أعلاه أنه إذا كان الشخص مدخنًا ، فإنه يموت صغيرًا. إذا لم يكن الشخص مدخنًا ، فإن العامل التالي الذي يؤخذ في الاعتبار هو ما إذا كان الشخص يشرب أم لا. من لم يكن مدخنا وليس شارب يموت كبير السن.

إذا كان الإنسان غير مدخن وشارب فيحسب وزنه. إذا لم يكن الإنسان مدخناً ، وكان يشرب ، ووزنه أقل من 90 كيلوغراماً ، فإن الشخص يموت كبير السن. وأخيرًا ، إذا لم يكن الشخص مدخنًا وشاربًا ووزنه فوق 90 ​​كجم ، فإنه يموت صغيرًا.

من البيانات المقدمة ، لنأخذ مثال Jonas للتحقق مما إذا كانت شجرة القرار مصنفة بشكل صحيح وما إذا كانت تتنبأ بمتغير الاستجابة بشكل صحيح. جوناس ليس مدخنًا وشاربًا ويزن أقل من 90 كجم. وفقًا لشجرة القرار ، سيموت شيخًا (العمر الذي يموت فيه> 70). أيضًا ، وفقًا للبيانات ، توفي عندما كان يبلغ من العمر 88 عامًا ، وهذا يعني أنه تم تصنيف مثال شجرة القرار بشكل صحيح وعمل بشكل مثالي.

لكن هل تساءلت يومًا عن الفكرة الأساسية وراء عمل شجرة القرار؟ في شجرة القرار ، يتم تقسيم مجموعة المثيلات إلى مجموعات فرعية بطريقة تجعل التباين في كل مجموعة فرعية أصغر. أي أننا نريد تقليل الانتروبيا ، وبالتالي ، يتم تقليل التباين ومحاولة جعل الحدث أو المثيل نقيًا.

دعونا ننظر في مثال شجرة قرار مماثل . أولاً ، ننظر فيما إذا كان الشخص مدخنًا أم لا.

هنا ، نحن غير متأكدين بشأن غير المدخنين. لذلك ، قمنا بتقسيمها إلى شارب وغير شارب.

يمكننا أن نرى من الرسم البياني أدناه أننا انتقلنا من إنتروبيا عالية لها تباين كبير إلى اختزالها إلى فئة أصغر نحن أكثر يقينًا بشأنها. بهذه الطريقة ، يمكنك بناء أي مثال لشجرة قرارات بشكل تدريجي .

دعونا نبني شجرة قرار باستخدام خوارزمية ID3. ما هو أكثر أهمية في شجرة القرار هو الفهم القوي للإنتروبيا. الانتروبيا ليست سوى درجة عدم اليقين. تعطى من قبل:

(في بعض الأحيان ، يُشار إليه أيضًا بالحرف "E")

إذا طبقناه على المثال أعلاه ، فسيتم تطبيقه على النحو التالي:

ضع في اعتبارك الحالة عندما لا يكون لدينا أشخاص مقسمون إلى أي فئة. إنه سيناريو أسوأ حالة (إنتروبيا عالية) عندما يكون لكلا النوعين من الناس نفس المقدار. النسبة هنا 3: 3.

وبالمثل ، بالنسبة للأشخاص الذين لا يشربون ، يكون لديهم نسبة 1: 1 ويكون الانتروبيا 1. وبالتالي ، فإنه يحتاج إلى مزيد من الانقسام بسبب عدم اليقين. بالنسبة للأشخاص الذين لا يشربون ، تكون النسبة 2: 0. ومن ثم ، فإن الانتروبيا هي 0.

الآن ، قمنا بحساب الانتروبيا للحالات المختلفة ، وبالتالي ، يمكننا حساب المتوسط ​​المرجح للحالات نفسها.

بالنسبة للفرع الأول ، E = 6 6 1 = 1

بالنسبة لفئة المدخن ، E = 2 6 0 + 4 6 0.811 = 0.54

بالنسبة لفئة المدخن والشارب ، E = 2 6 0 + 2 6 1 + 2 6 0 = 0.33

سيساعدك الرسم البياني أدناه في فهم الحسابات المذكورة أعلاه بسرعة.

أخيرًا ، اكتساب المعلومات:

فصل غير قادر علي كسب المعلومات (E2-E1)
الناس 1 0.46
المدخن 0.54 0.21
مدخن + شارب 0.33 -

اقرأ أيضًا: أسئلة وأجوبة مقابلة شجرة القرار

خاتمة

لقد درسنا بنجاح أشجار القرار بعمق من النظرية إلى نموذج شجرة القرار العملي هـ. قمنا أيضًا ببناء شجرة قرار باستخدام خوارزمية ID3. إذا وجدت هذا مثيرًا للاهتمام ، فقد تحب استكشاف علم البيانات بالتفصيل.

إذا كنت مهتمًا بمعرفة المزيد عن أشجار القرار ، والتعلم الآلي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، حالة خريجي IIIT-B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع كبرى الشركات.

ما هي أشجار القرار؟

تُستخدم أشجار القرار لتنظيم معلومات اتخاذ القرار وتنظيمها بشكل مرئي. يتم رسم الأشجار بحيث يكون الجذر في الأعلى والأوراق في الأسفل. تتم قراءة أشجار القرار من الأسفل إلى الأعلى ، والانتقال من اليسار إلى اليمين. يعد كل مستوى من مستويات الشجرة أساسًا لمزيد من الاختبارات وستعمل القرارات على كل مستوى على تضييق النطاق حتى يتم الرد على السؤال. تقسم شجرة القرار المشكلة أو القرار إلى قرارات فرعية متعددة وتتبع المسار المنطقي إلى الجذر ، وهو الهدف الأساسي. تُستخدم أشجار القرار لتحليل بيئة الأعمال ، ولتحديد الأولويات ولتقديم نظرة ثاقبة ، من أجل اتخاذ قرارات بشأن الاتجاه الذي يجب اتخاذه.

ما هي المشكلات في تعلم شجرة القرار في التعلم الآلي؟

يمكن استخدام أشجار القرار كأساس لاختبار استراتيجيات جديدة أو لشرح الاستراتيجيات للآخرين. تشرح شجرة القرار ما سيحدث في ظل مجموعة معينة من الافتراضات. يمكن استخدامها أيضًا لتقييم أداء استراتيجية تم استخدامها في الماضي. من المعروف أن أشجار القرار معرضة جدًا للأخطاء بسبب جميع فروعها. لا تكون أشجار القرار دقيقة دائمًا لأنها ، في بعض الأحيان ، لا تأخذ في الاعتبار جميع المتغيرات المحتملة ، وقد لا يكون الشخص الذي يقوم بتحليل شجرة القرار من ذوي الخبرة في جميع جوانب الموقف المعين.

ما نوع البيانات الأفضل لأشجار القرار؟

تساعدك أشجار القرار في العثور على أنماط في البيانات باستخدام مخطط انسيابي مثل البنية. أفضل نوع من البيانات سيكون نوعيًا وقطعيًا وعدديًا. بالرغم من أن أشجار القرار تعمل مع جميع أنواع البيانات ، إلا أنها تعمل بشكل أفضل مع البيانات الرقمية. يجب أن يكونوا قادرين على الحصول على قيم عبارة عن أرقام أو يجب أن تكون هناك طريقة لترجمتها إلى أرقام. تعتمد أشجار القرار اعتمادًا كبيرًا على نوع البيانات بالإضافة إلى الكمية. إذا كان عدد نقاط البيانات أكثر من 100 ، فستكون أشجار القرار نموذجًا جيدًا.