مقدمة في خوارزمية Random Forest: الوظائف والتطبيقات والفوائد

نشرت: 2020-12-17

Random Forest هي خوارزمية ذكاء اصطناعي سائدة لها مكان مع إستراتيجية التعلم المنظمة. يمكن استخدامه لكل من قضايا التصنيف والانحدار في ML. يعتمد ذلك على فكرة التعلم الجماعي ، وهي عبارة عن دورة من الانضمام إلى العديد من المصنفات لمعالجة مشكلة معقدة ولتحسين عرض النموذج.

كما يوحي الاسم ، "Random Forest هو مصنف يحتوي على أشجار قرار مختلفة على مجموعات فرعية مختلفة من مجموعة البيانات المحددة ويأخذ النموذج النموذجي لتحسين الدقة الإدراكية لمجموعة البيانات."

بدلاً من الاعتماد على شجرة قرار واحدة ، تأخذ الغابة العشوائية الشكل من كل شجرة وتخضعها لأكبر عدد من أصوات الرغبات ، وتتوقع العائد الأخير. يؤدي العدد الأكثر وضوحًا للأشجار في الغابة إلى دقة أعلى ويمنع مشكلة الإفراط في التجهيز.

جدول المحتويات

افتراضات الغابة العشوائية

نظرًا لأن الغابة العشوائية تدمج العديد من الأشجار لتوقع فئة مجموعة البيانات ، فمن المتصور أن بعض أشجار الاختيار قد تتوقع العائد الصحيح ، بينما قد لا تتوقع أخرى. ومع ذلك ، فإن جميع الأشجار معًا تتوقع المحصول المناسب. بهذه الطريقة ، يوجد أدناه افتراضان لمصنف غابة عشوائي متفوق:

  • يجب أن تكون هناك بعض الصفات الحقيقية في المتغير المكون لمجموعة البيانات بهدف أن المصنف يمكن أن يتوقع نتائج دقيقة بدلاً من نتيجة متوقعة.
  • يجب أن تحتوي التوقعات من كل شجرة على اتصالات منخفضة.

قراءة: أسئلة مقابلة شجرة القرار

لماذا تستخدم Random Forest؟

فيما يلي بعض النقاط التي توضح سبب استخدامنا لخوارزمية الغابة العشوائية :

  • يتطلب بعض الاستثمار عند مقارنته بخوارزميات مختلفة.
  • إنه يتوقع العائد بدقة عالية ، على أي حال ، لمجموعة البيانات الضخمة التي يتم تشغيلها بشكل منتج.
  • يمكنه أيضًا الحفاظ على الدقة عند غياب قدر كبير من المعلومات.

مصنف مقابل. رجس

يعمل مصنف الغابة العشوائية مع المعلومات التي تحتوي على علامات منفصلة أو تسمى أيضًا فئة.

مثال: مريض يعاني من نمو خبيث أم لا ، الفرد مؤهل للحصول على ائتمان أم لا ، وهكذا دواليك.

يعمل الانحدار العشوائي للغابات مع المعلومات التي لها عائد رقمي أو غير متقطع ، ولا يمكن للفئات وصفها.

مثال: تكلفة المنازل ، إنتاج حليب الأبقار ، الراتب الإجمالي للمنظمات ، وما إلى ذلك.

كيف تعمل خوارزمية الغابة العشوائية؟

تعمل الغابة العشوائية على مرحلتين ؛ في البداية ، يكون الهدف هو إنشاء الغابة العشوائية من خلال الانضمام إلى أشجار الاختيار N ، والثاني هو عمل توقعات لكل شجرة تم إنشاؤها في المرحلة الرئيسية.

يمكن توضيح دورة العمل في الخطوات والرسم البياني أدناه:

الخطوة 1 : حدد معلومات K عشوائية تركز على مجموعة التحضير.

الخطوة 2 : قم ببناء أشجار الاختيار المتعلقة بتركيز المعلومات المختارة (المجموعات الفرعية).

الخطوة 3 : اختر الرقم N لأشجار الاختيار التي تريد تصنيعها.

الخطوة 4: كرر الخطوتين 1 و 2.

الخطوة 5 : للحصول على نقاط تركيز معلومات جديدة ، اكتشف تنبؤات كل شجرة اختيار ، وخصص المعلومات الجديدة التي تركز على الفصل الذي يخلف الجزء الأكبر الذي يدلي بصوته.

مثال: افترض أن هناك مجموعة بيانات تحتوي على العديد من صور المنتجات العضوية. على طول هذه الأسطر ، يتم إعطاء مجموعة البيانات هذه لمصنف الغابة العشوائي. يتم تقسيم مجموعة البيانات إلى مجموعات فرعية وتعطى لكل شجرة اختيار.

أثناء مرحلة التحضير ، تُنشئ كل شجرة اختيار نتيجة تنبؤ. عندما تحدث نقطة معلومات أخرى ، في تلك المرحلة ، اعتمادًا على معظم النتائج ، يتنبأ المصنف العشوائي للغابات باستنتاج رسمي. تأمل الصورة التالية:

اقرأ أيضًا: أنواع خوارزمية التصنيف

استخدامات الغابة العشوائية

هناك أربع مناطق تستخدم فيها الغابة العشوائية بشكل عام:

  • البنوك : تستخدم المنطقة المصرفية بشكل عام هذه الخوارزمية للإثبات المميز لمخاطر الائتمان.
  • الأدوية: بمساعدة هذه الخوارزمية ، يمكن التعرف على أنماط المرض ومخاطره.
  • استخدام الأراضي: يمكننا التعرف على مناطق استخدام الأراضي المقارن بواسطة هذه الخوارزمية.
  • الترويج: يمكن التعرف على أنماط التسويق من خلال استخدام هذه الخوارزمية.

فوائد الغابة العشوائية

  • إنه يتغلب على مشكلة فرط التخصيص من خلال حساب متوسط ​​أو الانضمام إلى عواقب أشجار الاختيار المختلفة.
  • تعمل الغابات العشوائية بشكل مثير للإعجاب للحصول على نطاق هائل من المعلومات أكثر مما تفعله شجرة الاختيار المنفردة.
  • الغابة العشوائية لديها تغير أقل في تلك النقطة من شجرة اختيار واحدة.
  • الغابات العشوائية قابلة للتكيف حقًا ولها دقة عالية.
  • لا يحتاج تحجيم المعلومات إلى خوارزمية مجموعة عشوائية . إنها تحافظ على دقة عالية حتى بعد إعطاء المعلومات دون توسيع نطاقها.
  • تحافظ خوارزميات الغابة العشوائية على دقة مذهلة ، حتى أن درجة هائلة من البيانات مفقودة.

عيوب نقاط Random Forest

  • تم تجهيز Random Forest لأداء مهام التصنيف والانحدار.
  • وهي مجهزة للعناية بمجموعات البيانات الضخمة ذات الأبعاد العالية.
  • يقوم بترقية دقة النموذج ويمنع مشكلة التجاوز.
  • الطبيعة متعددة الأوجه هي الضرر الأساسي لخوارزميات الغابة العشوائية .
  • إن تطوير الغابات العشوائية أصعب بكثير وممل من اختيار الأشجار.
  • هناك حاجة إلى المزيد من الأصول الحسابية لتحقيق خوارزمية الغابة العشوائية .
  • إنها أقل غريزية في حالة أنه عندما يكون لدينا تشكيلة هائلة من الأشجار المختارة.
  • دورة التوقع باستخدام الغابات العشوائية مملة للغاية في الفحص باستخدام خوارزميات مختلفة.

ضعف الغابة العشوائية

على الرغم من أنه يمكن استخدام الغابة العشوائية لكل من تخصيصات التوصيف والانتكاس ، إلا أنها ليست أكثر ملاءمة لمهام الانحدار.

خاتمة

تعمل الغابة العشوائية بشكل مثير للإعجاب عندما نحاول تجنب الإفراط في بناء شجرة اختيار. وبالمثل ، فإنه يعمل بشكل جيد عندما تحتوي المعلومات على عوامل واضحة المعالم. يمكن أن تتغلب الخوارزميات المختلفة مثل الانتكاس الاستراتيجي فيما يتعلق بالعوامل الرقمية ، ولكن عندما يتعلق الأمر بالاستقرار على خيار يعتمد على الظروف ، فإن الغابة العشوائية هي القرار المثالي.

يعتمد على المحقق للعبث بالحدود لتحسين الدقة. غالبًا ما يكون هناك احتمال أقل للإفراط في التجهيز لأنه يستخدم منهجية قائمة على المعيار. ومع ذلك ، مرة أخرى ، يعتمد على المعلومات والفاحص لاختيار أفضل خوارزمية.

إذا كنت مهتمًا بمعرفة المزيد حول شجرة القرار ، التعلم الآلي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة و المهام ، وحالة خريجي IIIT-B ، وأكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع كبرى الشركات.

س 1. لماذا تحليل المشاعر مهم؟

تحليل المشاعر هو ممارسة مراقبة وتحليل الرسائل النصية لاكتشاف المشاعر الأساسية المعبر عنها ، سواء كانت إيجابية أو محايدة أو سلبية. يمكن لبرنامج تحليل المشاعر معالجة البيانات الواردة تلقائيًا لتحليل وتحديد الشعور. يعد تحليل المشاعر أمرًا بالغ الأهمية ويساعد الشركات في مختلف الجوانب ، بدءًا من المراقبة الفعالة لوسائل التواصل الاجتماعي وفهم ملاحظات العملاء إلى تحسين دعم العملاء وإدارة السمعة. ويمكنه أيضًا مساعدة الشركات في إجراء تحليل دقيق للمنتج بالإضافة إلى أبحاث السوق والتنافسية. علاوة على ذلك ، فهي أداة أساسية لقياس صوت العملاء وصوت الموظفين ، وهي مفاتيح البقاء على قيد الحياة في بيئة أعمال شديدة التنافسية.

س 2. ما هو تحليل المشاعر من حيث التعلم الآلي؟

في التعلم الآلي ، يمكنك اعتبار تحليل المشاعر كأداة يمكن أن تساعد في تحليل النصوص لتحديد قطبيتها ، سواء كانت إيجابية أو سلبية. يمكن الآن تدريب أجهزة الكمبيوتر على فهم المشاعر الأساسية في النصوص دون الحاجة إلى تدخل بشري باستخدام خوارزميات التعلم الآلي. في الواقع ، يتم الآن استخدام نماذج تحليل المشاعر للقراءة بما يتجاوز التعريفات النصية فقط ؛ يمكن لهذه الآن اكتشاف السياق والنبرة والسخرية وكذلك اكتشاف الكلمات التي تم إساءة استخدامها. يستخدم التعلم الآلي خوارزميات معقدة لتدريب أجهزة الكمبيوتر على تحليل المشاعر ، مثل نظرية Naive Bayes و Support Vector Machines (SVM) والانحدار الخطي والمزيد.

س 3. هل تحليل المشاعر هو نفسه معالجة اللغات الطبيعية؟

تحليل المشاعر هو تقنية معالجة اللغة الطبيعية (NLP) المستخدمة لتحديد ما إذا كانت المشاعر الأساسية للبيانات النصية إيجابية أو محايدة أو سلبية. هناك أنواع مختلفة من تحليل المشاعر التي يمكن استخدامها للتركيز ليس فقط على القطبية (الإيجابية ، السلبية) ولكن أيضًا على المشاعر (السعادة ، الغضب ، الحزن) ، النوايا (غير مهتم ، مهتم) ، والإلحاح (غير عاجل ، عاجل) . في الأساس ، إنها أداة لقياس أو تفسير ملاحظات العملاء عبر الإنترنت والاستفسارات والوظائف بناءً على خوارزميات البرمجة اللغوية العصبية المتطورة وخوارزميات التعلم الآلي. تساعد هذه الخوارزميات أدوات تحليل المشاعر تلقائيًا في فهم المشاعر الكامنة وراء المحادثات عبر الإنترنت.