تعزيز التعلم الآلي: ما هو ، الوظائف ، الأنواع والميزات
نشرت: 2020-05-29يعد تعزيز التعلم الآلي موضوعًا مهمًا. يشعر العديد من المحللين بالارتباك حول معنى هذا المصطلح. لهذا السبب ، في هذه المقالة ، سنكتشف المقصود بتعزيز التعلم الآلي وكيف يعمل. التعزيز يساعد نماذج ML في تحسين دقة التنبؤ. دعونا نناقش هذه الخوارزمية بالتفصيل:
جدول المحتويات
ما هو التعزيز في التعلم الآلي؟
قبل أن نناقش " تعزيز التعلم الآلي " ، يجب أن نفكر أولاً في تعريف هذا المصطلح. التعزيز يعني "التشجيع أو المساعدة في تحسين شيء ما". يؤدي تعزيز التعلم الآلي إلى نفس الشيء تمامًا لأنه يمكّن نماذج التعلم الآلي ويعزز دقتها. لهذا السبب ، إنها خوارزمية شائعة في علم البيانات.
يشير التعزيز في ML إلى الخوارزميات التي تحول نماذج التعلم الضعيفة إلى نماذج قوية. لنفترض أنه يتعين علينا تصنيف رسائل البريد الإلكتروني في فئتي "البريد العشوائي" و "ليست بريدًا عشوائيًا". يمكننا اتباع النهج التالي لعمل هذه الفروق:
- إذا كان البريد الإلكتروني يحتوي على ملف صورة واحد فقط ، فهو بريد عشوائي (لأن الصورة عادةً ما تكون ترويجية)
- إذا كان البريد الإلكتروني يحتوي على عبارة مشابهة لـ "لقد فزت في يانصيب" ، فهذا يعد بريدًا عشوائيًا.
- إذا كان البريد الإلكتروني يحتوي فقط على مجموعة من الروابط ، فهو بريد عشوائي.
- إذا كان البريد الإلكتروني من مصدر موجود في قائمة جهات الاتصال الخاصة بنا ، فهو ليس بريدًا عشوائيًا.
الآن ، على الرغم من أن لدينا قواعد التصنيف ، هل تعتقد أنها قوية بما يكفي بشكل فردي لتحديد ما إذا كان البريد الإلكتروني بريدًا عشوائيًا أم لا؟ هم ليسوا. على أساس فردي ، هذه القواعد ضعيفة وليست كافية لتصنيف البريد الإلكتروني في "ليست بريدًا عشوائيًا" أو "بريد عشوائي". سنحتاج إلى جعلها أقوى ، ويمكننا فعل ذلك باستخدام متوسط مرجح أو النظر في توقع التصويت الأعلى.
لذلك ، في هذه الحالة ، لدينا خمسة مصنفات ، من بينها ثلاثة مصنفات تحدد البريد الإلكتروني كـ "بريد عشوائي" ، لذلك ، سنعتبر البريد الإلكتروني "بريدًا عشوائيًا" افتراضيًا ، لأن هذه الفئة لديها تصويت أعلى من "ليس بريدًا عشوائيًا" الفئة.
كان هذا المثال لإعطائك فكرة عن ماهية الخوارزميات المعززة. هم أكثر تعقيدا من هذا.

ألقِ نظرة على: 25 سؤالاً وأجوبة مقابلة تعلم الآلة
كيف يعملون؟
أوضح لنا المثال أعلاه أن التعزيز يجمع بين المتعلمين الضعفاء لتشكيل قواعد صارمة. لذا ، كيف يمكنك تحديد هذه القواعد الضعيفة؟ للعثور على قاعدة غير مؤكدة ، سيتعين عليك استخدام خوارزميات التعلم القائم على المثيل. عندما تقوم بتطبيق خوارزمية تعلم أساسية ، فإنها ستنتج قاعدة تنبؤ ضعيفة. ستكرر هذه العملية لعدة مرات ، ومع كل تكرار ، ستجمع خوارزمية التعزيز القواعد الضعيفة لتشكيل قاعدة قوية.
تختار خوارزمية التعزيز التوزيع الصحيح لكل تكرار من خلال عدة خطوات. أولاً ، سيأخذ كل التخصيصات المختلفة ويعين لها وزنًا متساويًا. إذا ارتكبت خوارزمية التعلم الأساسية الأولى خطأً ، فستضيف المزيد من الأهمية إلى تلك الملاحظات. بعد تحديد الوزن ننتقل إلى الخطوة التالية.
في هذه الخطوة ، سنستمر في تكرار العملية حتى نزيد من دقة الخوارزمية. سنجمع بعد ذلك مخرجات المتعلمين الضعفاء وننشئ ناتجًا قويًا من شأنه تمكين نموذجنا ومساعدته في عمل تنبؤات أفضل. تركز خوارزمية التعزيز بشكل أكبر على الافتراضات التي تسبب أخطاء كبيرة بسبب قواعدها الضعيفة.
مزيد من المعلومات: 5 تطبيقات متطورة للتعلم الآلي
أنواع مختلفة من خوارزميات التعزيز
يمكن أن تستخدم خوارزميات التعزيز أنواعًا عديدة من المحركات الأساسية ، بما في ذلك معززات الهامش وطوابع القرار وغيرها. بشكل أساسي ، هناك ثلاثة أنواع من خوارزميات تعزيز التعلم الآلي:
- تعزيز التكيف (المعروف أيضًا باسم AdaBoosta)
- تعزيز التدرج
- XGBoost
سنناقش الأولين ، AdaBoost و Gradient Boosting ، لفترة وجيزة في هذه المقالة. XGBoost هو موضوع أكثر تعقيدًا ، سنناقشه في مقال آخر.
1. التعزيز التكيفي
افترض أن لديك صندوقًا به خمس إيجابيات وخمس سلبيات. مهمتك هي تصنيفهم ووضعهم في جداول مختلفة.
في التكرار الأول ، تقوم بتعيين أوزان متساوية لكل نقطة بيانات وتطبق جذع قرار في المربع. ومع ذلك ، لا يفصل الخط سوى إيجابيتين عن المجموعة ، ويبقى الآخرون معًا. فشل قرارك (وهو الخط الذي يمر عبر المربع المفترض) ، في التنبؤ بجميع نقاط البيانات بشكل صحيح وقد وضع ثلاث إيجابيات مع السلبيات.

في التكرار التالي ، نضع وزناً أكبر للإيجابيات الثلاثة التي فاتناها سابقًا ؛ لكن هذه المرة ، يفصل القرار دقيقتين فقط عن المجموعة. سنعطي وزناً أكبر للسلبيات التي فاتناها في هذا التكرار ونكرر العملية. بعد تكرار واحد أو مرتين ، يمكننا دمج عدد قليل من هذه النتائج لإنتاج قاعدة تنبؤ واحدة صارمة.
AdaBoost يعمل تمامًا مثل هذا. يتنبأ أولاً باستخدام البيانات الأصلية ويعطي وزناً متساوياً لكل نقطة. ثم يولي أهمية أكبر للملاحظات التي يفشل المتعلم الأول في التنبؤ بها بشكل صحيح. يكرر العملية حتى تصل إلى حد في دقة النموذج.
يمكنك استخدام طوابع القرار بالإضافة إلى خوارزميات التعلم الآلي الأخرى باستخدام Adaboost.
فيما يلي مثال على AdaBoost في Python:
من sklearn.ensemble استيراد AdaBoostClassifier
من sklearn.datasets استيراد make_classification
X، Y = make_classification (n_samples = 100، n_features = 2، n_informative = 2،
n_redundant = 0، n_repeated = 0، random_state = 102)
clf = AdaBoostClassifier (n_estimators = 4، random_state = 0 ، الخوارزمية = 'SAMME')
clf.fit (X، Y)
2. تعزيز التدرج
يستخدم تعزيز التدرج طريقة نزول التدرج لتقليل وظيفة الخسارة للعملية بأكملها. نزول التدرج هو خوارزمية تحسين من الدرجة الأولى تجد الحد الأدنى المحلي لوظيفة (دالة قابلة للتفاضل). يعمل تعزيز التدرج على تدريب نماذج متعددة بالتسلسل ، ويمكن أن يتناسب مع النماذج الجديدة للحصول على تقدير أفضل للاستجابة.
إنه يبني متعلمين أساسيين جدد يمكنهم الارتباط بالتدرج اللوني السلبي لوظيفة الخسارة والمتصلين بالنظام بأكمله. في Python ، سيتعين عليك استخدام Gradient Tree Boosting (المعروف أيضًا باسم GBRT). يمكنك استخدامه للتصنيف وكذلك مشاكل الانحدار.
فيما يلي مثال على تعزيز التدرج الشجري في بايثون:
من sklearn.ensemble استيراد GradientBoostingRegressor
النموذج = GradientBoostingRegressor (n_estimators = 3 ، Learning_rate = 1)
model.fit (X، Y)
# للتصنيف
من sklearn.ensemble استيراد GradientBoostingClassifier
النموذج = GradientBoostingClassifier ()

model.fit (X، Y)
ميزات التعزيز في التعلم الآلي
يوفر التعزيز العديد من المزايا ، ومثل أي خوارزمية أخرى ، له حدوده أيضًا:
- تفسير تنبؤات التعزيز أمر طبيعي تمامًا لأنه نموذج جماعي.
- يختار الميزات ضمنيًا ، وهي ميزة أخرى لهذه الخوارزمية.
- تعد قوة التنبؤ الخاصة بخوارزميات التعزيز أكثر موثوقية من أشجار القرار والتعبئة.
- إن زيادتها أمر صعب إلى حد ما لأن كل مقدر في التعزيز يعتمد على المقدرات السابقة.
اقرأ أيضًا: أفكار مشروع التعلم الآلي للمبتدئين
أين أذهب من هنا؟
نأمل أن تكون قد وجدت هذه المقالة حول التعزيز مفيدة. أولاً ، ناقشنا ماهية هذه الخوارزمية وكيف تحل مشاكل التعلم الآلي. ثم ألقينا نظرة على طريقة عملها وكيفية عملها.
كما ناقشنا أنواعها المختلفة. اكتشفنا AdaBoost و Gradient Boosting أثناء مشاركة الأمثلة أيضًا. إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.
كيف يمكنني تحديد التعزيز في التعلم الآلي بعبارات بسيطة؟
يتكون التعزيز في الآلات من الرجوع إلى الخوارزميات التي تساعد في تحويل نماذج التعلم الضعيفة إلى نماذج قوية. إذا أخذنا مثال تصنيف رسائل البريد الإلكتروني كرسائل غير مرغوب فيها وليست بريدًا عشوائيًا ، فهناك بعض الفروق التي يمكن استخدامها لتسهيل فهمها. يمكن التعامل مع هذه الفروق عندما تحتوي رسالة بريد إلكتروني على ملف واحد ، وتحتوي على عبارة مماثلة مثل لقد فزت في اليانصيب ، وتحتوي على مجموعة من الروابط ، ويتم الحصول عليها من قائمة جهات اتصال.
كيف تعمل خوارزمية التعزيز؟
يتم تحديد القواعد الضعيفة باستخدام خوارزميات التعلم القائم على المثيل. بمجرد تطبيق خوارزمية التعلم الأساسية في تكرارات متعددة ، فإنها تجمع أخيرًا القواعد الضعيفة في قاعدة واحدة قوية. تقوم خوارزمية التعزيز بالاختيارات الصحيحة لتوزيع كل تكرار عبر خطوات متعددة. بعد أخذ المخصصات ، فإنه يعين وزنًا متساويًا حتى حدوث خطأ ، وبعد ذلك يتم تعيين وزن أكبر. تتكرر هذه العملية حتى يتم تحقيق دقة أفضل. بعد ذلك ، يتم الجمع بين جميع النواتج الضعيفة لتكوين منتج قوي.
ما هي أنواع خوارزميات التعزيز المختلفة وخصائصها؟
الأنواع المختلفة هي التعزيز التكيفي ، وتعزيز التدرج ، و XGBoost. التعزيز له خصائص مثل أنه يحدد الميزات ضمنيًا. تعتبر أشجار القرار أقل موثوقية من قوى التنبؤ. كما أن القياس يكون أكثر صرامة لأن المقدرات تعتمد على المقدرات السابقة. وتفسير تنبؤات التعزيز أمر طبيعي لأنه نموذج جماعي.