التعبئة في التعبئة مقابل التعزيز في التعلم الآلي: الفرق بين التعبئة والتعزيز
نشرت: 2020-11-12نظرًا لانتشار تطبيقات التعلم الآلي وزيادة قوة الحوسبة ، طبق علماء البيانات خوارزميات بطبيعتها على مجموعات البيانات. المفتاح الذي يتم تطبيق الخوارزمية من أجله هو طريقة إنتاج التحيز والتباين. تفضل النماذج ذات التحيز المنخفض بشكل عام.
تستخدم المؤسسات تقنيات التعلم الآلي الخاضعة للإشراف مثل أشجار القرار لاتخاذ قرارات أفضل وتحقيق المزيد من الأرباح. عند الجمع بين أشجار القرار المختلفة ، تصنع طرق التجميع وتقدم نتائج تنبؤية.
الغرض الرئيسي من استخدام نموذج المجموعة هو تجميع مجموعة من المتعلمين الضعفاء وتكوين متعلم قوي. يتم تحديد الطريقة التي يتم بها في تقنيتين: التعبئة والتعزيز اللذين يعملان بشكل مختلف ويتم استخدامهما بالتبادل للحصول على نتائج أفضل بدقة عالية ودقة وأخطاء أقل. باستخدام طرق التجميع ، يتم تجميع نماذج متعددة معًا لإنتاج نموذج قوي.
ستعرض هذه المدونة مفاهيم مختلفة لتعلم المجموعات. أولاً ، سيفتح فهم طريقة التجميع مسارات للطرق ذات الصلة بالتعلم وتصميم الحلول الملائمة. علاوة على ذلك ، سنناقش المفاهيم الموسعة للتعبئة والتعزيز للحصول على فكرة واضحة للقراء حول كيفية اختلاف هاتين الطريقتين ، وتطبيقاتهما الأساسية ، والنتائج التنبؤية التي تم الحصول عليها من كليهما.
انضم إلى دورات التعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم - الماجستير ، وبرامج الدراسات العليا التنفيذية ، وبرنامج الشهادة المتقدم في ML & AI لتسريع حياتك المهنية.
جدول المحتويات
ما هي طريقة المجموعة؟
المجموعة هي طريقة مستخدمة في خوارزمية التعلم الآلي. في هذه الطريقة ، يتم تدريب العديد من النماذج أو "المتعلمين الضعفاء" على تصحيح نفس المشكلة ودمجها للحصول على النتائج المرجوة. النماذج الضعيفة مجتمعة تعطي بحق نماذج دقيقة.

أولاً ، هناك حاجة إلى النماذج الأساسية لإعداد طريقة تعلم المجموعة التي سيتم تجميعها بعد ذلك. في خوارزميات التعبئة والتعزيز ، يتم استخدام خوارزمية تعلم أساسية واحدة. والسبب وراء ذلك هو أنه سيكون لدينا متعلمون ضعفاء ومتجانسون في متناول اليد ، وسيتم تدريبهم بطرق مختلفة.
سيُطلق على نموذج المجموعة المصنوع بهذه الطريقة في النهاية اسم نموذج متجانس. لكن القصة لا تنتهي هنا. هناك بعض الطرق التي يتم فيها تضمين أنواع مختلفة من خوارزميات التعلم الأساسية أيضًا مع المتعلمين الضعفاء غير المتجانسين الذين يصنعون "نموذج مجموعة غير متجانس". لكن في هذه المدونة ، سنتعامل فقط مع عارضة الأزياء السابقة ونناقش طيه أكثر طريقتين للمجموعة شيوعًا.
- التعبئة عبارة عن نموذج متجانس للمتعلمين الضعفاء يتعلم من بعضهم البعض بشكل مستقل بالتوازي ويجمعهم لتحديد متوسط النموذج.
- التعزيز هو أيضًا نموذج متجانس للمتعلمين الضعفاء ولكنه يعمل بشكل مختلف عن التعبئة. في هذا النموذج ، يتعلم المتعلمون بالتسلسل والتكيف لتحسين التنبؤات النموذجية لخوارزمية التعلم.
كان هذا هو التعبئة والتعزيز في لمحة. دعونا نلقي نظرة على كلاهما بالتفصيل. بعض العوامل التي تسبب أخطاء في التعلم هي الضوضاء والتحيز والتباين. يتم تطبيق طريقة التجميع لتقليل هذه العوامل مما يؤدي إلى استقرار النتيجة ودقتها.
اقرأ أيضًا: أفكار مشروع التعلم الآلي
تكييس
التعبئة هي اختصار لـ "تجميع التمهيد" وتستخدم لتقليل التباين في نموذج التنبؤ. التعبئة هي طريقة موازية تناسب المتعلمين المختلفين المدروسين بشكل مستقل عن بعضهم البعض ، مما يجعل من الممكن تدريبهم في وقت واحد.
يُنشئ التعبئة بيانات إضافية للتدريب من مجموعة البيانات. يتم تحقيق ذلك عن طريق أخذ عينات عشوائي مع الاستبدال من مجموعة البيانات الأصلية. قد يؤدي أخذ العينات مع الاستبدال إلى تكرار بعض الملاحظات في كل مجموعة بيانات تدريب جديدة. من المحتمل أيضًا أن يظهر كل عنصر في التعبئة في مجموعة بيانات جديدة.
تُستخدم مجموعات البيانات المتعددة هذه لتدريب نماذج متعددة بشكل متوازٍ. يتم حساب متوسط جميع التنبؤات من نماذج المجموعات المختلفة. يتم أخذ أغلبية الأصوات المكتسبة من آلية التصويت في الاعتبار عند إجراء التصنيف. يقلل التعبئة من التباين ويضبط التنبؤ إلى النتيجة المتوقعة.
مثال على التعبئة:
يستخدم نموذج Random Forest التعبئة والتغليف ، حيث توجد نماذج شجرة القرار ذات التباين العالي. يقوم باختيار ميزة عشوائية لزراعة الأشجار. عدة أشجار عشوائية تشكل غابة عشوائية.
التعزيز
التعزيز هو طريقة تجميع متسلسلة تقوم بشكل متكرر بضبط وزن الملاحظة وفقًا للتصنيف الأخير. إذا تم تصنيف ملاحظة بشكل غير صحيح ، فإنها تزيد من وزن تلك الملاحظة. يشير مصطلح "التعزيز" بلغة الشخص العادي إلى الخوارزميات التي تحول المتعلم الضعيف إلى متعلم أقوى. يقلل من خطأ التحيز ويبني نماذج تنبؤية قوية.
يتم رصد نقاط البيانات التي تم توقعها بشكل خاطئ في كل تكرار ، ويتم زيادة أوزانها. تخصص خوارزمية التعزيز أوزانًا لكل نموذج ناتج أثناء التدريب. سيتم تعيين وزن أعلى للمتعلم الذي يتمتع بنتائج جيدة للتنبؤ ببيانات التدريب. عند تقييم متعلم جديد ، يتتبع Boosting أخطاء المتعلم.

مثال على التعزيز:
يستخدم AdaBoost تقنيات التعزيز ، حيث يلزم وجود خطأ أقل بنسبة 50٪ للحفاظ على النموذج. هنا ، يمكن لـ Boosting الاحتفاظ بمتعلم واحد أو التخلص منه. خلاف ذلك ، يتم تكرار التكرار حتى الوصول إلى متعلم أفضل.
أوجه التشابه والاختلاف بين التعبئة والتعزيز
التعبئة والتعزيز ، كلاهما من الأساليب الشائعة الاستخدام ، لهما تشابه عالمي في التصنيف على أنهما طرق تجميع. هنا سوف نسلط الضوء على المزيد من أوجه التشابه بينهما ، متبوعة بالاختلافات بينهما. دعونا نبدأ أولاً بأوجه التشابه لأن فهمها سيجعل فهم الاختلافات أسهل.
التعبئة والتعزيز: أوجه التشابه
- التعبئة والتعزيز هما طريقتان جامعتان تركزان على الحصول على متعلمين N من متعلم واحد.
- يعمل التكييس والتعزيز على أخذ عينات عشوائية وإنشاء العديد من مجموعات بيانات التدريب
- يصل التعبئة والتعزيز إلى القرار النهائي عن طريق جعل متوسط عدد المتعلمين N أو أخذ تصنيف التصويت الذي قام به معظمهم.
- يعمل التعبئة والتعزيز على تقليل التباين ويوفران ثباتًا أعلى مع تقليل الأخطاء.
قراءة: شرح نماذج التعلم الآلي
التعبئة والتعزيز: الاختلافات
كما قلنا بالفعل ،
التعبئة هي طريقة لدمج نفس النوع من التنبؤات. التعزيز هو طريقة لدمج أنواع مختلفة من التنبؤات.
يقلل التعبئة من التباين وليس التحيز ويحل مشكلات الإفراط في التركيب في النموذج. التعزيز يقلل التحيز وليس التباين.
في التعبئة ، يتلقى كل نموذج وزنًا متساويًا. في Boosting ، يتم وزن النماذج بناءً على أدائها.
النماذج مبنية بشكل مستقل في التعبئة. تتأثر الموديلات الجديدة بأداء الطراز المبني مسبقًا في Boosting.

في التعبئة ، يتم رسم مجموعات فرعية من بيانات التدريب عشوائيًا مع استبدال مجموعة بيانات التدريب. في التعزيز ، تشتمل كل مجموعة فرعية جديدة على العناصر التي تم تصنيفها بشكل خاطئ بواسطة النماذج السابقة.
عادة ما يتم تطبيق التكييس حيث يكون المصنف غير مستقر وله تباين كبير. عادةً ما يتم تطبيق التعزيز حيث يكون المصنف مستقرًا وبسيطًا ولديه قدر كبير من التحيز.
التعبئة والتعزيز: ملخص نهائي
الآن بعد أن وصفنا مفاهيم التعبئة والتعزيز بدقة ، وصلنا إلى نهاية المقالة ويمكننا أن نستنتج كيف أن كلاهما لهما نفس القدر من الأهمية في علم البيانات ويعتمد مكان تطبيقه في نموذج على مجموعات البيانات المقدمة ، المحاكاة والظروف المعينة. وبالتالي ، من ناحية ، في نموذج Random Forest ، يتم استخدام التعبئة ، ونموذج AdaBoost يتضمن خوارزمية Boosting.
يتم حساب أداء نموذج التعلم الآلي من خلال مقارنة دقة تدريبه مع دقة التحقق من الصحة ، والتي يتم تحقيقها من خلال تقسيم البيانات إلى مجموعتين: مجموعة التدريب ومجموعة التحقق من الصحة. يتم استخدام مجموعة التدريب لتدريب النموذج ، ويتم استخدام مجموعة التحقق من الصحة للتقييم.
يمكنك التحقق من IIT Delhi's Executive PG Program in Machine Learning بالاشتراك مع upGrad . IIT دلهي هي واحدة من أعرق المؤسسات في الهند. مع أكثر من 500 عضو من أعضاء هيئة التدريس الداخليين وهم الأفضل في الموضوعات.
لماذا يعتبر التعبئة أفضل من التعزيز؟
من مجموعة البيانات ، يُنشئ التعبئة بيانات إضافية للتدريب. يتم استخدام أخذ العينات العشوائية والاستبدال من مجموعة البيانات الأصلية لتحقيق ذلك. في كل مجموعة بيانات تدريب جديدة ، قد يؤدي أخذ العينات مع الاستبدال إلى تكرار بعض الملاحظات. يتمتع كل عنصر من عناصر التعبئة بنفس فرصة الظهور في مجموعة بيانات جديدة. يتم تدريب نماذج متعددة بالتوازي باستخدام مجموعات البيانات المتعددة هذه. إنه متوسط جميع التوقعات من عدة نماذج مجموعات. عند تحديد التصنيف ، يتم أخذ تصويت الأغلبية الذي تم الحصول عليه من خلال عملية التصويت في الاعتبار. يقلل التعبئة من التباين ويضبط التنبؤ بالنتيجة المرغوبة.
كيف هي الاختلافات الرئيسية في التعبئة والتعزيز؟
التعبئة هي تقنية لتقليل تباين التنبؤ من خلال إنتاج بيانات إضافية للتدريب من مجموعة بيانات من خلال الجمع بين التكرارات والتركيبات لإنشاء مجموعات متعددة من البيانات الأصلية. التعزيز هو استراتيجية تكرارية لضبط وزن الملاحظة بناءً على التصنيف السابق. إنها تحاول زيادة وزن الملاحظة إذا تم تصنيفها بشكل خاطئ. التعزيز يخلق نماذج تنبؤية جيدة بشكل عام.
ما هي أوجه التشابه بين التعبئة والتعزيز؟
التعبئة والتعزيز هي إستراتيجيات جماعية تهدف إلى إنتاج متعلمين N من متعلم واحد. يقومون بأخذ عينات عشوائية وإنشاء العديد من مجموعات البيانات التدريبية. يصلون إلى قرارهم النهائي عن طريق حساب متوسط أصوات المتعلمين N أو اختيار رتبة تصويت الأغلبية منهم. إنها تقلل التباين وتزيد من الاستقرار مع تقليل الأخطاء.