التنظيم في التعلم الآلي: كيف تتجنب فرط التجهيز؟

نشرت: 2020-02-17

يتضمن التعلم الآلي تجهيز أجهزة الكمبيوتر لأداء مهام محددة دون تعليمات صريحة. لذلك ، فإن الأنظمة مبرمجة للتعلم والتحسين من التجربة تلقائيًا. عادةً ما يستخدم علماء البيانات التنظيم في التعلم الآلي لضبط نماذجهم في عملية التدريب. دعونا نفهم هذا المفهوم بالتفصيل.

جدول المحتويات

تنظيم المراوغات overfitting

يسمح لك التنظيم في التعلم الآلي بتجنب الإفراط في تجهيز نموذج التدريب الخاص بك. يحدث التجاوز عندما يلتقط نموذجك البيانات التعسفية في مجموعة بيانات التدريب الخاصة بك. نقاط البيانات التي لا تحتوي على خصائص بياناتك تجعل نموذجك "مزعجًا". قد تجعل هذه الضوضاء نموذجك أكثر مرونة ، لكنها قد تشكل تحديات منخفضة الدقة.

ضع في اعتبارك فصلًا دراسيًا من 10 طلاب مع عدد متساوٍ من الفتيات والفتيان. الدرجة الكلية للفصل في الامتحان السنوي هي 70. متوسط ​​درجة الطالبات هو 60 ، وللطلاب الذكور 80. بناءً على هذه الدرجات السابقة ، نريد توقع الدرجات المستقبلية للطلاب. يمكن إجراء التنبؤات بالطرق التالية:

  • تحت Fit: سيحرز الفصل بأكمله 70 درجة
  • الملاءمة المثلى: قد يكون هذا نموذجًا مبسطًا يتنبأ بنتيجة 60 للفتيات والفتيان 80 (نفس النتيجة في المرة الأخيرة)
  • Over Fit: قد يستخدم هذا النموذج خاصية غير ذات صلة ، مثل رقم اللف ، للتنبؤ بأن الطلاب سوف يسجلون بالضبط نفس العلامات التي حصلوا عليها في العام الماضي

التنظيم هو شكل من أشكال الانحدار يضبط وظيفة الخطأ عن طريق إضافة مصطلح جزائي آخر. هذا المصطلح الإضافي يمنع المعاملات من أخذ القيم المتطرفة ، وبالتالي موازنة الوظيفة المتقلبة بشكل مفرط.

سيسعى أي خبير في التعلم الآلي إلى جعل نماذجهم دقيقة وخالية من الأخطاء. ويكمن مفتاح تحقيق هذا الهدف في إتقان المفاضلة بين التحيز والتباين. تابع القراءة للحصول على صورة واضحة لما يعنيه هذا.

موازنة التحيز والتباين

يمكن التقليل من خطأ الاختبار المتوقع من خلال إيجاد طريقة تحقق التوازن الصحيح "لتباين التحيز". بمعنى آخر ، يجب أن تعمل طريقة التعلم الإحصائي التي اخترتها على تحسين النموذج من خلال تحقيق تباين منخفض وانحياز منخفض في نفس الوقت. النموذج ذو التباين العالي مُجهز بشكل مفرط ، وينتج عن التحيز العالي نموذج غير مناسب.

يوفر التحقق المتقاطع وسيلة أخرى لتجنب الإفراط في التجهيز. يتحقق مما إذا كان نموذجك يلتقط الأنماط الصحيحة من مجموعة البيانات ، ويقدر الخطأ في مجموعة الاختبار الخاصة بك. لذلك ، تؤكد هذه الطريقة أساسًا على استقرار النموذج الخاص بك. علاوة على ذلك ، يقرر المعلمات التي تعمل بشكل أفضل مع نموذجك الخاص.

زيادة إمكانية تفسير النموذج

الهدف ليس فقط الحصول على خطأ صفري لمجموعة التدريب ولكن أيضًا للتنبؤ بالقيم المستهدفة الصحيحة من مجموعة بيانات الاختبار. لذلك ، نحن بحاجة إلى وظيفة "مضبوطة" تقلل من تعقيد هذه العملية.

شرح تكاثر R في التعلم الآلي

التنظيم هو شكل من أشكال الانحدار المقيد الذي يعمل عن طريق تقليص تقديرات المعامل نحو الصفر. بهذه الطريقة ، فإنه يحد من قدرة النماذج على التعلم من الضوضاء.

لنلقِ نظرة على معادلة الانحدار الخطي هذه:

ص = β0 + β1X1 + β2X2 +… .. + pXp

هنا ، تشير إلى تقديرات المعامل لمختلف المتنبئين التي تمثلها (X). و Y هي العلاقة المكتسبة.

نظرًا لأن هذه الوظيفة نفسها قد تواجه أخطاء ، فسنضيف وظيفة خطأ لتنظيم التقديرات التي تم تعلمها. نريد تقليل الخطأ في هذه الحالة حتى نتمكن من تسميته وظيفة الخسارة أيضًا. إليك ما تبدو عليه وظيفة الخسارة أو المجموع المتبقي للمربعات (RSS):

لذلك ، يستخدم علماء البيانات التنظيم لضبط وظيفة التنبؤ. تُعرف تقنيات التنظيم أيضًا باسم طرق الانكماش أو تسوس الوزن. دعونا نفهم بعضها بالتفصيل.

تنظيم ريدج

في Ridge Regression ، يتم تعديل دالة الخسارة بكمية انكماش مقابلة لتجميع القيم التربيعية لـ β. وقيمة تقرر مقدار معاقبة النموذج.

تسمى تقديرات المعامل في Ridge Regression معيار L2. تنقذك تقنية التنظيم هذه عندما تكون المتغيرات المستقلة في بياناتك شديدة الارتباط.

تنظيم لاسو

في تقنية لاسو ، تتم إضافة عقوبة تساوي مجموع القيم المطلقة لـ β (معامل β) إلى دالة الخطأ. يتم ضربها أيضًا بالمعامل λ الذي يتحكم في قوة العقوبة. يتم معاقبة المعاملات العالية فقط في هذه الطريقة.

يشار إلى تقديرات المعامل التي تنتجها اللاسو بمعيار L1. هذه الطريقة مفيدة بشكل خاص عندما يكون هناك عدد قليل من الملاحظات مع عدد كبير من الميزات.

لتبسيط الأساليب المذكورة أعلاه ، ضع في اعتبارك الثابت s الموجود لكل قيمة λ. الآن ، في تسوية L2 ، نحل معادلة يكون فيها مجموع مربعات المعاملات أقل من أو يساوي s. بينما في تنظيم L1 ، يجب أن يكون مجموع معاملات المعاملات أقل من أو يساوي s.

قراءة: التعلم الآلي مقابل الشبكات العصبية

تسعى كلتا الطريقتين المذكورتين أعلاه إلى التأكد من أن نموذج الانحدار لا يستهلك سمات غير ضرورية. لهذا السبب ، يُعرف Ridge Regression و Lasso أيضًا باسم وظائف القيد.

RSS والمتنبئون بالوظائف المقيدة

بمساعدة التفسيرات السابقة ، يمكن إعطاء وظائف الخسارة (RSS) لانحدار Ridge و Lasso بواسطة β1² + 2² ≤ s و | β1 | + | β2 | ≤ ق ، على التوالي. ستشكل β1² + 2² ≤ دائرة ، وسيكون RSS هو الأصغر لجميع النقاط التي تقع بداخله. بالنسبة إلى وظيفة Lasso ، ستكون RSS هي الأدنى لجميع النقاط الموجودة داخل الماس المعطى بواسطة | β1 | + | β2 | ≤ ق.

يعمل Ridge Regression على تقليص تقديرات المعامل لمتغيرات التوقع الأقل أهمية ولكنه لا يلغيها. ومن ثم ، قد يحتوي النموذج النهائي على جميع المتنبئين بسبب التقديرات غير الصفرية. من ناحية أخرى ، يمكن أن يجبر اللاسو بعض المعاملات على أن تكون صفرًا تمامًا ، خاصةً عندما تكون λ كبيرة.

قراءة: مكتبات Python لتعلم الآلة

كيف يحقق التنظيم التوازن

هناك بعض التباين المرتبط بنموذج المربع الصغرى القياسي. تقلل تقنيات التنظيم من تباين النموذج دون زيادة تحيزه التربيعي بشكل كبير. وتنظم قيمة معلمة الضبط ، ، هذا التوازن دون استبعاد الخصائص الحرجة للبيانات. لا يكون للعقوبة أي تأثير عندما تكون قيمة صفرًا ، وهي حالة انحدار المربعات الصغرى العادية.

ينخفض ​​التباين فقط مع ارتفاع قيمة. لكن هذا يحدث فقط حتى نقطة معينة ، وبعدها قد يبدأ التحيز في الارتفاع. لذلك ، يعد اختيار قيمة عامل الانكماش هذا من أهم الخطوات في التنظيم.

خاتمة

في هذه المقالة ، تعلمنا عن التنظيم في التعلم الآلي ومزاياه واستكشفنا طرقًا مثل انحدار التلال واللاسو. أخيرًا ، فهمنا كيف تساعد تقنيات التنظيم في تحسين دقة نماذج الانحدار. إذا كنت قد بدأت للتو في التنظيم ، فستوضح هذه الموارد أساسياتك وتشجعك على اتخاذ هذه الخطوة الأولى!

إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad's في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهام ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.

ما هي خيارات عملك بعد تعلم تعلم الآلة؟

يعد التعلم الآلي من أحدث المسارات الوظيفية وأكثرها واعدة في مجال التكنولوجيا. مع استمرار تقدم التعلم الآلي والتوسع ، فإنه يفتح فرص عمل جديدة للأفراد الذين يتطلعون إلى الحصول على وظيفة في هذا المجال من التكنولوجيا. يمكن للطلاب والمهنيين الذين يرغبون في العمل كمهندسين للتعلم الآلي أن يتطلعوا إلى خبرات تعليمية مجزية ومثيرة ، وبالطبع يتوقعون الحصول على وظائف مع أفضل المؤسسات التي تدفع أجورًا جيدة. بدءًا من علماء البيانات ومهندسي التعلم الآلي إلى اللغويين الحسابيين ومصممي التعلم الآلي المتمركزين حول الإنسان ، وأكثر من ذلك ، هناك العديد من الأدوار الوظيفية المثيرة للاهتمام التي يمكنك القيام بها اعتمادًا على مهاراتك وخبراتك.

كم الراتب الذي يتقاضاه مهندس التعلم الآلي في السنة؟

في الهند ، يمكن أن يتراوح متوسط ​​الراتب الذي يكسبه مهندس تعلم الآلة على مستوى المبتدئين من حوالي 6 روبية هندية إلى 8.2 كهس سنويًا. ولكن بالنسبة للمهنيين الذين يتمتعون بخبرة عمل متوسطة المستوى ، يمكن أن يتراوح التعويض بين 13 إلى 15 كهسًا في المتوسط ​​أو أكثر. الآن ، سيعتمد متوسط ​​الدخل السنوي لمهندسي التعلم الآلي على العديد من العوامل مثل خبرة العمل ذات الصلة ، ومجموعة المهارات ، وخبرة العمل الشاملة ، والشهادات ، وحتى الموقع ، من بين أمور أخرى. يمكن أن يكسب كبار محترفي التعلم الآلي حوالي 1 كرور روبية هندية سنويًا.

ما هي مجموعة المهارات المطلوبة للتعلم الآلي؟

يعد الفهم الأساسي ومستوى معين من الراحة في مواضيع معينة مفيدًا إذا كنت تطمح إلى بناء حياة مهنية ناجحة في التعلم الآلي. أولاً ، تحتاج إلى فهم الاحتمالات والإحصاءات. يتطلب إنشاء نماذج التعلم الآلي والتنبؤ بالنتائج معرفة الإحصائيات والاحتمالات. بعد ذلك ، يجب أن تكون على دراية بلغات البرمجة مثل Python و R ، والتي يتم استخدامها على نطاق واسع في التعلم الآلي. بعض المعرفة بنمذجة البيانات لتحليل البيانات ومهارات تصميم البرامج القوية ضرورية أيضًا لتعلم التعلم الآلي.