أهم 10 تقنيات للتعلم العميق يجب أن تعرفها

نشرت: 2020-05-29

جدول المحتويات

مقدمة

لقد غيّر التعلم الآلي والذكاء الاصطناعي العالم من حولنا خلال السنوات القليلة الماضية من خلال ابتكاراتهما الخارقة. علاوة على ذلك ، فإن تقنيات التعلم العميق المتنوعة هي التي تنقل التعلم الآلي إلى مستوى جديد تمامًا حيث يمكن للآلات تعلم تمييز المهام ، المستوحاة من الشبكة العصبية للدماغ البشري. هذا هو سبب امتلاكنا للتحكم الصوتي على هواتفنا الذكية وأجهزة التحكم عن بعد الخاصة بالتلفزيون.

هناك أنواع مختلفة من نماذج التعلم العميق التي تكون دقيقة وتعالج بفعالية المشكلات المعقدة للغاية بالنسبة للدماغ البشري. إليك الطريقة:

أفضل 10 تقنيات للتعلم العميق

1. الشبكات العصبية الكلاسيكية

تُعرف أيضًا باسم الشبكات العصبية المتصلة بالكامل ، وغالبًا ما يتم تحديدها من خلال تصوراتها متعددة الطبقات ، حيث ترتبط الخلايا العصبية بالطبقة المستمرة. تم تصميمه من قبل فران روزنبلات ، عالم النفس الأمريكي ، في عام 1958. وهو يتضمن تكييف النموذج في مدخلات البيانات الثنائية الأساسية. يتضمن هذا النموذج ثلاث وظائف:

  • دالة خطية: تُسمى بشكل صحيح ، فهي تمثل سطرًا واحدًا يضاعف مدخلاته بمضاعف ثابت.
  • دالة غير خطية: وهي مقسمة كذلك إلى ثلاث مجموعات فرعية:
  1. المنحنى السيني: هو وظيفة يتم تفسيرها على أنها منحنى على شكل حرف S بمداها من 0 إلى 1.
  2. الظل الزائدي (tanh) يشير إلى منحنى على شكل حرف S له نطاق من -1 إلى 1.
  3. الوحدة الخطية المصححة (ReLU): إنها دالة من نقطة واحدة تنتج 0 عندما تكون قيمة الإدخال أقل من القيمة المحددة وتنتج المضاعف الخطي إذا كان الإدخال أعلى من القيمة المحددة.

يعمل بشكل أفضل في:

  1. أي مجموعة بيانات جدول تحتوي على صفوف وأعمدة منسقة في CSV
  2. قضايا التصنيف والانحدار مع مدخلات القيم الحقيقية
  3. أي نموذج يتمتع بأعلى مرونة ، مثل نموذج ANNS

2. الشبكات العصبية التلافيفية

CNN هي نوع متقدم وعالي الإمكانات من نموذج الشبكة العصبية الاصطناعية الكلاسيكية. تم تصميمه لمعالجة التعقيد العالي والمعالجة المسبقة وتجميع البيانات. يأخذ المرجع من ترتيب ترتيب الخلايا العصبية الموجودة في القشرة البصرية لدماغ حيوان.

يمكن اعتبار شبكات CNN واحدة من أكثر النماذج مرونة وأكثرها كفاءة للتخصص في البيانات المتعلقة بالصور وغير المتعلقة بالصور. هذه لديها أربع منظمات مختلفة:

  • وهي تتكون من طبقة إدخال واحدة ، وهي عمومًا ترتيب ثنائي الأبعاد للخلايا العصبية لتحليل بيانات الصورة الأولية ، والتي تشبه تلك الموجودة في بكسلات الصور.
  • تتكون بعض شبكات CNN أيضًا من طبقة إخراج أحادية البعد من الخلايا العصبية التي تعالج الصور على مدخلاتها ، عبر الطبقات التلافيفية المبعثرة المتصلة.
  • تحتوي شبكات CNN أيضًا على طبقة ثالثة تُعرف باسم طبقة أخذ العينات للحد من عدد الخلايا العصبية المشاركة في طبقات الشبكة المقابلة.
  • بشكل عام ، تحتوي شبكات CNN على طبقات فردية أو متعددة متصلة تربط العينة بطبقات الإخراج.

يمكن أن يساعد نموذج الشبكة هذا في اشتقاق بيانات الصورة ذات الصلة في شكل وحدات أو أجزاء أصغر. الخلايا العصبية الموجودة في طبقات الالتواء مسؤولة عن مجموعة الخلايا العصبية في الطبقة السابقة.

بمجرد استيراد بيانات الإدخال إلى النموذج التلافيفي ، هناك أربع مراحل متضمنة في بناء CNN:

  • الالتفاف: تستمد العملية خرائط المعالم من بيانات الإدخال ، متبوعة بوظيفة مطبقة على هذه الخرائط.
  • Max-Pooling: يساعد CNN على اكتشاف صورة بناءً على تعديلات معينة.
  • التسطيح: في هذه المرحلة ، يتم تسوية البيانات التي تم إنشاؤها بعد ذلك لتحليلها على شبكة CNN.
  • الاتصال الكامل: يوصف غالبًا بأنه طبقة مخفية تجمع وظيفة الخسارة لنموذج.

تعد شبكات CNN مناسبة للمهام ، بما في ذلك التعرف على الصور ، وتحليل الصور ، وتجزئة الصور ، وتحليل الفيديو ، ومعالجة اللغة الطبيعية. ومع ذلك ، يمكن أن تكون هناك سيناريوهات أخرى حيث يمكن أن تكون شبكات CNN مفيدة مثل:

  • مجموعات بيانات الصور التي تحتوي على تحليل مستندات التعرف الضوئي على الحروف
  • أي بيانات إدخال ثنائية الأبعاد يمكن تحويلها إلى بعد واحد لتحليل أسرع
  • يحتاج النموذج إلى المشاركة في هندسته للحصول على مخرجات.

اقرأ المزيد: الشبكة العصبية التلافيفية

3. الشبكات العصبية المتكررة (RNNs)

تم تصميم شبكات RNN لأول مرة للمساعدة في التنبؤ بالتسلسل ، على سبيل المثال ، تُعرف خوارزمية الذاكرة طويلة المدى (LSTM) بوظائفها المتعددة. تعمل هذه الشبكات بالكامل على تسلسلات البيانات ذات طول الإدخال المتغير.

تضع RNN المعرفة المكتسبة من حالتها السابقة كقيمة إدخال للتنبؤ الحالي. لذلك ، يمكن أن يساعد في تحقيق ذاكرة قصيرة المدى في الشبكة ، مما يؤدي إلى الإدارة الفعالة لتغيرات أسعار الأسهم ، أو أنظمة البيانات الأخرى المستندة إلى الوقت.

كما ذكرنا سابقًا ، هناك نوعان شاملان من تصميمات RNN التي تساعد في تحليل المشكلات. هم انهم:

  • LSTMs: مفيدة في التنبؤ بالبيانات في التسلسل الزمني ، باستخدام الذاكرة. لها ثلاث بوابات: الإدخال ، الإخراج ، والنسيان.
  • RNNs بوابات: مفيدة أيضًا في التنبؤ بالبيانات للتسلسل الزمني عبر الذاكرة. لها بوابتان - التحديث وإعادة التعيين.

يعمل بشكل أفضل في:

  • واحد إلى واحد: إدخال فردي متصل بمخرج واحد ، مثل تصنيف الصورة.
  • واحد إلى متعدد: إدخال فردي مرتبط بتسلسلات الإخراج ، مثل التعليق على الصورة الذي يتضمن عدة كلمات من صورة واحدة.
  • كثير إلى واحد: سلسلة من المدخلات تولد مخرجات فردية ، مثل تحليل المشاعر.
  • كثير إلى كثير: سلسلة من المدخلات تنتج سلسلة من المخرجات ، مثل تصنيف الفيديو.

كما أنها تستخدم على نطاق واسع في ترجمة اللغة ونمذجة المحادثة وغير ذلك.

احصل على أفضل دورة للتعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.

4. شبكات الخصومة التوليدية

إنه مزيج من تقنيتين للتعلم العميق للشبكات العصبية - مولد ومميز. بينما تنتج شبكة المولد بيانات اصطناعية ، فإن أداة التمييز تساعد في التمييز بين البيانات الحقيقية والخاطئة.

تتمتع كلتا الشبكتين بقدرات تنافسية ، حيث يواصل المولد إنتاج بيانات اصطناعية مطابقة للبيانات الحقيقية - ويكتشف المميز باستمرار البيانات الحقيقية وغير الواقعية. في سيناريو حيث يوجد متطلب لإنشاء مكتبة صور ، ستنتج شبكة المولد بيانات محاكاة للصور الأصلية. ومن ثم تولد شبكة عصبية deconvolution.

ثم تتبعها شبكة كاشف الصور للتمييز بين الصور الحقيقية والمزيفة. بدءًا من فرصة دقة تصل إلى 50٪ ، يحتاج الكاشف إلى تطوير جودة التصنيف نظرًا لأن المولد سينمو بشكل أفضل في توليد الصور الاصطناعية. مثل هذه المنافسة من شأنها أن تساهم بشكل عام في الشبكة في فعاليتها وسرعتها.

يعمل بشكل أفضل في:

  • توليد الصور والنصوص
  • تحسين الصورة
  • عمليات اكتشاف الأدوية الجديدة

5. خرائط التنظيم الذاتي

تعمل SOMs أو الخرائط ذاتية التنظيم بمساعدة البيانات غير الخاضعة للإشراف التي تقلل عدد المتغيرات العشوائية في النموذج. في هذا النوع من تقنية التعلم العميق ، يتم إصلاح بُعد الإخراج كنموذج ثنائي الأبعاد ، حيث يتصل كل مشابك بعقد الإدخال والإخراج.

نظرًا لأن كل نقطة بيانات تتنافس على تمثيل النموذج الخاص بها ، يقوم SOM بتحديث وزن أقرب العقد أو أفضل وحدات مطابقة (BMUs) . بناءً على قرب BMU ، تتغير قيمة الأوزان. نظرًا لأن الأوزان تعتبر خاصية عقدة بحد ذاتها ، فإن القيمة تمثل موقع العقدة في الشبكة.

يعمل بشكل أفضل في:

  • عندما لا تأتي مجموعات البيانات بقيم المحور ص
  • استكشافات المشروع لتحليل إطار عمل مجموعة البيانات
  • مشاريع إبداعية في الموسيقى ومقاطع الفيديو والنص بمساعدة الذكاء الاصطناعي

6. آلات بولتزمان

لا يأتي نموذج الشبكة هذا بأي اتجاه محدد مسبقًا ، وبالتالي فإن عقده متصلة بترتيب دائري. بسبب هذا التفرد ، يتم استخدام تقنية التعلم العميق هذه لإنتاج معلمات النموذج.

يختلف عن جميع نماذج الشبكات الحتمية السابقة ، ويشار إلى نموذج Boltzmann Machines باسم Stochastic.

يعمل بشكل أفضل في:

  • مراقبة النظام
  • إنشاء منصة توصية ثنائية
  • تحليل مجموعات البيانات المحددة

اقرأ: طرق خطوة بخطوة لبناء نظام الذكاء الاصطناعي الخاص بك اليوم

7. التعلم العميق التعزيز

قبل فهم تقنية التعلم المعزز العميق ، يشير التعلم المعزز إلى العملية التي يتفاعل فيها الوكيل مع بيئة لتعديل حالتها. يمكن للوكيل أن يلاحظ ويتخذ الإجراءات وفقًا لذلك ، يساعد الوكيل الشبكة للوصول إلى هدفها من خلال التفاعل مع الموقف.

هنا ، في نموذج الشبكة هذا ، توجد طبقة إدخال وطبقة إخراج والعديد من الطبقات المتعددة المخفية - حيث تكون حالة البيئة هي طبقة الإدخال نفسها. يعمل النموذج على المحاولات المستمرة للتنبؤ بالمكافأة المستقبلية لكل إجراء يتم اتخاذه في حالة معينة من الموقف.

يعمل بشكل أفضل في:

  • ألعاب الطاولة مثل الشطرنج والبوكر
  • سيارات ذاتية القيادة
  • علم الروبوتات
  • ادارة المخزون
  • المهام المالية مثل تسعير الأصول

8. المبرمجين الآليين

أحد أكثر أنواع تقنيات التعلم العميق شيوعًا ، يعمل هذا النموذج تلقائيًا بناءً على مدخلاته ، قبل أخذ وظيفة التنشيط وفك تشفير الإخراج النهائي. يؤدي تكوين عنق الزجاجة هذا إلى إنتاج فئات أقل من البيانات والاستفادة من معظم هياكل البيانات المتأصلة.

أنواع أجهزة التشفير التلقائي هي:

  • متناثر - حيث يفوق عدد الطبقات المخفية طبقة الإدخال ليحدث نهج التعميم لتقليل التخصيص الزائد. إنه يحد من وظيفة الخسارة ويمنع جهاز التشفير التلقائي من الإفراط في استخدام جميع عقده.
  • تقليل الضوضاء - هنا ، يتم تحويل نسخة معدلة من المدخلات إلى 0 عشوائيًا.
  • تعاقدية - إضافة عامل جزائي إلى وظيفة الخسارة للحد من الإفراط في التجهيز ونسخ البيانات ، في حالة زيادة عدد الطبقة المخفية عن طبقة الإدخال.
  • Stacked - إلى وحدة التشفير التلقائي ، بمجرد إضافة طبقة مخفية أخرى ، يؤدي ذلك إلى مرحلتين من الترميز لمرحلة واحدة من فك التشفير.

يعمل بشكل أفضل في:

  • كشف الميزة
  • إعداد نموذج توصية مقنع
  • أضف ميزات إلى مجموعات البيانات الكبيرة

قراءة: التنظيم في التعلم العميق

9. التكاثر العكسي

في التعلم العميق ، يشار إلى تقنية backpropagation أو back propagation على أنها الآلية المركزية للشبكات العصبية للتعرف على أي أخطاء في التنبؤ بالبيانات. من ناحية أخرى ، يشير الانتشار إلى إرسال البيانات في اتجاه معين عبر قناة مخصصة. يمكن للنظام بأكمله أن يعمل وفقًا لانتشار الإشارة في الاتجاه الأمامي في لحظة اتخاذ القرار ، ويرسل أي بيانات تتعلق بأوجه القصور في الشبكة بالعكس.

  • أولاً ، تحلل الشبكة المعلمات وتقرر البيانات
  • ثانيًا ، يتم ترجيحه بوظيفة الخسارة
  • ثالثًا ، يتم إعادة نشر الخطأ المحدد لتعديل أي معلمات غير صحيحة ذاتيًا

يعمل بشكل أفضل في:

  • تصحيح البيانات

10. نزول متدرج

في السياق الرياضي ، يشير التدرج اللوني إلى انحدار له زاوية قابلة للقياس ويمكن تمثيله في علاقة بين المتغيرات. في تقنية التعلم العميق هذه ، يمكن تمثيل العلاقة بين الخطأ الناتج في الشبكة العصبية وتلك الخاصة بمعلمات البيانات على أنها "x" و "y". نظرًا لأن المتغيرات ديناميكية في الشبكة العصبية ، فيمكن زيادة الخطأ أو تقليله بتغييرات صغيرة.

يتصور العديد من المحترفين هذه التقنية على أنها أسلوب مسار نهر ينزل من المنحدرات الجبلية. الهدف من هذه الطريقة هو إيجاد الحل الأمثل. نظرًا لوجود العديد من الحلول الدنيا المحلية في الشبكة العصبية ، حيث يمكن أن يتم حجز البيانات وتؤدي إلى تجميعات أبطأ وغير صحيحة - فهناك طرق للامتناع عن مثل هذه الأحداث.

باعتبارها تضاريس الجبل ، هناك وظائف معينة في الشبكة العصبية تسمى وظائف محدبة ، والتي تحافظ على تدفق البيانات إلى المعدلات المتوقعة والوصول إلى الحد الأدنى. يمكن أن تكون هناك اختلافات في الأساليب التي تتخذها البيانات التي تدخل الوجهة النهائية بسبب التباين في القيم الأولية للوظيفة.

يعمل بشكل أفضل في:

  • تحديث المعلمات في نموذج معين

اقرأ أيضًا: 15 فكرة مثيرة للاهتمام لمشروع تعلم الآلة للمبتدئين

تغليف

هناك العديد من تقنيات التعلم العميق التي تأتي مع وظائفها ونهجها العملي. بمجرد تحديد هذه النماذج ووضعها في السيناريوهات الصحيحة ، يمكن أن يؤدي ذلك إلى تحقيق حلول متطورة بناءً على إطار العمل الذي يستخدمه المطورون. حظ سعيد!

تحقق من برنامج الشهادة المتقدم في التعلم الآلي والسحابة مع IIT Madras ، أفضل مدرسة هندسية في الدولة لإنشاء برنامج لا يعلمك فقط التعلم الآلي ولكن أيضًا النشر الفعال له باستخدام البنية التحتية السحابية. هدفنا من هذا البرنامج هو فتح أبواب المعهد الأكثر انتقائية في الدولة ومنح المتعلمين إمكانية الوصول إلى أعضاء هيئة التدريس والموارد المذهلة من أجل إتقان مهارة عالية ومتنامية

ما هي شبكات الخصومة العامة؟

إنها مزيج من تقنيتين من تقنيات التعلم العميق للشبكات العصبية: المولدات والمميزات. بينما تقوم شبكة المولد بإنشاء بيانات وهمية ، فإن أداة التمييز تساعد في التمييز بين البيانات الفعلية والخيالية. نظرًا لأن المُنشئ يستمر في إنتاج بيانات خاطئة مطابقة للبيانات الأصلية - ويستمر التمييز في التعرف على البيانات الحقيقية وغير الواقعية - فإن كلا الشبكتين قادران على المنافسة. ستقوم شبكة المولد بإنشاء نتائج محاكاة للصور الأصلية في حالة تتطلب مكتبة صور. بعد ذلك ، ستنشئ شبكة عصبية deconvolution.

ما فائدة الخرائط ذاتية التنظيم؟

تعمل SOMs ، أو الخرائط ذاتية التنظيم ، عن طريق تقليل عدد المتغيرات العشوائية في نموذج باستخدام بيانات غير خاضعة للإشراف. نظرًا لأن كل خلية عصبية تتصل بمدخلها ومخرجها ، يتم تعيين أبعاد النتيجة كنموذج ثنائي الأبعاد في هذا النوع من تقنية التعلم العميق. يضبط SOM قيمة أقرب العقد أو وحدات المطابقة الأفضل لأن كل نقطة بيانات تقدم عروض لتمثيل نموذجها (BMUs). تختلف قيمة الأوزان اعتمادًا على مدى قرب BMU. نظرًا لأن الأوزان تعتبر خصائص عقدة في حد ذاتها ، فإن القيمة تشير إلى موضع العقدة في الشبكة.

ما هو الانتشار العكسي؟

تعد خوارزمية الانتشار العكسي أو نهج الدعامة الخلفية مطلبًا مهمًا للشبكات العصبية للتعرف على أي فشل في تنبؤ البيانات في التعلم العميق. من ناحية أخرى ، يشير الانتشار إلى نقل البيانات في اتجاه معين عبر قناة محددة. في لحظة الاختيار ، يمكن للنظام الكامل أن يعمل وفقًا لانتشار الإشارة في الاتجاه الأمامي ، ويرسل أي بيانات تتعلق بعيوب الشبكة في الاتجاه العكسي.