الشبكات العصبية الكبسولية: ما هي ، كيف تعمل ، الهندسة المعمارية ومكوناتها
نشرت: 2020-04-03كيف تتعرف على الأشياء؟ إذا كتبت "هم" و "خاصتك" ، فهل ستقرأ كلاهما على أنهما "لهما"؟ من المحتمل أن تكون إجابتك نعم.
يمكن لعقلك تحديد الميزات الأساسية ومساعدتك في التعرف على الأشياء. لهذا السبب يمكنك تحديد الوجوه بسهولة. تعمل الشبكات العصبية كبسولة بالمثل. في هذه المقالة ، سوف نلقي نظرة على ماهيتها وكيفية عملها. إذا كنت مهتمًا بخوارزميات التعلم الآلي ، فمن المؤكد أنك ستحب هذه المقالة. لذلك دعونا نبدأ.
جدول المحتويات
ما هي الشبكة العصبية كبسولة؟
تركز الشبكة العصبية للكبسولة على تكرار الشبكات العصبية البيولوجية لأداء تمييز وتجزئة أفضل. هم نوع من الشبكات العصبية الاصطناعية. لديهم طبقة متداخلة تحت طبقة واحدة من الشبكات العصبية للكبسولة ، وهذا ما تشير إليه كلمة "كبسولة".
تحدد الكبسولات الموجودة في هذه الشبكات معلمات ميزات الكائن. افترض أن شبكات الكبسولة الخاصة بك يجب أن تحدد الوجه. ستركز الكبسولات على تحديد ما إذا كانت ملامح الوجه المحددة موجودة أم لا. لم يقتصروا على هذا وحده. سيتحققون أيضًا من كيفية تنظيم ميزات الوجه المعين. لذلك ، يمكن لنظامك تحديد الوجه فقط عندما تحدد الكبسولات أن عناصر هذا الوجه بالترتيب الصحيح.
قد تتساءل ، كيف يحددون ترتيب تلك الميزات؟ يمكن لهذه الشبكات القيام بذلك بسبب المدخلات التي تقدمها لهم. عندما يقومون بفحص المئات (أو حتى الآلاف) من الصور ، يمكنهم أداء هذه المهمة بكفاءة.
اعرف المزيد: الشبكات العصبية: تطبيقات في العالم الحقيقي

كيف تعمل شبكات الكبسولة؟
الآن ، دعونا نلقي نظرة على كيفية عمل هذه الشبكات. في البداية ، تقوم الكبسولات بضرب المصفوفة لمصفوفات الوزن مع متجهات الإدخال. هذا يعطينا معلومات حول العلاقة المكانية بين العديد من الميزات منخفضة المستوى وعالية المستوى.
بعد ذلك ، تختار الكبسولات الكبسولة الأم. يقومون بالاختيار من خلال التوجيه الديناميكي ، والذي ناقشناه لاحقًا في هذه المقالة. بمجرد اختيار الكبسولة الأم ، يجدون مجموع المتجهات مضغوطًا بين 0 و 1 عندما يتمسكون باتجاههم. تقوم بالضغط من خلال استخدام معيار إطار الإحداثيات باعتباره احتمالية الوجود ومسافة جيب التمام لتكون مقياس الاتفاق.
هناك فرق كبير بين الشبكات العصبية القياسية والشبكات العصبية للكبسولة. بينما تستخدم شبكات الكبسولات الكبسولات لتغليف أجزاء أساسية من المعلومات حول صورة ما ، تستخدم الشبكات العصبية القياسية الخلايا العصبية لهذا الغرض. تنتج الكبسولات ناقلات ، في حين أن الخلايا العصبية يمكن أن تنتج كميات عددية فقط. لهذا السبب ، يمكن للكبسولات تحديد اتجاه الوجه (أو ميزة معينة) ، لكن الخلايا العصبية لا تستطيع ذلك. إذا قمت بتغيير اتجاه أي معلم ، فستظل قيمة المتجه كما هي ، ولكن سيتغير اتجاهها وفقًا للتغيير في الموضع.
تؤدي شبكات الكبسولة أداءً جيدًا بشكل مذهل على مجموعات البيانات الصغيرة ، كما أنها تسهل تفسير الصور القوية. بصرف النظر عن ذلك ، فإنهم يحتفظون بجميع معلومات الصورة ، بما في ذلك النسيج والموقع والوضع. عيبهم الوحيد هو أنهم لا يستطيعون التفوق على مجموعات البيانات الضخمة.
اقرأ: 6 أنواع من وظائف التنشيط في الشبكات العصبية
ما هي بنية الشبكة العصبية كبسولة؟
المكونان الأساسيان لشبكة الكبسولة هما المشفر ووحدة فك التشفير. في المجموع ، تحتوي على ست طبقات. يحتوي المشفر على الطبقات الثلاث الأولى ، ويتحملون مسؤولية أخذ الصورة المدخلة وتحويلها إلى متجه (16 بعدًا). الطبقة الأولى من المشفر هي الشبكة العصبية التلافيفية ، وهي تستخرج السمات الأساسية للصورة.
الطبقة الثانية هي شبكة PrimaryCaps ، وهي تأخذ هذه الميزات الأساسية وتجد أنماطًا أكثر تفصيلاً فيما بينها. على سبيل المثال ، يمكن أن يرى العلاقة المكانية بين ضربات معينة. تحتوي مجموعات البيانات المختلفة على أعداد مختلفة من الكبسولات في شبكة PrimaryCaps ؛ على سبيل المثال ، تحتوي مجموعة بيانات MNIST على 32 كبسولة. الطبقة الثالثة هي شبكة DigitCaps ، كما يختلف عدد الكبسولات الموجودة فيها. بعد هذه الطبقات ، يكون لجهاز التشفير متجه 16 بعدًا يذهب إلى وحدة فك التشفير.

يحتوي مفكك الشفرة على ثلاث طبقات متصلة. يأخذ متجهًا ذا 16 بعدًا ويحاول إعادة بناء نفس الصورة من البداية بمساعدة البيانات الموجودة بها. بهذه الطريقة ، تصبح الشبكة أكثر قوة حيث يمكنها عمل تنبؤات وفقًا لمعرفتها.
اقرأ أيضًا: الشبكة العصبية المتكررة في لغة بايثون
حسابات في سي إن إن
ضرب المصفوفة
بين الطبقة الأولى والطبقة الثانية نقوم بضرب المصفوفة. يؤدي ذلك إلى ترميز معلومات العلاقات المكانية ، وتُظهر المعلومات المشفرة احتمالية تصنيفات الملصقات.
الأوزان العددية
في هذه المرحلة من الحسابات ، تقوم كبسولات المستوى الأدنى بضبط أوزانها وفقًا لأوزان الكبسولات عالية المستوى. يفعلون ذلك لمطابقة أوزان الكبسولات عالية المستوى. ترسم الكبسولات عالية المستوى توزيع الوزن وتقبل أكبر تخصيص يتم تمريره. كلهم يتواصلون مع بعضهم البعض من خلال التوجيه الديناميكي.
التوجيه الديناميكي
في التوجيه الديناميكي ، ترسل الكبسولات السفلية بياناتها إلى الكبسولة الأصلية. يرسلون جميعًا بياناتهم إلى الكبسولة الأنسب وفقًا لهم ، وتصبح الكبسولة التي تحصل على معظم البيانات هي الكبسولة الأم. تتبع الكبسولات الأم الاتفاقية وتعيين الأوزان وفقًا لذلك.
لفهم التوجيه الديناميكي ، افترض أنك أعطيت صورًا لمنزل لشبكة الكبسولة. تواجه بعض المشاكل في التعرف على سطح المنزل. لذا تحلل الكبسولات الصورة ، وتحديداً الجزء الثابت منها. يقومون بتنسيق هيكل المنزل فيما يتعلق بالجدران والسقف.

يتخذون أولاً قرارًا بشأن ما إذا كان الكائن منزلًا أم لا ثم يرسلون تنبؤاتهم إلى الكبسولات عالية المستوى. إذا كانت إسقاطات السقف المتعلقة بالجدران تتطابق مع توقعات أخرى من كبسولات منخفضة المستوى ، فإن الإخراج يشير إلى أن الكائن هو منزل. هذه هي عملية التوجيه بالاتفاق.
متجه إلى متجه غير خطي
بمجرد اكتمال التوجيه الديناميكي ، يقوم النظام بسحق المعلومات ، مما يعني أنه يضغط تلك المعلومات. يمنحك احتمال ما إذا كانت الكبسولة ستتعرف على ميزة معينة أم لا.
افكار اخيرة
بعد قراءة هذا المقال ، يجب أن تكون على دراية بالشبكات العصبية للكبسولة وعملياتها. يجب أن تكون قد أدركت أيضًا مدى فائدة أفعالهم.
إذا كنت تريد معرفة المزيد حول خوارزميات التعلم الآلي ، فراجع مدونتنا. ستجد بعض المقالات المطلعة هناك.
إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.
ما هي الشبكات العصبية المحولات؟
عندما تأخذ الشبكة العصبية سلسلة من النواقل كمدخلات ، تقوم بتغييرها إلى متجه يسمى (تسمى العملية التشفير) ثم تقوم بفك تشفيرها مرة أخرى إلى تسلسل آخر ، يطلق عليها اسم الشبكة العصبية المحولة. المحول هو مكون موجود في العديد من بنى الشبكات العصبية لمعالجة البيانات المتسلسلة ، بما في ذلك النص بلغة بسيطة ، والإشارات الصوتية ، والتسلسلات الجينية ، وبيانات السلاسل الزمنية. التطبيق الأكثر شيوعًا للشبكات العصبية المحولات هو معالجة اللغة الطبيعية.
ما هي الشبكات العصبية الرسومية وكيف تعمل الرسوم البيانية؟
الشبكات العصبية للرسم البياني ، أو GNNs ، هي نماذج عصبية تستخدم نقل الرسائل بين عقد الرسم البياني لتمثيل تبعية الرسم البياني. تعمل هذه الشبكات بشكل مباشر على هياكل الرسم البياني المحددة. بكلمات بسيطة ، تحتوي كل عقدة في الرسم البياني على ملصق ، ويتم استخدام الشبكة العصبية للتنبؤ بعقد التسمية بناءً على الحقيقة الأساسية. اكتسبت GNNs مؤخرًا مكانة بارزة في مجموعة متنوعة من التخصصات ، بما في ذلك الشبكات الاجتماعية والرسوم البيانية المعرفية وأنظمة التوصية وحتى علوم الحياة.
هل تختلف الكبسولات عن شبكات الكبسولة؟
كلا المصطلحين ، الكبسولات وشبكات الكبسولة ، متصلان بالتعلم العميق ، لكنهما ليسا نفس الشيء. تُعرف مجموعة الخلايا العصبية التي تمثل نواقل نشاطها معاملات إنشاء مثيل لعنصر معين ، مثل عنصر كائن ما ، باسم كبسولة. ومع ذلك ، فإن شبكات الكبسولة هي شبكات يمكنها استرداد المعلومات الجغرافية والجوانب المهمة الأخرى لتقليل فقد البيانات أثناء عملية عمليات التجميع.