Capsule Neural Networks: คืออะไร มันทำงานอย่างไร สถาปัตยกรรมและส่วนประกอบ

เผยแพร่แล้ว: 2020-04-03

คุณรู้จักสิ่งต่าง ๆ ได้อย่างไร? ถ้าฉันเขียนว่า 'พวกเขา' และ 'พวกเขา' คุณจะอ่านทั้งคู่ว่าเป็น 'พวกเขา' ไหม คำตอบของคุณน่าจะเป็นใช่

สมองของคุณสามารถระบุคุณสมบัติหลักและช่วยให้คุณจดจำสิ่งต่างๆ ได้ คุณจึงมองเห็นใบหน้าได้ง่าย โครงข่ายประสาทแคปซูลทำงานคล้ายกัน ในบทความนี้ เราจะมาดูกันว่าพวกเขาคืออะไรและทำงานอย่างไร หากคุณ สนใจอัลกอริทึมการเรียนรู้ของเครื่อง คุณจะต้องชอบบทความนี้อย่างแน่นอน มาเริ่มกันเลยดีกว่า

สารบัญ

โครงข่ายประสาทแคปซูลคืออะไร?
Capsule Networks ทำงานอย่างไร
สถาปัตยกรรมของโครงข่ายประสาทแคปซูลคืออะไร?
การคำนวณใน CNN
- การคูณเมทริกซ์
- น้ำหนักสเกลาร์
- การกำหนดเส้นทางแบบไดนามิก
- ความไม่เชิงเส้นเวกเตอร์เป็นเวกเตอร์
ความคิดสุดท้าย
โครงข่ายประสาทหม้อแปลงคืออะไร?
โครงข่ายประสาทแบบกราฟิกคืออะไรและกราฟทำงานอย่างไร
แคปซูลแตกต่างจากเครือข่ายแคปซูลหรือไม่?

โครงข่ายประสาทแคปซูลคืออะไร?

โครงข่ายประสาทเทียมแบบแคปซูลมุ่งเน้นไปที่การจำลองแบบของโครงข่ายประสาทเทียมทางชีววิทยาเพื่อให้สามารถรับรู้และแบ่งส่วนได้ดียิ่งขึ้น เป็นโครงข่ายประสาทเทียมชนิดหนึ่ง พวกมันมีชั้นซ้อนกันอยู่ใต้ชั้นหนึ่งของโครงข่ายประสาทแคปซูล นั่นคือสิ่งที่คำว่า 'แคปซูล' ระบุ

แคปซูลในเครือข่ายเหล่านี้จะกำหนดพารามิเตอร์ของคุณสมบัติของวัตถุ สมมติว่าเครือข่ายแคปซูลของคุณต้องระบุใบหน้า แคปซูลจะเน้นไปที่การกำหนดว่าใบหน้ามีลักษณะเฉพาะหรือไม่ พวกเขาไม่ได้ถูกจำกัดไว้เพียงสิ่งนี้เท่านั้น พวกเขายังจะตรวจสอบวิธีการจัดระเบียบคุณสมบัติของใบหน้าโดยเฉพาะ ดังนั้น ระบบของคุณสามารถระบุใบหน้าได้ก็ต่อเมื่อแคปซูลระบุว่าองค์ประกอบของใบหน้านั้นอยู่ในลำดับที่ถูกต้อง

คุณอาจสงสัยว่าพวกเขาจะกำหนดลำดับของคุณสมบัติเหล่านั้นได้อย่างไร เครือข่ายเหล่านี้สามารถทำได้เนื่องจากข้อมูลที่คุณให้ไว้ เมื่อพวกเขาตรวจสอบรูปภาพนับร้อย (หรือหลายพัน) พวกเขาสามารถทำงานนี้ได้อย่างมีประสิทธิภาพ

เรียนรู้เพิ่มเติม: โครงข่ายประสาทเทียม: แอปพลิเคชันในโลกแห่งความจริง

Capsule Networks ทำงานอย่างไร

ตอนนี้ มาดูกันว่าเครือข่ายเหล่านี้ทำงานอย่างไร เริ่มแรก แคปซูลทำการคูณเมทริกซ์ของเมทริกซ์น้ำหนักด้วยเวกเตอร์อินพุต สิ่งนี้ให้ข้อมูลเกี่ยวกับความสัมพันธ์เชิงพื้นที่ระหว่างคุณสมบัติระดับต่ำและระดับสูงหลายอย่าง

หลังจากนั้นแคปซูลจะเลือกแคปซูลหลัก พวกเขาทำการเลือกผ่านการกำหนดเส้นทางแบบไดนามิก ซึ่งเราได้กล่าวถึงในบทความนี้ เมื่อพวกเขาเลือกแคปซูลหลักแล้ว พวกเขาพบผลรวมของเวกเตอร์ที่ถูกบีบอัดระหว่าง 0 ถึง 1 เมื่อพวกมันยังคงทิศทางของมัน คุณทำการบีบโดยใช้บรรทัดฐานของกรอบพิกัดเป็นความน่าจะเป็นที่มีอยู่และระยะทางโคไซน์ที่จะเป็นตัววัดข้อตกลง

มีความแตกต่างที่สำคัญระหว่างโครงข่ายประสาทเทียมมาตรฐานและโครงข่ายประสาทเทียมแบบแคปซูล ในขณะที่เครือข่ายแคปซูลใช้แคปซูลเพื่อห่อหุ้มข้อมูลสำคัญเกี่ยวกับรูปภาพ โครงข่ายประสาทเทียมมาตรฐานใช้เซลล์ประสาทเพื่อการนี้ แคปซูลผลิตเวกเตอร์ในขณะที่เซลล์ประสาทสามารถผลิตปริมาณสเกลาร์เท่านั้น ด้วยเหตุนี้ แคปซูลจึงสามารถระบุทิศทางของใบหน้า (หรือลักษณะเฉพาะ) ได้ แต่เซลล์ประสาทไม่สามารถทำได้ หากคุณต้องการเปลี่ยนทิศทางของจุดสนใจใดๆ ค่าของเวกเตอร์จะยังคงเหมือนเดิม แต่ทิศทางของมันจะเปลี่ยนไปตามการเปลี่ยนแปลงในตำแหน่ง

เครือข่ายแคปซูลทำงานได้ดีอย่างน่าอัศจรรย์กับชุดข้อมูลขนาดเล็ก และทำให้ตีความภาพที่มีประสิทธิภาพได้ง่ายขึ้น นอกจากนั้น ยังเก็บข้อมูลทั้งหมดของภาพ รวมทั้งพื้นผิว ตำแหน่ง และท่าทาง ข้อเสียอย่างเดียวของพวกเขาคือไม่สามารถทำงานได้ดีกว่าชุดข้อมูลขนาดใหญ่

อ่าน: 6 ประเภทของฟังก์ชั่นการเปิดใช้งานใน Neural Networks

สถาปัตยกรรมของโครงข่ายประสาทแคปซูลคืออะไร?

องค์ประกอบหลักสองประการของเครือข่ายแคปซูลคือตัวเข้ารหัสและตัวถอดรหัส โดยรวมแล้วมีหกชั้น ตัวเข้ารหัสมีสามชั้นแรก และมีหน้าที่ในการถ่ายและแปลงรูปภาพที่นำเข้าไปเป็นเวกเตอร์ (16 มิติ) เลเยอร์แรกของตัวเข้ารหัสคือโครงข่ายประสาทเทียม และจะแยกคุณสมบัติพื้นฐานของรูปภาพ

เลเยอร์ที่สองคือเครือข่าย PrimaryCaps และใช้คุณลักษณะที่จำเป็นเหล่านั้นและค้นหารูปแบบที่มีรายละเอียดมากขึ้นในหมู่พวกเขา ตัวอย่างเช่น สามารถเห็นความสัมพันธ์เชิงพื้นที่ระหว่างจังหวะเฉพาะ ชุดข้อมูลที่แตกต่างกันมีจำนวนแคปซูลที่แตกต่างกันในเครือข่าย PrimaryCaps ตัวอย่างเช่น ชุดข้อมูล MNIST มี 32 แคปซูล ชั้นที่สามคือ DigitCaps Network และจำนวนแคปซูลที่มีอยู่ในนั้นก็แตกต่างกันไปเช่นกัน หลังจากเลเยอร์เหล่านี้ ตัวเข้ารหัสจะมีเวกเตอร์ 16 มิติที่ไปยังตัวถอดรหัส

ตัวถอดรหัสมีสามชั้นที่เชื่อมต่อกัน ใช้เวกเตอร์ 16 มิติและพยายามสร้างภาพเดียวกันใหม่ตั้งแต่ต้นโดยใช้ข้อมูลที่มีอยู่ วิธีนี้จะทำให้เครือข่ายแข็งแกร่งขึ้นเนื่องจากสามารถคาดการณ์ได้ตามความรู้

อ่านเพิ่มเติม: Recurrent Neural Network ใน Python

การคำนวณใน CNN

การคูณเมทริกซ์

ระหว่างชั้นแรกและชั้นที่สอง เราทำการคูณเมทริกซ์ สิ่งนี้เข้ารหัสข้อมูลของความสัมพันธ์เชิงพื้นที่ และข้อมูลที่เข้ารหัสแสดงความน่าจะเป็นของการจัดประเภทฉลาก

น้ำหนักสเกลาร์

ในขั้นของการคำนวณนี้ แคปซูลระดับล่างจะปรับน้ำหนักตามน้ำหนักของแคปซูลระดับสูง พวกเขาทำเช่นนั้นเพื่อให้ตรงกับน้ำหนักของแคปซูลระดับสูง แคปซูลระดับสูงแสดงกราฟการกระจายน้ำหนักและยอมรับการจัดสรรที่ใหญ่ที่สุดที่จะผ่าน พวกเขาทั้งหมดสื่อสารกันผ่านการกำหนดเส้นทางแบบไดนามิก

การกำหนดเส้นทางแบบไดนามิก

ในการกำหนดเส้นทางแบบไดนามิก แคปซูลด้านล่างจะส่งข้อมูลไปยังแคปซูลหลัก พวกเขาทั้งหมดส่งข้อมูลไปยังแคปซูลที่เหมาะสมที่สุด และแคปซูลที่ได้รับข้อมูลส่วนใหญ่จะกลายเป็นแคปซูลหลัก แคปซูลหลักปฏิบัติตามข้อตกลงและกำหนดน้ำหนักตามนั้น

เพื่อทำความเข้าใจการกำหนดเส้นทางแบบไดนามิก สมมติว่าคุณให้ภาพเครือข่ายแคปซูลของบ้าน ประสบปัญหาบางอย่างเกี่ยวกับการระบุหลังคาบ้าน ดังนั้นแคปซูลจึงวิเคราะห์ภาพ โดยเฉพาะอย่างยิ่งส่วนที่คงที่ของมัน พวกเขาประสานกรอบของบ้านเกี่ยวกับผนังและหลังคา

ก่อนอื่นพวกเขาตัดสินใจว่าวัตถุนั้นเป็นบ้านหรือไม่จากนั้นจึงส่งคำทำนายไปยังแคปซูลระดับสูง หากการคาดคะเนของหลังคาที่เกี่ยวข้องกับผนังตรงกับการคาดการณ์อื่นๆ จากแคปซูลระดับต่ำ ผลลัพธ์บอกว่าวัตถุนั้นเป็นบ้าน นี่คือกระบวนการกำหนดเส้นทางตามข้อตกลง

ความไม่เชิงเส้นเวกเตอร์เป็นเวกเตอร์

เมื่อการกำหนดเส้นทางแบบไดนามิกเสร็จสมบูรณ์ ระบบจะบีบอัดข้อมูล ซึ่งหมายความว่าจะบีบอัดข้อมูลนั้น ทำให้คุณมีความเป็นไปได้ว่าแคปซูลจะรู้จักคุณลักษณะเฉพาะหรือไม่

ความคิดสุดท้าย

หลังจากอ่านบทความนี้แล้ว คุณต้องคุ้นเคยกับโครงข่ายประสาทเทียมและการทำงานของมัน คุณต้องรู้ด้วยว่าการกระทำของพวกเขาจะมีประโยชน์เพียงใด

หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับอัลกอริธึมการเรียนรู้ของเครื่อง โปรดดูบล็อกของเรา คุณจะพบบทความที่มีความรู้อยู่ที่นั่น

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ IIIT- สถานะศิษย์เก่า B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

โครงข่ายประสาทหม้อแปลงคืออะไร?

เมื่อโครงข่ายประสาทเทียมรับลำดับของเวกเตอร์เป็นอินพุต ให้เปลี่ยนเป็นเวกเตอร์ที่เรียกว่า (กระบวนการนี้เรียกว่าการเข้ารหัส) แล้วถอดรหัสกลับเป็นลำดับอื่น จะเรียกว่าโครงข่ายประสาทของหม้อแปลง หม้อแปลงไฟฟ้าเป็นส่วนประกอบที่พบในสถาปัตยกรรมโครงข่ายประสาทเทียมจำนวนมากสำหรับการประมวลผลข้อมูลตามลำดับ รวมถึงข้อความภาษาธรรมดา สัญญาณเสียง ลำดับจีโนม และข้อมูลอนุกรมเวลา การใช้งานทั่วไปที่สุดของโครงข่ายประสาทเทียมของหม้อแปลงคือการประมวลผลภาษาธรรมชาติ

โครงข่ายประสาทแบบกราฟิกคืออะไรและกราฟทำงานอย่างไร

กราฟโครงข่ายประสาทเทียม หรือ GNNs เป็นแบบจำลองประสาทที่ใช้การส่งข้อความระหว่างโหนดกราฟเพื่อแสดงการขึ้นต่อกันของกราฟ เครือข่ายเหล่านี้ทำงานโดยตรงบนโครงสร้างกราฟที่กำหนด พูดง่ายๆ ทุกโหนดในกราฟมีป้ายกำกับ และใช้โครงข่ายประสาทเทียมเพื่อทำนายโหนดป้ายกำกับตามความจริงพื้น GNN เพิ่งได้รับความโดดเด่นในหลากหลายสาขาวิชา รวมถึงเครือข่ายสังคมออนไลน์ กราฟความรู้ ระบบผู้แนะนำ และแม้แต่วิทยาศาสตร์เพื่อชีวิต

แคปซูลแตกต่างจากเครือข่ายแคปซูลหรือไม่?

ทั้งเงื่อนไข แคปซูล และเครือข่ายแคปซูล เชื่อมโยงกับการเรียนรู้เชิงลึก แต่ไม่เหมือนกัน กลุ่มของเซลล์ประสาทที่เวกเตอร์กิจกรรมเป็นตัวแทนของพารามิเตอร์การสร้างอินสแตนซ์ของบางรายการ เช่น ของวัตถุเรียกว่าแคปซูล อย่างไรก็ตาม เครือข่ายแคปซูลเป็นเครือข่ายที่สามารถดึงข้อมูลทางภูมิศาสตร์และประเด็นสำคัญอื่นๆ เพื่อลดการสูญเสียข้อมูลระหว่างกระบวนการดำเนินการรวมกลุ่ม