กราฟ Convolutional Networks: รายการแอปพลิเคชันที่คุณต้องการทราบ

เผยแพร่แล้ว: 2020-11-24

Convolutional Network เป็นโครงข่ายประสาทชนิดหนึ่ง Neural Networks เป็นรูปแบบการเรียนรู้เชิงลึกชนิดพิเศษ โดยทั่วไปแล้ว แมชชีนเลิร์นนิงหรือการเรียนรู้เชิงลึกประกอบด้วยอัลกอริธึมที่เข้มงวดและมีราคาแพงเนื่องจากงานที่ซับซ้อน ในทำนองเดียวกัน โมเดลการเรียนรู้เชิงลึกบนกราฟก็ซับซ้อนกว่านั้นอีก Graph Convolutional Networks ใช้เพื่อวัตถุประสงค์ในการจำแนกรูปภาพเป็นหลัก เรียนรู้เพิ่มเติมเกี่ยวกับโครงข่ายประสาทเทียม

ตลอดทศวรรษที่ผ่านมา การประยุกต์ใช้วิทยาศาสตร์ข้อมูลได้เพิ่มขึ้นอย่างมาก ในโลกที่เต็มไปด้วยข้อมูลนี้ แนวทางรูปแบบการเรียนรู้ให้ผลลัพธ์ที่ยอดเยี่ยมและการทำนายที่แม่นยำ กราฟมีประโยชน์สำหรับระบบข้อมูลจำนวนมาก

ตั้งแต่ปฏิสัมพันธ์ของโปรตีนชีวภาพไปจนถึงการเชื่อมต่ออินเทอร์เน็ตและ WorldWideWeb กราฟแสดงถึงระบบทั้งหมดเหล่านี้ นอกจากนี้ การใช้โครงข่ายประสาทเทียมผ่านโครงสร้างกราฟิกช่วยให้คอมพิวเตอร์เข้าใจคุณสมบัติของภาพ โมเดลนี้เป็นหนึ่งในแอพพลิเคชั่นกราฟในโลกแห่งความเป็นจริงที่ทันสมัยที่สุด ให้เราพูดถึงอัลกอริทึมเหล่านี้โดยละเอียด:

สารบัญ

โครงข่ายประสาทเทียมถูกสร้างขึ้นอย่างไร
กราฟ Convolutional Networks
- แอพพลิเคชั่นของ Graph Convolutional Networks
ชมรมคาราเต้แห่งแซคคารี
ห่อ
ข้อจำกัดของการใช้โครงข่ายประสาทเทียมคืออะไร?
CNN รุ่นใดที่ถือว่าเหมาะสมที่สุดสำหรับการจัดหมวดหมู่รูปภาพ
เหตุใดการแสดง CNN บนกราฟจึงยาก

โครงข่ายประสาทเทียมถูกสร้างขึ้นอย่างไร

Neural Networks เป็นหนึ่งในเทคนิคขั้นสูงที่สุดของวิทยาศาสตร์ข้อมูลและการเรียนรู้เชิงลึก Neural Networks มีประโยชน์ในหลาย ๆ แอพพลิเคชั่น ตั้งแต่การทำนายตลาดหุ้นไปจนถึงการจำแนกรูปภาพ การรู้จำคำพูดหรือตัวอักษร และแม้แต่ในการวิเคราะห์ลำดับ

แนวคิดแรกของโครงข่ายประสาทเทียมมาจากมุมมองทางชีววิทยา นักวิทยาศาสตร์ได้ทำการทดลองซึ่งประสาทการมองเห็นเชื่อมต่อกับศูนย์การได้ยินของสมอง ในที่สุด สิ่งมีชีวิตก็เรียนรู้ที่จะมองผ่านศูนย์การได้ยินของสมองด้วย การทดลองเพิ่มเติมยังพิสูจน์ว่าทุกศูนย์กลางของสมองสามารถดำเนินการทุกอย่างได้

วิธีการเริ่มเลียนแบบสมองของมนุษย์ซึ่งแจ้งข้อมูลอัลกอริธึมของคอมพิวเตอร์ ในทำนองเดียวกัน นักวิทยาศาสตร์คอมพิวเตอร์ยังคิดว่าควรมีอัลกอริธึมเดียวที่สามารถแก้ปัญหาการเรียนรู้สมองด้วยคอมพิวเตอร์ทั้งหมดได้ นั่นคือวิธีที่โครงข่ายประสาทเกิดขึ้น

โครงข่ายประสาทประกอบด้วยเซลล์ประสาทหลายชั้น โดยทั่วไปเซลล์ประสาทแต่ละเซลล์จะเป็นโหนดกราฟ เซลล์ประสาทแต่ละเซลล์ของแต่ละชั้นเชื่อมต่อกับเซลล์ประสาททั้งหมดในชั้นถัดไปผ่านขอบที่ถ่วงน้ำหนัก—น้ำหนักของขอบทำหน้าที่เป็นค่าสัมประสิทธิ์ของการคำนวณค่าของเลเยอร์

ผ่านการขยายพันธุ์ด้านหลัง สัมประสิทธิ์จะเปลี่ยนเพื่อให้พอดีกับแบบจำลองพร้อมตัวอย่างการฝึกตัวอย่าง ในที่สุด เซลล์ประสาทเดียวจากเลเยอร์สุดท้ายจะให้ผลลัพธ์ ในภาพต่อไปนี้จะอธิบายโครงสร้างของโครงข่ายประสาทเทียม

ที่มาของภาพ

อ่าน: การใช้ Convolutional Neural Network สำหรับการจำแนกรูปภาพ

กราฟ Convolutional Networks

Convolutional Networks เป็นโครงข่ายประสาทสามมิติ การใช้ Convolutional Neural Networks ในทางปฏิบัติส่วนใหญ่ ได้แก่ การจำแนกและการจดจำภาพ การประมวลผลภาษาธรรมชาติ และการรู้จำคำพูด โมเดลเหล่านี้มักจะซับซ้อนกว่าโมเดลโครงข่ายประสาทเทียมแบบ 2 มิติทั่วไป

ในสถาปัตยกรรมนี้ ชั้นของเซลล์ประสาทต่างๆ ถูกประกอบเข้าด้วยกัน พารามิเตอร์ของมิติเป็นตัวแปรในเลเยอร์ต่างๆ เพื่อให้โมเดลรู้จักพารามิเตอร์ ตัวอย่างเช่น รูปภาพเป็นสองมิติ และในระหว่างนี้ สีของแต่ละจุดก็มีบทบาทสำคัญเช่นกัน ดังนั้น พารามิเตอร์ที่แตกต่างกันสามตัวจึงปรากฏขึ้น เพื่อจัดการกับความซับซ้อนดังกล่าว Conv Nets มีบทบาทสำคัญ

เมทริกซ์ 3 มิติจำนวนมากที่มีมิติต่างกันเหล่านี้ทำงานในหลายระดับของโครงข่ายประสาทเทียม ในที่สุด มิติ 'z' จะพอดีกับพารามิเตอร์เอาต์พุตของเครือข่าย การถ่ายทอดข้อมูลจากระดับหนึ่งไปอีกระดับหนึ่งสามารถทำได้ผ่านอัลกอริธึมที่หลากหลาย

ตัวอย่างเช่น FC (เชื่อมต่ออย่างสมบูรณ์), Pooling และ ReLU เป็นอัลกอริธึมที่สำคัญบางประการเกี่ยวกับเรื่องนี้

โดยทั่วไป ค่าโหนดของโครงข่ายประสาทเทียมจะแสดงด้วย โดยที่ 'l' หมายถึงหมายเลขเลเยอร์ ดังนั้น 0 คือ เมทริกซ์อินพุต

0 = X

ในทางกลับกัน โหนดเลเยอร์สุดท้ายกำหนดเอาต์พุต สมมติว่ามีเลเยอร์ 'L' ดังนั้น L หมาย ถึง เอาต์พุตของโครงข่ายประสาทเทียม

แอล = Y

ที่มาของภาพ

ภาพด้านบนแสดงโครงข่ายประสาทเทียมในการจำแนกประเภทภาพ พารามิเตอร์ถูกกำหนดไว้สำหรับสุนัข แมว ค้างคาว และนก

ค่าโหนดของเลเยอร์ภายในเฉพาะจะคำนวณผ่านค่าของเลเยอร์ก่อนหน้า

l+1 = f( ล , θ )

นี่ คือเมทริกซ์ที่อยู่ติดกันและ f คือฟังก์ชันการกำหนด ทุกเลเยอร์เครือข่ายแบบกราฟโค้งสามารถเขียนได้โดยใช้นิพจน์นี้ ด้วยวิธีนี้ โครงข่ายประสาทเทียมแบบกราฟจะทำงานได้ตามปกติ

แอพพลิเคชั่นของ Graph Convolutional Networks

Graph Convolutional Networks สร้างการคาดการณ์เหนือระบบทางกายภาพ เช่น กราฟ วิธีการโต้ตอบและแอปพลิเคชัน GCN ยังให้ข้อมูลที่แม่นยำเกี่ยวกับคุณสมบัติของเอนทิตีและระบบทางกายภาพในโลกแห่งความเป็นจริง (ไดนามิกของการชน, วิถีของวัตถุ)
GCN ใช้เพื่อแก้ไขปัญหาการแยกภาพ โมเดลที่ตามมานี้เรียกว่า 'Zero-Shot Learning' แรงจูงใจหลักของโมเดลนี้คือการระบุภาพที่ติดป้ายกำกับที่ไม่รู้จักและจัดกลุ่มเป็นภาพที่รู้จัก พวกเขายังรวบรวมข้อมูลเชิงความหมายของป้ายกำกับเหล่านี้และจัดหมวดหมู่
GCN สามารถใช้ความยาวระดับหนึ่งของลายนิ้วมือโมเลกุลเป็นข้อมูลป้อนเข้า และสร้างโครงสร้างโมเลกุลที่คาดการณ์ได้ MolGAN เป็นเครือข่าย Graph Convolutional ประเภทหนึ่งที่ช่วยในการสร้างโครงสร้างโมเลกุลใหม่พร้อมคุณสมบัติที่หลากหลาย ด้วยวิธีนี้ทำให้นักวิทยาศาสตร์สามารถประดิษฐ์โครงสร้างโมเลกุลที่ทันสมัยในแต่ละวันได้
GCN ใช้สำหรับการแก้ปัญหาต่างๆ ที่เกี่ยวข้องกับการดำเนินการวิจัยและแอปพลิเคชันการเพิ่มประสิทธิภาพแบบผสมผสาน Graph Convolutional Networks มีบทบาทสำคัญในการแก้ปัญหาพนักงานขาย ปัญหาการกำหนดกำลังสอง และอื่นๆ อีกมากมาย ด้วยความช่วยเหลือของกราฟอินพุต มันสามารถเอาชนะอัลกอริธึมที่ซับซ้อนแบบดั้งเดิมได้

ชมรมคาราเต้แห่งแซคคารี

การประยุกต์ใช้ Graph Convolutional Networks ที่สำคัญอีกประการหนึ่งคือการแก้ปัญหาการคาดการณ์ของชุมชน เช่น Karate Club of Zachary ปัญหานี้เกิดจากข้อพิพาทระหว่างผู้บริหารและผู้สอนของสโมสร

เราต้องคิดให้ออกว่าสมาชิกชมรมคาราเต้ทุกคนจะเลือกข้างไหน ปัญหานี้ได้รับการแก้ไขโดยใช้เทคนิคการเรียนรู้แบบกึ่งควบคุมดูแล ด้วยการใช้โหนดที่มีป้ายกำกับเพียงสองโหนด Tobias Jepsen สามารถแก้ไขปัญหาและเข้าถึงความแม่นยำที่เกือบสมบูรณ์แบบในแง่ของการทำนายทั้งสองชุมชน

ตอนนี้ มาดูภาพต่อไปนี้กัน และคุณจะสามารถรับข้อมูลเชิงลึกเกี่ยวกับปัญหาของชมรมคาราเต้และการคำนวณที่เหมาะสมโดยใช้ Graph Convolutional Networks

ที่มาของภาพ

อ่านเพิ่มเติม: แนวคิดโครงการโครงข่ายประสาทเทียม

ห่อ

เมื่ออ่านบทความนี้ คุณจะสามารถเข้าใจได้ว่า Graph Convolutional Networks คืออะไร การสร้าง Neural Networks อย่างไร แนวคิดโดยย่อเกี่ยวกับ GCN และวิธีการทำงาน ตลอดจนแง่มุมที่สำคัญต่างๆ และการใช้งาน GCN รวมถึงปัญหาของ Zachary Karate Club

หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับ GCN ตลอดจนคุณลักษณะและประโยชน์ของ GCN โปรดลงทะเบียนที่ upGrad Education Pvt. Ltd. และหลักสูตร Post Graduate and Diploma ของ IIITB ด้านการเรียนรู้ของเครื่องและปัญญา ประดิษฐ์ หลักสูตรการเรียนรู้ของเครื่องและ AI นี้ออกแบบมาสำหรับนักเรียนและคนทำงาน

หลักสูตรนี้รวบรวมกรณีศึกษาและการมอบหมายงาน การให้คำปรึกษาในอุตสาหกรรม สถานะศิษย์เก่าของ IIIT Bangalore ความช่วยเหลือในการหางานกับบริษัทชั้นนำ และที่สำคัญที่สุดคือ ประสบการณ์การเรียนรู้ที่หลากหลาย

ข้อจำกัดของการใช้โครงข่ายประสาทเทียมคืออะไร?

ข้อเสียเปรียบที่สำคัญที่สุดของการใช้โครงข่ายประสาทเทียมในการแก้ปัญหาคือ ผลลัพธ์ไม่ได้อธิบายอย่างเหมาะสม ซึ่งอาจเป็นเรื่องยากสำหรับผู้ใช้จำนวนมาก เมื่อเปรียบเทียบกับเทคนิคแมชชีนเลิร์นนิงอื่นๆ โครงข่ายประสาทเทียมต้องการข้อมูลมากกว่ามากจึงจะทำงานได้ดี พวกเขาเสียค่าใช้จ่ายในการคำนวณมากกว่าอัลกอริธึมการเรียนรู้ของเครื่องแบบดั้งเดิมอื่น ๆ จากพื้นฐาน การฝึกอบรมโครงข่ายประสาทเทียมที่ลึกมากอาจใช้เวลาหลายสัปดาห์

CNN รุ่นใดที่ถือว่าเหมาะสมที่สุดสำหรับการจัดหมวดหมู่รูปภาพ

สำหรับการจัดประเภทรูปภาพ แนะนำให้ใช้ VGG-16 ซึ่งย่อมาจาก Very Deep Convolutional Networks for Large-Scale Image Recognition นอกเหนือจาก ImageNet แล้ว VGG ซึ่งสร้างขึ้นเป็น CNN เชิงลึก มีประสิทธิภาพเหนือกว่าเส้นฐานในงานและชุดข้อมูลที่หลากหลาย ลักษณะเฉพาะของโมเดลนี้คือ แทนที่จะเน้นที่การเพิ่มไฮเปอร์พารามิเตอร์จำนวนมาก แต่เน้นที่การรวมเลเยอร์การบิดที่เหนือกว่าในขณะที่กำลังพัฒนา ประกอบด้วยทั้งหมด 16 ชั้น 5 บล็อก และชั้นรวมสูงสุดสำหรับแต่ละบล็อก ทำให้เป็นเครือข่ายขนาดใหญ่

เหตุใดการแสดง CNN บนกราฟจึงยาก

เป็นการยากที่จะรัน CNNs บนกราฟเนื่องจากขนาดโดยพลการ นอกจากนี้ ไม่มีตำแหน่งเชิงพื้นที่ในกราฟเนื่องจากโทโพโลยีที่ซับซ้อน ซึ่งเป็นอีกสาเหตุหนึ่งที่ CNN ไม่ได้ใช้ในกราฟ ในกราฟ GCN ใช้สำหรับการเรียนรู้กึ่งควบคุมดูแล หลักการพื้นฐานของ GCN คือการหาค่าเฉลี่ยถ่วงน้ำหนักของแอตทริบิวต์โหนดทั้งหมดของเพื่อนบ้านทั้งหมด (รวมถึงตัวมันเองด้วย) โดยโหนดระดับต่ำกว่าจะได้รับน้ำหนักที่สูงกว่า เวคเตอร์คุณลักษณะที่สร้างขึ้นจะถูกป้อนเข้าสู่โครงข่ายประสาทเทียมสำหรับการฝึกอบรม