ประเภทของโมเดล Deep Learning ที่วิศวกร AI ควรเรียนรู้ในปี 2022

เผยแพร่แล้ว: 2021-01-01

สารบัญ

บทนำ

Deep Learning เป็นเทคนิคการเรียนรู้ของเครื่องที่ใช้ประโยชน์จากชั้นต่างๆ ของการประมวลผลข้อมูลแบบไม่เชิงเส้นสำหรับการแปลงแบบไม่มีผู้ดูแลและภายใต้การดูแล การดึงคุณลักษณะ การจำแนกประเภท และการวิเคราะห์รูปแบบ

เมื่อพูดถึงการประมวลผลข้อมูลในลักษณะที่ไม่เป็นเชิงเส้น จะประกอบด้วยชั้นของลำดับชั้นที่แตกต่างกัน ในที่นี้ แนวคิดระดับต่ำบางส่วนสามารถกำหนดแนวคิดระดับสูงกว่าได้ การเรียนรู้ภายใต้การดูแลเป็นรูปแบบหนึ่งของชุดการเรียนรู้ของเครื่อง และชุดตัวอย่างจะถูกส่งเป็นอินพุตในระบบในระหว่างขั้นตอนการฝึกอบรม

เนื่องจากอินพุตแต่ละรายการมีป้ายกำกับค่าเอาต์พุต ระบบจะทราบเอาต์พุตเมื่อมีการจัดเตรียมชุดอินพุตไว้ ในทางกลับกัน ในการเรียนรู้แบบ unsupervised อินพุตจะไม่ถูกระบุด้วยคลาสที่เป็นของมัน ดังนั้นจึงขึ้นอยู่กับระบบที่จะพัฒนาและจัดระเบียบข้อมูลโดยการค้นหาลักษณะทั่วไปและการเปลี่ยนแปลงที่จำเป็นตามความรู้ภายใน

โครงข่ายประสาทเทียมนั้นตื้น ดังนั้น พวกเขาจึงไม่สามารถจัดการกับข้อมูลที่ซับซ้อนตามที่พบในการใช้งานประจำวัน เช่น รูปภาพ คำพูดที่เป็นธรรมชาติ การดึงข้อมูล และแอปพลิเคชันการประมวลผลข้อมูลที่เหมือนมนุษย์ สำหรับแอปพลิเคชันประเภทนี้ โมเดลการเรียนรู้เชิงลึก นั้นสมบูรณ์แบบ ด้วยความช่วยเหลือของการเรียนรู้เชิงลึก ทำให้สามารถจำแนก จดจำ และจัดหมวดหมู่รูปแบบข้อมูลสำหรับเครื่องโดยใช้ความพยายามน้อยลง

บทความที่เกี่ยวข้อง: เทคนิคการเรียนรู้เชิงลึกยอดนิยม

ประเภทโมเดลการเรียนรู้เชิงลึก

โมเดลการเรียนรู้เชิงลึกมีการพัฒนาและส่วนใหญ่ใช้โครงข่ายประสาทเทียม ที่สำคัญที่สุดในหมู่พวกเขาคือโครงข่ายประสาทเทียม (CNNs) นอกจากนี้ยังรวมตัวแปรแฝงและสูตรประพจน์ที่จัดชั้นอย่างชาญฉลาดในแบบจำลองการกำเนิดเชิงลึก

ตัวเข้ารหัสอัตโนมัติ

เป็นโครงข่ายประสาทเทียม ซึ่งสามารถเรียนรู้จากรูปแบบการเข้ารหัสที่แตกต่างกัน autoencoder คล้ายกับ multilayer perceptron ที่มีชั้นอินพุต เลเยอร์ที่ซ่อนอยู่ หรือเลเยอร์เอาต์พุตในรูปแบบที่ง่ายที่สุด เลเยอร์เอาต์พุตมีจำนวนโหนดเท่ากันกับเลเยอร์เอาต์พุต มันไม่ได้ทำนายค่าเป้าหมายตามเวกเตอร์เอาต์พุต แต่ Autoencoder สามารถคาดการณ์อินพุตได้ กลไกการเรียนรู้นี้สามารถสรุปได้ดังนี้:

สำหรับแต่ละอินพุต x

คำนวณการเปิดใช้งานโดยให้ feedforward ผ่านไปยังทุกเลเยอร์ที่ซ่อนอยู่และเลเยอร์เอาต์พุต
ใช้ฟังก์ชันข้อผิดพลาดที่เหมาะสมในการตรวจจับค่าเบี่ยงเบนระหว่างค่าที่คำนวณได้
อัปเดตน้ำหนักโดยเผยแพร่ข้อผิดพลาดย้อนกลับ
ทำซ้ำงานจนกว่าจะสร้างผลลัพธ์ที่น่าพอใจ

หากเลเยอร์ที่ซ่อนอยู่มีโหนดน้อยกว่าโหนดอินพุต-เอาท์พุต การเปิดใช้งานของเลเยอร์ที่ซ่อนล่าสุดถือเป็นการแสดงข้อมูลที่บีบอัดของอินพุต หากโหนดเลเยอร์ที่ซ่อนอยู่มีจำนวนมากกว่า ตัวเข้ารหัสอัตโนมัติจะเรียนรู้ฟังก์ชันการระบุตัวตนและพิสูจน์ว่าไร้ประโยชน์ในกรณีส่วนใหญ่

เน็ตศรัทธาลึก

เป็นวิธีแก้ปัญหาในการจัดการฟังก์ชันวัตถุประสงค์ขั้นต่ำและแบบไม่นูนซึ่งมีการรับรู้หลายชั้นทั่วไป คุณสามารถมองว่าเป็นการเรียนรู้เชิงลึกประเภทอื่นที่ประกอบด้วยตัวแปรแฝงหลายชั้นที่เชื่อมโยงกับเลเยอร์อื่นๆ เป็นเครื่องจักร Boltzmann รุ่นจำกัด

ที่นี่ เลเยอร์ที่ซ่อนอยู่ของแต่ละเครือข่ายย่อยจะทำหน้าที่เป็นเลเยอร์อินพุตที่มองเห็นได้สำหรับเลเยอร์ที่อยู่ติดกันของเครือข่าย ดังนั้นจึงทำให้เลเยอร์ที่มองเห็นได้ต่ำสุดเป็นชุดการฝึกสำหรับเลเยอร์ที่อยู่ติดกันของเครือข่าย ดังนั้นทุกชั้นของเครือข่ายจึงสามารถฝึกฝนอย่างตะกละตะกลามและเป็นอิสระ โครงสร้างลึกแต่ละชั้นใช้ตัวแปรที่ซ่อนอยู่เป็นตัวแปรที่สังเกตได้สำหรับการฝึกโครงสร้างส่วนลึกแต่ละชั้น อัลกอริทึมสำหรับการฝึกอบรมเครือข่ายความเชื่อลึกมีดังนี้:

คำนึงถึงเวกเตอร์อินพุต
ใช้เวกเตอร์อินพุตสำหรับการฝึกเครื่องจักร Boltzmann และรับเมทริกซ์น้ำหนัก
ใช้เมทริกซ์น้ำหนักสำหรับการฝึกเครือข่ายชั้นล่างสองชั้น
ใช้ RBM ของเครือข่ายเพื่อสร้างเวกเตอร์อินพุตใหม่ผ่านการเปิดใช้งานและการสุ่มตัวอย่างของหน่วยที่ซ่อนอยู่
ทำซ้ำขั้นตอนต่อไปจนกว่าจะถึงสองชั้นบนสุดของเครือข่าย

อ่านเพิ่มเติม: การเรียนรู้เชิงลึกกับโครงข่ายประสาทเทียม

โครงข่ายประสาทเทียม (CNN)

เป็นอีกตัวแปรหนึ่งของ perceptron แบบหลายชั้นตาม feedforward มันจัดระเบียบเซลล์ประสาทแต่ละเซลล์ในลักษณะที่ตอบสนองต่อบริเวณที่ทับซ้อนกันทั้งหมดในพื้นที่การมองเห็น มันเป็นหนึ่งในอัลกอริธึมการเรียนรู้เชิงลึกที่สามารถถ่ายภาพอินพุตและกำหนดความสำคัญให้กับอคติและน้ำหนักที่เรียนรู้ได้ของแง่มุม/วัตถุต่างๆ ในภาพ

มันสามารถแยกความแตกต่างจากที่อื่น ความจำเป็นในการประมวลผลล่วงหน้าใน CNN ค่อนข้างต่ำเมื่อเทียบกับอัลกอริธึมการจำแนกประเภทอื่นๆ CNN มีความสามารถในการเรียนรู้คุณลักษณะและตัวกรองเหล่านี้

CNN เป็นหนึ่งในหมวดหมู่หลักดังต่อไปนี้:

การตรวจจับวัตถุ

การจำแนกรูปภาพ

การรับรู้ภาพ

การจดจำใบหน้า เป็นต้น

เหล่านี้คือบางส่วนของพื้นที่ที่ CNN สามารถใช้กันอย่างแพร่หลาย

สำหรับการจัดประเภทรูปภาพ CNN จะยอมรับรูปภาพที่ป้อน ประมวลผล และจัดประเภทตามหมวดหมู่ต่างๆ คอมพิวเตอร์แสดงภาพอินพุตเป็นอาร์เรย์ของพิกเซล และเป็นตัวแปรของความละเอียดของภาพ ในทางเทคนิค แบบจำลองของ CNN จะกำหนดรูปภาพที่ป้อนแต่ละภาพผ่านเลเยอร์ที่บิดเบี้ยวหลายชั้นพร้อมตัวกรองสำหรับการฝึกอบรมและการทดสอบ

เลเยอร์แรกเรียกว่า Convolution ซึ่งถูกกำหนดให้แยกคุณสมบัติจากภาพที่ป้อนเข้า Convolution สามารถรักษาความสัมพันธ์ระหว่างพิกเซลได้ เนื่องจากสามารถเรียนรู้คุณสมบัติของภาพผ่านการใช้ข้อมูลอินพุตสี่เหลี่ยมเล็กๆ มันดำเนินการดำเนินการทางคณิตศาสตร์โดยรับสองอินพุต: เมทริกซ์รูปภาพและตัวกรองหรือเคอร์เนล

เมื่อการบิดเบือนภาพได้รับฟิลเตอร์ต่างๆ จะทำให้สามารถดำเนินการต่างๆ เช่น การตรวจจับขอบ การเพิ่มความคมชัด และความเบลอผ่านฟิลเตอร์

ในช่วงไม่กี่ปีที่ผ่านมา วงการคอมพิวเตอร์วิทัศน์มีความก้าวหน้าอย่างมาก หนึ่งในความก้าวหน้าที่ใหญ่ที่สุดคือ CNN Deep CNN ได้พัฒนามาเป็นแอพพลิเคชั่นวิชันซิสเต็มของคอมพิวเตอร์ที่ใช้ในการจดจำท่าทาง รถยนต์ที่ขับด้วยตนเอง การแท็กเพื่อนอัตโนมัติในรูปภาพที่โพสต์บน Facebook คุณสมบัติการรักษาความปลอดภัยใบหน้า และการจดจำป้ายทะเบียนอัตโนมัติ

โครงข่ายประสาทกำเริบ

เป็นโครงข่ายประสาทชนิดหนึ่งที่สามารถป้อนเอาต์พุตของขั้นตอนก่อนหน้าเป็นอินพุตไปยังขั้นตอนปัจจุบันได้ อินพุตและเอาต์พุตในโครงข่ายประสาทเทียมแบบทั่วไปนั้นไม่ขึ้นกับกัน อย่างไรก็ตาม ในกรณีที่มีความจำเป็นต้องทำนายคำที่ต่อเนื่องกันในประโยค จะต้องจำคำก่อนหน้านั้น

การเกิดขึ้นของ RNN สัญญาว่าจะแก้ปัญหานี้ด้วยความช่วยเหลือของเลเยอร์ที่ซ่อนอยู่ หนึ่งในคุณสมบัติหลักของ RNN คือ Hidden State ที่สามารถจดจำข้อมูลบางอย่างตามลำดับได้

RNN มีหน่วยความจำที่สามารถจดจำข้อมูลทั้งหมดเกี่ยวกับการคำนวณได้ สามารถใช้พารามิเตอร์เดียวกันสำหรับทุกอินพุตสำหรับการทำงานเดียวกันกับอินพุตทั้งหมดหรือเลเยอร์ที่ซ่อนอยู่เพื่อสร้างเอาต์พุตที่ต้องการ จะช่วยลดความซับซ้อนของพารามิเตอร์ได้อย่างมาก ซึ่งตรงกันข้ามกับโครงข่ายประสาทเทียมอื่นๆ

ความคิดสุดท้าย

การคำนวณการไล่ระดับสีไม่ได้ขึ้นอยู่กับขั้นตอนปัจจุบันเท่านั้น แต่ยังขึ้นอยู่กับขั้นตอนก่อนหน้าด้วย มีรูปแบบที่เรียกว่าโครงข่ายประสาทเทียมแบบสองทิศทางที่ใช้โดยหลายแอปพลิเคชัน ที่นี่เครือข่ายคำนึงถึงผลลัพธ์ก่อนหน้าและที่คาดหวังในอนาคต ด้วยการแนะนำเลเยอร์ที่ซ่อนอยู่หลายชั้น การเรียนรู้เชิงลึกสามารถทำได้ในโครงข่ายประสาทเทียมที่เกิดซ้ำแบบสองทางตรงไปตรงมา

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับเทคนิค การ เรียนรู้เชิงลึก แมชชีนเลิร์นนิง ให้ดูใบรับรอง PG ของ IIIT-B & upGrad ในการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมอย่างเข้มงวดมากกว่า 240 ชั่วโมง กรณีศึกษามากกว่า 5 กรณี & การมอบหมาย สถานะศิษย์เก่า IIIT-B & ความช่วยเหลืองานกับบริษัทชั้นนำ

เป็นผู้นำการปฏิวัติเทคโนโลยีที่ขับเคลื่อนด้วย AI

PG DIPLOMA ในการเรียนรู้ของเครื่องและปัญญาประดิษฐ์

เรียนรู้เพิ่มเติม