บทช่วยสอนเกี่ยวกับโครงข่ายประสาทเทียม: คำแนะนำทีละขั้นตอนสำหรับผู้เริ่มต้น
เผยแพร่แล้ว: 2019-11-20ในด้านการเรียนรู้ของเครื่อง มีแนวคิดที่น่าสนใจมากมาย ในบทช่วยสอนเกี่ยวกับโครงข่ายประสาทเทียมนี้ เราจะพูดถึงหนึ่งในแนวคิดพื้นฐานของโครงข่ายประสาทเทียม บทความนี้จะช่วยคุณในการทำความเข้าใจการทำงานของเครือข่ายเหล่านี้โดยอธิบายทฤษฎีที่อยู่เบื้องหลังสิ่งเดียวกัน
หลังจากเสร็จสิ้นการกวดวิชาโครงข่ายประสาทเทียมนี้ คุณจะพบว่า:
- โครงข่ายประสาทเทียมคืออะไร?
- โครงข่ายประสาทเทียมทำงานอย่างไร?
- โครงข่ายประสาทเทียมมีกี่ประเภท?
สารบัญ
โครงข่ายประสาทเทียมคืออะไร?
โครงข่ายประสาทเทียมเป็นระบบที่ออกแบบมาเพื่อทำหน้าที่เหมือนสมองของมนุษย์ มันค่อนข้างเรียบง่าย แต่แพร่หลายในชีวิตประจำวันของเรา
คำจำกัดความที่ซับซ้อนก็คือโครงข่ายประสาทเทียมเป็นรูปแบบการคำนวณที่มีสถาปัตยกรรมเครือข่าย สถาปัตยกรรมนี้ประกอบด้วยเซลล์ประสาทเทียม โครงสร้างนี้มีพารามิเตอร์เฉพาะซึ่งสามารถแก้ไขได้สำหรับการทำงานบางอย่าง
พวกมันมีคุณสมบัติการประมาณที่กว้างขวาง ซึ่งหมายความว่าสามารถประมาณฟังก์ชันให้มีความแม่นยำระดับใดก็ได้โดยไม่คำนึงถึงมิติข้อมูล Neural Networks พบแอปพลิเคชั่นมากมายในพื้นที่ที่คอมพิวเตอร์แบบเดิมใช้งานไม่ได้ จาก Siri ไปจนถึง Google Maps โครงข่ายประสาทเทียมมีอยู่ในทุกที่ที่ใช้ปัญญาประดิษฐ์
พวกเขาเป็นส่วนสำคัญของการดำเนินงานปัญญาประดิษฐ์ โครงข่ายประสาทได้รับแรงบันดาลใจจากสมองของมนุษย์ ดังนั้นโครงสร้างของพวกมันจึงคล้ายกัน

โครงข่ายประสาทเทียมทำงานอย่างไร
โครงข่ายประสาทเทียมมีหลายชั้น แต่ละชั้นทำหน้าที่เฉพาะ และยิ่งเครือข่ายมีความซับซ้อนมากเท่าใด ก็ยิ่งมีชั้นมากขึ้นเท่านั้น นั่นเป็นสาเหตุที่โครงข่ายประสาทเทียมเรียกอีกอย่างว่าเพอร์เซปตรอนหลายชั้น
รูปแบบที่บริสุทธิ์ที่สุดของโครงข่ายประสาทเทียมมีสามชั้น:
- ชั้นอินพุต
- ชั้นที่ซ่อนอยู่
- ชั้นเอาท์พุท
ตามชื่อที่แนะนำ แต่ละเลเยอร์เหล่านี้มีวัตถุประสงค์เฉพาะ เลเยอร์เหล่านี้ประกอบด้วยโหนด สามารถมีเลเยอร์ที่ซ่อนอยู่ได้หลายชั้นในโครงข่ายประสาทเทียมตามข้อกำหนด เลเยอร์อินพุตจะรับสัญญาณอินพุตและถ่ายโอนไปยังเลเยอร์ถัดไป มันรวบรวมข้อมูลจากโลกภายนอก
เลเยอร์ที่ซ่อนอยู่ทำหน้าที่คำนวณส่วนหลังทั้งหมด เครือข่ายสามารถมีเลเยอร์ที่ซ่อนอยู่เป็นศูนย์ได้ อย่างไรก็ตาม โครงข่ายประสาทเทียมมีอย่างน้อยหนึ่งเลเยอร์ที่ซ่อนอยู่ เลเยอร์ผลลัพธ์จะส่งผลลัพธ์สุดท้ายของการคำนวณของเลเยอร์ที่ซ่อนอยู่
เช่นเดียวกับแอปพลิเคชันแมชชีนเลิร์นนิงอื่นๆ คุณจะต้องฝึกโครงข่ายประสาทเทียมด้วยข้อมูลการฝึกเช่นกัน ก่อนที่คุณจะระบุปัญหาเฉพาะ แต่ก่อนที่เราจะเจาะลึกลงไปว่าโครงข่ายประสาทแก้ปัญหาได้อย่างไร คุณควรทราบเกี่ยวกับการทำงานของเลเยอร์ของ perceptron ก่อน:
เลเยอร์ Perceptron ทำงานอย่างไร
โครงข่ายประสาทเทียมประกอบด้วยชั้นของ perceptron หลายชั้น จึงมีชื่อ 'perceptron หลายชั้น' เลเยอร์เหล่านี้เรียกอีกอย่างว่าเลเยอร์ที่ซ่อนอยู่ของชั้นหนาแน่น ประกอบด้วยนิวตรอนของเพอร์เซปตรอนจำนวนมาก เป็นหน่วยหลักที่ทำงานร่วมกันเพื่อสร้างเลเยอร์การรับรู้ เซลล์ประสาทเหล่านี้รับข้อมูลในชุดอินพุต คุณรวมอินพุตตัวเลขเหล่านี้กับอคติและกลุ่มของน้ำหนัก ซึ่งจะสร้างเอาต์พุตเดี่ยว
สำหรับการคำนวณ เซลล์ประสาทแต่ละเซลล์จะพิจารณาน้ำหนักและอคติ จากนั้น ฟังก์ชันการรวมกันจะใช้น้ำหนักและความเอนเอียงเพื่อให้ผลลัพธ์ (อินพุตที่แก้ไข) มันทำงานผ่านสมการต่อไปนี้:
การรวมกัน = อคติ + น้ำหนัก * อินพุต
หลังจากนี้ ฟังก์ชันการเปิดใช้งานจะสร้างเอาต์พุตด้วยสมการต่อไปนี้:
เอาต์พุต = การเปิดใช้งาน (รวมกัน)
ฟังก์ชันนี้กำหนดบทบาทของโครงข่ายประสาทเทียม พวกมันสร้างเลเยอร์ของเครือข่าย ต่อไปนี้เป็นฟังก์ชันการเปิดใช้งานที่แพร่หลาย:
ฟังก์ชันเชิงเส้น
ในฟังก์ชันนี้ ผลลัพธ์เป็นเพียงการรวมกันของเซลล์ประสาทเท่านั้น:
การเปิดใช้งาน = การรวมกัน
ฟังก์ชันไฮเพอร์โบลิกแทนเจนต์
เป็นฟังก์ชันการเปิดใช้งานที่ได้รับความนิยมมากที่สุดในบรรดาโครงข่ายประสาทเทียม เป็นฟังก์ชัน sigmoid และอยู่ระหว่าง -1 ถึง +1:
การเปิดใช้งาน = tanh (รวมกัน)
ฟังก์ชันลอจิสติกส์
ฟังก์ชันลอจิสติกค่อนข้างคล้ายกับฟังก์ชันไฮเปอร์โบลิกแทนเจนต์เพราะเป็นฟังก์ชันซิกมอยด์เช่นกัน อย่างไรก็ตาม มันต่างกันเพราะมันอยู่ระหว่าง 0 ถึง 1:
การเปิดใช้งาน = 1 1 + e -combination
ฟังก์ชันหน่วยเชิงเส้นตรง
เช่นเดียวกับฟังก์ชันไฮเปอร์โบลิกแทนเจนต์ ฟังก์ชันหน่วยเชิงเส้นที่แก้ไขก็แพร่หลายเช่นกัน อีกชื่อหนึ่งสำหรับฟังก์ชันหน่วยเชิงเส้นตรงที่แก้ไขคือ ReLU ReLU เท่ากับชุดค่าผสมเมื่อมีค่าเท่ากับหรือมากกว่าศูนย์ และเป็นค่าลบหากชุดค่าผสมต่ำกว่าศูนย์ (ค่าลบ)
ดังนั้นโครงข่ายประสาทเทียมทำงานอย่างไร?
ตอนนี้คุณรู้แล้วว่าโครงข่ายประสาทเทียมมีอะไรบ้างและทำงานอย่างไร เราสามารถมุ่งความสนใจไปที่การทำงานของโครงข่ายประสาทเทียมได้
นี่คือวิธีการทำงาน:
- ข้อมูลถูกป้อนเข้าสู่เลเยอร์อินพุตซึ่งถ่ายโอนไปยังเลเยอร์ที่ซ่อนอยู่
- การเชื่อมต่อระหว่างสองชั้นกำหนดน้ำหนักให้กับแต่ละอินพุตแบบสุ่ม
- อคติที่เพิ่มเข้าไปในทุกๆ อินพุตหลังจากที่นำน้ำหนักมาคูณกับน้ำหนักแต่ละค่าแล้ว
- ผลรวมถ่วงน้ำหนักจะถูกโอนไปยังฟังก์ชันการเปิดใช้งาน
- ฟังก์ชันการเปิดใช้งานกำหนดว่าโหนดใดควรเริ่มทำงานสำหรับการดึงคุณลักษณะ
- โมเดลใช้ฟังก์ชันแอปพลิเคชันกับเลเยอร์เอาต์พุตเพื่อส่งมอบเอาต์พุต
- มีการปรับน้ำหนัก และเอาต์พุตถูกขยายกลับเพื่อลดข้อผิดพลาด
โมเดลใช้ฟังก์ชันต้นทุนเพื่อลดอัตราข้อผิดพลาด คุณจะต้องเปลี่ยนน้ำหนักด้วยรูปแบบการฝึกที่แตกต่างกัน

- โมเดลเปรียบเทียบผลลัพธ์กับผลลัพธ์ดั้งเดิม
- ทำซ้ำขั้นตอนเพื่อปรับปรุงความแม่นยำ
โมเดลจะปรับน้ำหนักในการทำซ้ำทุกครั้งเพื่อเพิ่มความแม่นยำของเอาต์พุต
เข้าร่วม หลักสูตรปัญญาประดิษฐ์ ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท โปรแกรม Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
ประเภทของโครงข่ายประสาทเทียม
1) โครงข่ายประสาทกำเริบ (RNN)
ในเครือข่ายนี้ เอาต์พุตของเลเยอร์จะถูกบันทึกและโอนกลับไปยังอินพุต ด้วยวิธีนี้ โหนดของเลเยอร์เฉพาะจะจดจำข้อมูลบางอย่างเกี่ยวกับขั้นตอนที่ผ่านมา การรวมกันของเลเยอร์อินพุตเป็นผลคูณของผลรวมของน้ำหนักและคุณสมบัติ กระบวนการโครงข่ายประสาทเทียมที่เกิดซ้ำเริ่มขึ้นในเลเยอร์ที่ซ่อนอยู่
ที่นี่ แต่ละโหนดจะจดจำข้อมูลบางอย่างของขั้นตอนก่อนหน้า โมเดลจะเก็บข้อมูลบางส่วนจากการทำซ้ำแต่ละครั้ง ซึ่งสามารถใช้ได้ในภายหลัง ระบบเรียนรู้ด้วยตนเองเมื่อผลลัพธ์ผิดพลาด จากนั้นจะใช้ข้อมูลนั้นเพื่อเพิ่มความแม่นยำของการทำนายในการขยายพันธุ์ด้านหลัง แอปพลิเคชั่นยอดนิยมของ RNN อยู่ในเทคโนโลยีการแปลงข้อความเป็นคำพูด
2) Convolutional Neural Network (CNN)
เครือข่ายนี้ประกอบด้วยชั้นการบิดเบี้ยวหนึ่งชั้นหรือหลายชั้น Convolutional Layer ที่มีอยู่ในเครือข่ายนี้ใช้ฟังก์ชัน Convolutional กับอินพุตก่อนที่จะถ่ายโอนไปยังเลเยอร์ถัดไป ด้วยเหตุนี้เครือข่ายจึงมีพารามิเตอร์น้อยลง แต่มีความลึกซึ้งยิ่งขึ้น CNN ใช้กันอย่างแพร่หลายในการประมวลผลภาษาธรรมชาติและการจดจำภาพ
3) Radial Basis Function Neural Network (RBFNN)
โครงข่ายประสาทเทียมนี้ใช้ฟังก์ชันพื้นฐานแนวรัศมี ฟังก์ชันนี้พิจารณาระยะห่างของจุดจากจุดศูนย์กลาง เครือข่ายเหล่านี้ประกอบด้วยสองชั้น เลเยอร์ที่ซ่อนอยู่จะรวมคุณสมบัติต่างๆ เข้ากับฟังก์ชันพื้นฐานแนวรัศมี และถ่ายโอนเอาต์พุตไปยังเลเยอร์ถัดไป
เลเยอร์ถัดไปทำงานเหมือนกันในขณะที่ใช้เอาต์พุตของเลเยอร์ก่อนหน้า โครงข่ายประสาทฟังก์ชันพื้นฐานแนวรัศมีใช้ในระบบไฟฟ้า

4) โครงข่ายประสาทฟีดฟอร์เวิร์ด (FNN)
นี่เป็นรูปแบบที่บริสุทธิ์ที่สุดของโครงข่ายประสาทเทียม ในเครือข่ายนี้ ข้อมูลจะเคลื่อนที่ไปในทิศทางเดียว กล่าวคือ จากเลเยอร์อินพุตไปยังเลเยอร์เอาต์พุต ในเครือข่ายนี้ เลเยอร์เอาต์พุตจะได้รับผลรวมของผลิตภัณฑ์ของอินพุตและน้ำหนัก ไม่มีการแพร่กระจายกลับในโครงข่ายประสาทเทียมนี้ เครือข่ายเหล่านี้อาจมีเลเยอร์ที่ซ่อนอยู่หลายชั้นหรือเป็นศูนย์ สิ่งเหล่านี้ง่ายต่อการบำรุงรักษาและค้นหาแอปพลิเคชั่นในการจดจำใบหน้า
5) โครงข่ายประสาทแบบโมดูลาร์
เครือข่ายนี้มีเครือข่ายหลายเครือข่ายที่ทำงานอย่างอิสระ พวกเขาทั้งหมดทำงานเฉพาะ แต่ไม่ได้โต้ตอบกันระหว่างกระบวนการคำนวณ
ด้วยวิธีนี้ โครงข่ายประสาทเทียมแบบโมดูลาร์สามารถทำงานที่ซับซ้อนสูงและมีประสิทธิภาพสูงขึ้นมาก เครือข่ายเหล่านี้รักษาได้ยากกว่าเมื่อเปรียบเทียบกับเครือข่ายที่ง่ายกว่า (เช่น FNN) แต่ยังให้ผลลัพธ์ที่รวดเร็วกว่าสำหรับงานที่ซับซ้อน
เรียนรู้เพิ่มเติมเกี่ยวกับโครงข่ายประสาทเทียม
เพียงเท่านี้ในบทช่วยสอนเกี่ยวกับโครงข่ายประสาทเทียมของเรา คุณต้องเคยเห็นสิ่งที่เครือข่ายเหล่านี้สามารถทำงานต่างๆ ได้ ใช้ในเทคโนโลยีเกือบทั้งหมดที่เราใช้ทุกวัน หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับโครงข่ายประสาทเทียม คุณสามารถตรวจสอบแคตตาล็อกหลักสูตรเกี่ยวกับปัญญาประดิษฐ์และการเรียนรู้ของเครื่องได้
คุณสามารถตรวจสอบ Executive PG Program ของเราใน Machine Learning & AI ซึ่ง จัดให้มีการประชุมเชิงปฏิบัติการเชิงปฏิบัติ ที่ปรึกษาในอุตสาหกรรมแบบตัวต่อตัว กรณีศึกษาและการมอบหมาย 12 กรณี สถานะศิษย์เก่า IIIT-B และอื่นๆ
โครงข่ายประสาทเทียมทำงานอย่างไร?
เลเยอร์อินพุตรับข้อมูลและส่งผ่านไปยังเลเยอร์ที่ซ่อนอยู่ มีการสุ่มกำหนดน้ำหนักให้กับอินพุตแต่ละรายการโดยการเชื่อมโยงระหว่างสองชั้น หลังจากที่นำน้ำหนักมาคูณกับน้ำหนักทีละตัวแล้ว จะมีการใช้อคติกับอินพุตแต่ละรายการ สำหรับฟังก์ชันการเปิดใช้งาน ยอดรวมถ่วงน้ำหนักจะถูกส่งผ่าน สำหรับการดึงข้อมูลคุณลักษณะ ฟังก์ชันการเปิดใช้งานจะกำหนดว่าโหนดใดควรเริ่มทำงาน ในการส่งข้อมูลออก โมเดลใช้ฟังก์ชันแอปพลิเคชันบนเลเยอร์เอาต์พุต เพื่อลดข้อผิดพลาด มีการดัดแปลงน้ำหนักและเอาต์พุตจะถูกขยายกลับ
โครงข่ายประสาทกำเริบคืออะไร?
เอาต์พุตของเลเยอร์จะถูกจัดเก็บและส่งกลับไปยังอินพุตในเครือข่ายนี้ เป็นผลให้โหนดของเลเยอร์เฉพาะเก็บข้อมูลบางอย่างเกี่ยวกับการกระทำก่อนหน้า น้ำหนักและคุณสมบัติทั้งหมดเป็นตัวกำหนดการรวมกันของเลเยอร์อินพุต เลเยอร์ที่ซ่อนอยู่คือจุดเริ่มต้นของกระบวนการที่ใช้ rnn แต่ละโหนดที่นี่จะจำส่วนหนึ่งของข้อมูลจากสเตจก่อนหน้า โมเดลจะบันทึกข้อมูลบางส่วนจากการทำซ้ำแต่ละครั้งเพื่อให้สามารถใช้งานได้ในภายหลัง เมื่อผลลัพธ์ของระบบไม่ถูกต้องก็จะเรียนรู้ด้วยตนเอง จากนั้นจะใช้ความรู้นั้นเพื่อเพิ่มประสิทธิภาพความแม่นยำของการพยากรณ์การแพร่กระจายกลับ เทคโนโลยีการแปลงข้อความเป็นคำพูดเป็นแอปพลิเคชั่นทั่วไปของ RNN
Perceptron หลายชั้นทำงานอย่างไร
ชื่อ 'perceptron หลายชั้น' มาจากข้อเท็จจริงที่ว่าโครงข่ายประสาทเทียมประกอบด้วยชั้นของ perceptron หลายชั้น เลเยอร์เหล่านี้เรียกอีกอย่างว่าเลเยอร์หนาแน่นพร้อมเลเยอร์ที่ซ่อนอยู่ ประกอบด้วยนิวตรอนของเพอร์เซปตรอนจำนวนมาก พวกมันคือหน่วยการสร้างพื้นฐานที่ประกอบเป็นเลเยอร์ของเพอร์เซปตรอน ข้อมูลในการรวบรวมอินพุตจะไปถึงเซลล์ประสาทเหล่านี้ อินพุตตัวเลขเหล่านี้รวมกับอคติและกลุ่มของน้ำหนักเพื่อสร้างเอาต์พุตเดี่ยว