บทช่วยสอนเกี่ยวกับโครงข่ายประสาทเทียม: คำแนะนำทีละขั้นตอนสำหรับผู้เริ่มต้น

เผยแพร่แล้ว: 2019-11-20

ในด้านการเรียนรู้ของเครื่อง มีแนวคิดที่น่าสนใจมากมาย ในบทช่วยสอนเกี่ยวกับโครงข่ายประสาทเทียมนี้ เราจะพูดถึงหนึ่งในแนวคิดพื้นฐานของโครงข่ายประสาทเทียม บทความนี้จะช่วยคุณในการทำความเข้าใจการทำงานของเครือข่ายเหล่านี้โดยอธิบายทฤษฎีที่อยู่เบื้องหลังสิ่งเดียวกัน

หลังจากเสร็จสิ้นการกวดวิชาโครงข่ายประสาทเทียมนี้ คุณจะพบว่า:

โครงข่ายประสาทเทียมคืออะไร?
โครงข่ายประสาทเทียมทำงานอย่างไร?
โครงข่ายประสาทเทียมมีกี่ประเภท?

สารบัญ

โครงข่ายประสาทเทียมคืออะไร?
โครงข่ายประสาทเทียมทำงานอย่างไร
- เลเยอร์ Perceptron ทำงานอย่างไร
  - ฟังก์ชันเชิงเส้น
  - ฟังก์ชันลอจิสติกส์
  - ฟังก์ชันหน่วยเชิงเส้นตรง
ดังนั้นโครงข่ายประสาทเทียมทำงานอย่างไร?
ประเภทของโครงข่ายประสาทเทียม
- 1) โครงข่ายประสาทกำเริบ (RNN)
- 2) Convolutional Neural Network (CNN)
- 3) Radial Basis Function Neural Network (RBFNN)
- 4) โครงข่ายประสาทฟีดฟอร์เวิร์ด (FNN)
- 5) โครงข่ายประสาทแบบโมดูลาร์
เรียนรู้เพิ่มเติมเกี่ยวกับโครงข่ายประสาทเทียม
โครงข่ายประสาทเทียมทำงานอย่างไร?
โครงข่ายประสาทกำเริบคืออะไร?
Perceptron หลายชั้นทำงานอย่างไร
อะไรคือความแตกต่างระหว่างปัญญาประดิษฐ์และปัญญาธุรกิจ?
ภาษาโปรแกรมที่ดีที่สุดที่ใช้ในปัญญาประดิษฐ์คืออะไร?
มีข้อกำหนดเบื้องต้นใด ๆ ในการศึกษาโครงข่ายประสาทเทียมในการเรียนรู้ของเครื่องหรือไม่?

โครงข่ายประสาทเทียมคืออะไร?

โครงข่ายประสาทเทียมเป็นระบบที่ออกแบบมาเพื่อทำหน้าที่เหมือนสมองของมนุษย์ มันค่อนข้างเรียบง่าย แต่แพร่หลายในชีวิตประจำวันของเรา

คำจำกัดความที่ซับซ้อนก็คือโครงข่ายประสาทเทียมเป็นรูปแบบการคำนวณที่มีสถาปัตยกรรมเครือข่าย สถาปัตยกรรมนี้ประกอบด้วยเซลล์ประสาทเทียม โครงสร้างนี้มีพารามิเตอร์เฉพาะซึ่งสามารถแก้ไขได้สำหรับการทำงานบางอย่าง

พวกมันมีคุณสมบัติการประมาณที่กว้างขวาง ซึ่งหมายความว่าสามารถประมาณฟังก์ชันให้มีความแม่นยำระดับใดก็ได้โดยไม่คำนึงถึงมิติข้อมูล Neural Networks พบแอปพลิเคชั่นมากมายในพื้นที่ที่คอมพิวเตอร์แบบเดิมใช้งานไม่ได้ จาก Siri ไปจนถึง Google Maps โครงข่ายประสาทเทียมมีอยู่ในทุกที่ที่ใช้ปัญญาประดิษฐ์

พวกเขาเป็นส่วนสำคัญของการดำเนินงานปัญญาประดิษฐ์ โครงข่ายประสาทได้รับแรงบันดาลใจจากสมองของมนุษย์ ดังนั้นโครงสร้างของพวกมันจึงคล้ายกัน

โครงข่ายประสาทเทียมทำงานอย่างไร

โครงข่ายประสาทเทียมมีหลายชั้น แต่ละชั้นทำหน้าที่เฉพาะ และยิ่งเครือข่ายมีความซับซ้อนมากเท่าใด ก็ยิ่งมีชั้นมากขึ้นเท่านั้น นั่นเป็นสาเหตุที่โครงข่ายประสาทเทียมเรียกอีกอย่างว่าเพอร์เซปตรอนหลายชั้น

รูปแบบที่บริสุทธิ์ที่สุดของโครงข่ายประสาทเทียมมีสามชั้น:

ชั้นอินพุต
ชั้นที่ซ่อนอยู่
ชั้นเอาท์พุท

ตามชื่อที่แนะนำ แต่ละเลเยอร์เหล่านี้มีวัตถุประสงค์เฉพาะ เลเยอร์เหล่านี้ประกอบด้วยโหนด สามารถมีเลเยอร์ที่ซ่อนอยู่ได้หลายชั้นในโครงข่ายประสาทเทียมตามข้อกำหนด เลเยอร์อินพุตจะรับสัญญาณอินพุตและถ่ายโอนไปยังเลเยอร์ถัดไป มันรวบรวมข้อมูลจากโลกภายนอก

เลเยอร์ที่ซ่อนอยู่ทำหน้าที่คำนวณส่วนหลังทั้งหมด เครือข่ายสามารถมีเลเยอร์ที่ซ่อนอยู่เป็นศูนย์ได้ อย่างไรก็ตาม โครงข่ายประสาทเทียมมีอย่างน้อยหนึ่งเลเยอร์ที่ซ่อนอยู่ เลเยอร์ผลลัพธ์จะส่งผลลัพธ์สุดท้ายของการคำนวณของเลเยอร์ที่ซ่อนอยู่

เช่นเดียวกับแอปพลิเคชันแมชชีนเลิร์นนิงอื่นๆ คุณจะต้องฝึกโครงข่ายประสาทเทียมด้วยข้อมูลการฝึกเช่นกัน ก่อนที่คุณจะระบุปัญหาเฉพาะ แต่ก่อนที่เราจะเจาะลึกลงไปว่าโครงข่ายประสาทแก้ปัญหาได้อย่างไร คุณควรทราบเกี่ยวกับการทำงานของเลเยอร์ของ perceptron ก่อน:

เลเยอร์ Perceptron ทำงานอย่างไร

โครงข่ายประสาทเทียมประกอบด้วยชั้นของ perceptron หลายชั้น จึงมีชื่อ 'perceptron หลายชั้น' เลเยอร์เหล่านี้เรียกอีกอย่างว่าเลเยอร์ที่ซ่อนอยู่ของชั้นหนาแน่น ประกอบด้วยนิวตรอนของเพอร์เซปตรอนจำนวนมาก เป็นหน่วยหลักที่ทำงานร่วมกันเพื่อสร้างเลเยอร์การรับรู้ เซลล์ประสาทเหล่านี้รับข้อมูลในชุดอินพุต คุณรวมอินพุตตัวเลขเหล่านี้กับอคติและกลุ่มของน้ำหนัก ซึ่งจะสร้างเอาต์พุตเดี่ยว

สำหรับการคำนวณ เซลล์ประสาทแต่ละเซลล์จะพิจารณาน้ำหนักและอคติ จากนั้น ฟังก์ชันการรวมกันจะใช้น้ำหนักและความเอนเอียงเพื่อให้ผลลัพธ์ (อินพุตที่แก้ไข) มันทำงานผ่านสมการต่อไปนี้:

การรวมกัน = อคติ + น้ำหนัก * อินพุต

หลังจากนี้ ฟังก์ชันการเปิดใช้งานจะสร้างเอาต์พุตด้วยสมการต่อไปนี้:

เอาต์พุต = การเปิดใช้งาน (รวมกัน)

ฟังก์ชันนี้กำหนดบทบาทของโครงข่ายประสาทเทียม พวกมันสร้างเลเยอร์ของเครือข่าย ต่อไปนี้เป็นฟังก์ชันการเปิดใช้งานที่แพร่หลาย:

ฟังก์ชันเชิงเส้น

ในฟังก์ชันนี้ ผลลัพธ์เป็นเพียงการรวมกันของเซลล์ประสาทเท่านั้น:

การเปิดใช้งาน = การรวมกัน

ฟังก์ชันไฮเพอร์โบลิกแทนเจนต์

เป็นฟังก์ชันการเปิดใช้งานที่ได้รับความนิยมมากที่สุดในบรรดาโครงข่ายประสาทเทียม เป็นฟังก์ชัน sigmoid และอยู่ระหว่าง -1 ถึง +1:

การเปิดใช้งาน = tanh (รวมกัน)

ฟังก์ชันลอจิสติกส์

ฟังก์ชันลอจิสติกค่อนข้างคล้ายกับฟังก์ชันไฮเปอร์โบลิกแทนเจนต์เพราะเป็นฟังก์ชันซิกมอยด์เช่นกัน อย่างไรก็ตาม มันต่างกันเพราะมันอยู่ระหว่าง 0 ถึง 1:

การเปิดใช้งาน = 1 1 + e -combination

ฟังก์ชันหน่วยเชิงเส้นตรง

เช่นเดียวกับฟังก์ชันไฮเปอร์โบลิกแทนเจนต์ ฟังก์ชันหน่วยเชิงเส้นที่แก้ไขก็แพร่หลายเช่นกัน อีกชื่อหนึ่งสำหรับฟังก์ชันหน่วยเชิงเส้นตรงที่แก้ไขคือ ReLU ReLU เท่ากับชุดค่าผสมเมื่อมีค่าเท่ากับหรือมากกว่าศูนย์ และเป็นค่าลบหากชุดค่าผสมต่ำกว่าศูนย์ (ค่าลบ)

ดังนั้นโครงข่ายประสาทเทียมทำงานอย่างไร?

ตอนนี้คุณรู้แล้วว่าโครงข่ายประสาทเทียมมีอะไรบ้างและทำงานอย่างไร เราสามารถมุ่งความสนใจไปที่การทำงานของโครงข่ายประสาทเทียมได้

นี่คือวิธีการทำงาน:

ข้อมูลถูกป้อนเข้าสู่เลเยอร์อินพุตซึ่งถ่ายโอนไปยังเลเยอร์ที่ซ่อนอยู่
การเชื่อมต่อระหว่างสองชั้นกำหนดน้ำหนักให้กับแต่ละอินพุตแบบสุ่ม
อคติที่เพิ่มเข้าไปในทุกๆ อินพุตหลังจากที่นำน้ำหนักมาคูณกับน้ำหนักแต่ละค่าแล้ว
ผลรวมถ่วงน้ำหนักจะถูกโอนไปยังฟังก์ชันการเปิดใช้งาน
ฟังก์ชันการเปิดใช้งานกำหนดว่าโหนดใดควรเริ่มทำงานสำหรับการดึงคุณลักษณะ
โมเดลใช้ฟังก์ชันแอปพลิเคชันกับเลเยอร์เอาต์พุตเพื่อส่งมอบเอาต์พุต
มีการปรับน้ำหนัก และเอาต์พุตถูกขยายกลับเพื่อลดข้อผิดพลาด

โมเดลใช้ฟังก์ชันต้นทุนเพื่อลดอัตราข้อผิดพลาด คุณจะต้องเปลี่ยนน้ำหนักด้วยรูปแบบการฝึกที่แตกต่างกัน

โมเดลเปรียบเทียบผลลัพธ์กับผลลัพธ์ดั้งเดิม
ทำซ้ำขั้นตอนเพื่อปรับปรุงความแม่นยำ

โมเดลจะปรับน้ำหนักในการทำซ้ำทุกครั้งเพื่อเพิ่มความแม่นยำของเอาต์พุต

เข้าร่วม หลักสูตรปัญญาประดิษฐ์ ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท โปรแกรม Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

ประเภทของโครงข่ายประสาทเทียม

1) โครงข่ายประสาทกำเริบ (RNN)

ในเครือข่ายนี้ เอาต์พุตของเลเยอร์จะถูกบันทึกและโอนกลับไปยังอินพุต ด้วยวิธีนี้ โหนดของเลเยอร์เฉพาะจะจดจำข้อมูลบางอย่างเกี่ยวกับขั้นตอนที่ผ่านมา การรวมกันของเลเยอร์อินพุตเป็นผลคูณของผลรวมของน้ำหนักและคุณสมบัติ กระบวนการโครงข่ายประสาทเทียมที่เกิดซ้ำเริ่มขึ้นในเลเยอร์ที่ซ่อนอยู่

ที่นี่ แต่ละโหนดจะจดจำข้อมูลบางอย่างของขั้นตอนก่อนหน้า โมเดลจะเก็บข้อมูลบางส่วนจากการทำซ้ำแต่ละครั้ง ซึ่งสามารถใช้ได้ในภายหลัง ระบบเรียนรู้ด้วยตนเองเมื่อผลลัพธ์ผิดพลาด จากนั้นจะใช้ข้อมูลนั้นเพื่อเพิ่มความแม่นยำของการทำนายในการขยายพันธุ์ด้านหลัง แอปพลิเคชั่นยอดนิยมของ RNN อยู่ในเทคโนโลยีการแปลงข้อความเป็นคำพูด

2) Convolutional Neural Network (CNN)

เครือข่ายนี้ประกอบด้วยชั้นการบิดเบี้ยวหนึ่งชั้นหรือหลายชั้น Convolutional Layer ที่มีอยู่ในเครือข่ายนี้ใช้ฟังก์ชัน Convolutional กับอินพุตก่อนที่จะถ่ายโอนไปยังเลเยอร์ถัดไป ด้วยเหตุนี้เครือข่ายจึงมีพารามิเตอร์น้อยลง แต่มีความลึกซึ้งยิ่งขึ้น CNN ใช้กันอย่างแพร่หลายในการประมวลผลภาษาธรรมชาติและการจดจำภาพ

3) Radial Basis Function Neural Network (RBFNN)

โครงข่ายประสาทเทียมนี้ใช้ฟังก์ชันพื้นฐานแนวรัศมี ฟังก์ชันนี้พิจารณาระยะห่างของจุดจากจุดศูนย์กลาง เครือข่ายเหล่านี้ประกอบด้วยสองชั้น เลเยอร์ที่ซ่อนอยู่จะรวมคุณสมบัติต่างๆ เข้ากับฟังก์ชันพื้นฐานแนวรัศมี และถ่ายโอนเอาต์พุตไปยังเลเยอร์ถัดไป

เลเยอร์ถัดไปทำงานเหมือนกันในขณะที่ใช้เอาต์พุตของเลเยอร์ก่อนหน้า โครงข่ายประสาทฟังก์ชันพื้นฐานแนวรัศมีใช้ในระบบไฟฟ้า

4) โครงข่ายประสาทฟีดฟอร์เวิร์ด (FNN)

นี่เป็นรูปแบบที่บริสุทธิ์ที่สุดของโครงข่ายประสาทเทียม ในเครือข่ายนี้ ข้อมูลจะเคลื่อนที่ไปในทิศทางเดียว กล่าวคือ จากเลเยอร์อินพุตไปยังเลเยอร์เอาต์พุต ในเครือข่ายนี้ เลเยอร์เอาต์พุตจะได้รับผลรวมของผลิตภัณฑ์ของอินพุตและน้ำหนัก ไม่มีการแพร่กระจายกลับในโครงข่ายประสาทเทียมนี้ เครือข่ายเหล่านี้อาจมีเลเยอร์ที่ซ่อนอยู่หลายชั้นหรือเป็นศูนย์ สิ่งเหล่านี้ง่ายต่อการบำรุงรักษาและค้นหาแอปพลิเคชั่นในการจดจำใบหน้า

5) โครงข่ายประสาทแบบโมดูลาร์

เครือข่ายนี้มีเครือข่ายหลายเครือข่ายที่ทำงานอย่างอิสระ พวกเขาทั้งหมดทำงานเฉพาะ แต่ไม่ได้โต้ตอบกันระหว่างกระบวนการคำนวณ

ด้วยวิธีนี้ โครงข่ายประสาทเทียมแบบโมดูลาร์สามารถทำงานที่ซับซ้อนสูงและมีประสิทธิภาพสูงขึ้นมาก เครือข่ายเหล่านี้รักษาได้ยากกว่าเมื่อเปรียบเทียบกับเครือข่ายที่ง่ายกว่า (เช่น FNN) แต่ยังให้ผลลัพธ์ที่รวดเร็วกว่าสำหรับงานที่ซับซ้อน

เรียนรู้เพิ่มเติมเกี่ยวกับโครงข่ายประสาทเทียม

เพียงเท่านี้ในบทช่วยสอนเกี่ยวกับโครงข่ายประสาทเทียมของเรา คุณต้องเคยเห็นสิ่งที่เครือข่ายเหล่านี้สามารถทำงานต่างๆ ได้ ใช้ในเทคโนโลยีเกือบทั้งหมดที่เราใช้ทุกวัน หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับโครงข่ายประสาทเทียม คุณสามารถตรวจสอบแคตตาล็อกหลักสูตรเกี่ยวกับปัญญาประดิษฐ์และการเรียนรู้ของเครื่องได้

คุณสามารถตรวจสอบ Executive PG Program ของเราใน Machine Learning & AI ซึ่ง จัดให้มีการประชุมเชิงปฏิบัติการเชิงปฏิบัติ ที่ปรึกษาในอุตสาหกรรมแบบตัวต่อตัว กรณีศึกษาและการมอบหมาย 12 กรณี สถานะศิษย์เก่า IIIT-B และอื่นๆ

โครงข่ายประสาทเทียมทำงานอย่างไร?

เลเยอร์อินพุตรับข้อมูลและส่งผ่านไปยังเลเยอร์ที่ซ่อนอยู่ มีการสุ่มกำหนดน้ำหนักให้กับอินพุตแต่ละรายการโดยการเชื่อมโยงระหว่างสองชั้น หลังจากที่นำน้ำหนักมาคูณกับน้ำหนักทีละตัวแล้ว จะมีการใช้อคติกับอินพุตแต่ละรายการ สำหรับฟังก์ชันการเปิดใช้งาน ยอดรวมถ่วงน้ำหนักจะถูกส่งผ่าน สำหรับการดึงข้อมูลคุณลักษณะ ฟังก์ชันการเปิดใช้งานจะกำหนดว่าโหนดใดควรเริ่มทำงาน ในการส่งข้อมูลออก โมเดลใช้ฟังก์ชันแอปพลิเคชันบนเลเยอร์เอาต์พุต เพื่อลดข้อผิดพลาด มีการดัดแปลงน้ำหนักและเอาต์พุตจะถูกขยายกลับ

โครงข่ายประสาทกำเริบคืออะไร?

เอาต์พุตของเลเยอร์จะถูกจัดเก็บและส่งกลับไปยังอินพุตในเครือข่ายนี้ เป็นผลให้โหนดของเลเยอร์เฉพาะเก็บข้อมูลบางอย่างเกี่ยวกับการกระทำก่อนหน้า น้ำหนักและคุณสมบัติทั้งหมดเป็นตัวกำหนดการรวมกันของเลเยอร์อินพุต เลเยอร์ที่ซ่อนอยู่คือจุดเริ่มต้นของกระบวนการที่ใช้ rnn แต่ละโหนดที่นี่จะจำส่วนหนึ่งของข้อมูลจากสเตจก่อนหน้า โมเดลจะบันทึกข้อมูลบางส่วนจากการทำซ้ำแต่ละครั้งเพื่อให้สามารถใช้งานได้ในภายหลัง เมื่อผลลัพธ์ของระบบไม่ถูกต้องก็จะเรียนรู้ด้วยตนเอง จากนั้นจะใช้ความรู้นั้นเพื่อเพิ่มประสิทธิภาพความแม่นยำของการพยากรณ์การแพร่กระจายกลับ เทคโนโลยีการแปลงข้อความเป็นคำพูดเป็นแอปพลิเคชั่นทั่วไปของ RNN

Perceptron หลายชั้นทำงานอย่างไร

ชื่อ 'perceptron หลายชั้น' มาจากข้อเท็จจริงที่ว่าโครงข่ายประสาทเทียมประกอบด้วยชั้นของ perceptron หลายชั้น เลเยอร์เหล่านี้เรียกอีกอย่างว่าเลเยอร์หนาแน่นพร้อมเลเยอร์ที่ซ่อนอยู่ ประกอบด้วยนิวตรอนของเพอร์เซปตรอนจำนวนมาก พวกมันคือหน่วยการสร้างพื้นฐานที่ประกอบเป็นเลเยอร์ของเพอร์เซปตรอน ข้อมูลในการรวบรวมอินพุตจะไปถึงเซลล์ประสาทเหล่านี้ อินพุตตัวเลขเหล่านี้รวมกับอคติและกลุ่มของน้ำหนักเพื่อสร้างเอาต์พุตเดี่ยว