โครงข่ายประสาทแบบเบย์คืออะไร? ความเป็นมา แนวคิดพื้นฐาน & ฟังก์ชัน

เผยแพร่แล้ว: 2020-12-23

สารบัญ

บทนำ
ความเป็นมาของโครงข่ายประสาทแบบเบย์
แนวคิดพื้นฐานของโครงข่ายประสาทเบย์
โครงข่ายประสาทแบบเบย์คืออะไร?
Bayesian Neural Nets (BNN) ทำงานอย่างไร?
บทสรุป
คุณจะสร้างแบบจำลองกราฟิกจากเครือข่ายแบบเบย์ได้อย่างไร
ความสัมพันธ์ระหว่างเครือข่ายแบบเบย์กับความน่าจะเป็นคืออะไร
พูดถึงสมมติฐานข้อใดข้อหนึ่งที่เครือข่ายเบย์เซียนสร้างขึ้น

บทนำ

บทความนี้กล่าวถึงแนวคิดพื้นฐานของ Bayesian Neural Networks แนวคิดเฉพาะของ Bayesian Neural Networks เกิดขึ้นเมื่อข้อมูลที่มองไม่เห็นถูกป้อนเข้าสู่โครงข่ายประสาทเทียม ทำให้เกิดความไม่แน่นอน

การวัดความไม่แน่นอนนี้ในการทำนาย ซึ่งขาดหายไปจากสถาปัตยกรรมโครงข่ายประสาทเทียม คือสิ่งที่ Bayesian Neural Nets อธิบาย มันจัดการกับ overfitting แต่ยังช่วยในคุณสมบัติเพิ่มเติมเช่นการประมาณความไม่แน่นอนและการแจกแจงความน่าจะเป็น มีการอธิบายแนวคิดของ Neural Networks ด้วยเช่นกัน

อ่าน: ประเภทของการเรียนรู้ภายใต้การดูแล

ความเป็นมาของโครงข่ายประสาทแบบเบย์

เมื่อเปรียบเทียบหนึ่งในระบบปัญญาประดิษฐ์ที่มีประสิทธิภาพดีที่สุดในช่วงสิบปีที่ผ่านมา เครื่องจักรเหล่านี้ทั้งหมดมีสิ่งหนึ่งที่เหมือนกัน นั่นคือ การผสมผสานเทคนิคที่ซับซ้อนที่เรียกว่าการเรียนรู้เชิงลึก

ตัดเปิดแนวคิด Deep Learning ออกมา สังเกตได้ว่าเป็นชื่อที่เอื้อให้เกิดแนวทางที่ค่อนข้างใหม่ต่อปัญญาประดิษฐ์ เรียกว่า Neural Networks ซึ่งมีแนวโน้มไม่คงที่มาเป็นเวลากว่า 70 ปีแล้ว ตัวอย่างเช่น มีการสังเกตว่าแนวคิดของ Neural Nets มีพื้นฐานมาจากสมองของมนุษย์อย่างคลุมเครือ ซึ่งประกอบด้วยโหนดประมวลผลหลายล้านโหนดที่เชื่อมต่อกันเป็นตาข่ายที่หนาแน่นเช่นเดียวกับสายไฟที่พันกัน

ดังนั้น Bayesian Neural Networks จึงจัดการกับปัญหาความไม่แน่นอนในข้อมูลการฝึกอบรมได้อย่างสะดวก

แนวคิดพื้นฐานของโครงข่ายประสาทเบย์

Neural Networks หรือที่รู้จักกันอย่างแพร่หลายในชื่อ Neural Nets คือวิธีการเรียนรู้ของเครื่องที่มีประสิทธิภาพ ซึ่งคอมพิวเตอร์จะเรียนรู้ วิเคราะห์ และดำเนินการต่างๆ โดยการวิเคราะห์ตัวอย่างการฝึกอบรม ตัวอย่างที่ใช้ส่วนใหญ่จะติดฉลากด้วยมือล่วงหน้า ตัวอย่างเช่น ใช้ระบบจดจำวัตถุ

ให้หรือป้อนข้อมูลเกี่ยวกับภาพที่ติดฉลากของรถยนต์ รถยนต์ บ้าน หรือวัตถุใดๆ จากนั้นจะสร้างการอนุมานเชิงตรรกะในรูปแบบภาพที่แทรกเป็นข้อมูลที่จะสัมพันธ์กับป้ายกำกับเฉพาะอื่นๆ

สถาปนิกที่ทำงานร่วมกับ Neural Nets ได้รับชัยชนะในการทำลายและเรียนรู้การแมปอินพุตและเอาต์พุตที่ซับซ้อนมากจากข้อมูล อย่างไรก็ตาม ความรู้พื้นฐานเกี่ยวกับอินพุตเดียวกันและระบบการจับคู่เอาต์พุตมักจะไม่พึงพอใจกับสถานการณ์ส่วนใหญ่ โดยเฉพาะอย่างยิ่งเมื่อมีความจำเป็นในการรวมความเชื่อของแบบจำลองเฉพาะหรือในสถานการณ์ที่ข้อมูลมีจำกัด

Bayesian Neural Networks เป็นเกณฑ์หรือพารามิเตอร์ที่อยู่ภายใต้สถานการณ์ส่วนใหญ่แสดงเป็นการแจกแจงและมักจะเรียนรู้ผ่านแนวคิดของการอนุมานแบบเบย์เมื่อเปรียบเทียบกับค่าที่กำหนด พวกเขามีความสามารถภายในในการแยกแยะฟังก์ชันที่ซับซ้อนและไม่เชิงเส้นจากข้อมูล จากนั้นจึงแสดงความไม่แน่นอน - ทั้งสองอย่างพร้อมกัน ด้วยเหตุนี้จึงทำให้พวกเขามีบทบาทที่สูงขึ้นในการแสวงหาและสร้าง AI ที่น่าเชื่อถือและมีความสามารถมากขึ้น

ต้องอ่าน: ประเภทของแบบจำลองการถดถอยในการเรียนรู้ของเครื่อง

โครงข่ายประสาทแบบเบย์คืออะไร?

ดังนั้น Bayesian Neural Network หมายถึงส่วนขยายของเครือข่ายมาตรฐานที่เกี่ยวข้องกับการอนุมานครั้งก่อน Bayesian Neural Networks พิสูจน์แล้วว่ามีประสิทธิภาพอย่างยิ่งในการตั้งค่าเฉพาะเมื่อความไม่แน่นอนสูงและแน่นอน สถานการณ์เหล่านี้ได้แก่ ระบบการตัดสินใจ หรือการตั้งค่าข้อมูลที่ค่อนข้างต่ำ หรือการเรียนรู้โดยใช้แบบจำลองใดๆ

Deep Neural Networks (DNN) มักจะสร้างการอนุมานเชิงตรรกะกับข้อมูลที่กำหนดโดยไม่ต้องมีประสบการณ์กับชุดข้อมูลมาก่อน เป็นผลให้พวกเขาทำงานได้ดีเป็นพิเศษกับข้อมูลที่ไม่เชิงเส้นโดยธรรมชาติ ดังนั้นจึงต้องการข้อมูลจำนวนมากสำหรับวัตถุประสงค์การฝึกอบรมเพียงผู้เดียว เนื่องจากมีการโหลดข้อมูลเพิ่มเติม ปัญหาของพื้นผิว overfitting

ปัญหาที่เกิดขึ้นในสถานการณ์ปัจจุบันคือโครงข่ายประสาทตามที่สังเกตก่อนหน้านี้ทำงานได้ดีเป็นพิเศษกับข้อมูลที่ป้อนเพื่อวัตถุประสงค์ในการฝึกอบรมเพียงอย่างเดียว แต่จะมีแนวโน้มต่ำกว่าเมื่อป้อนข้อมูลใหม่และต่างประเทศเข้าสู่ระบบ ส่งผลให้ Nets มองไม่เห็นความไม่แน่นอนบางอย่างในข้อมูลการฝึกอบรม ทำให้พวกเขามั่นใจในการคาดการณ์มากเกินไป ซึ่งอาจทำให้เข้าใจผิดได้ เพื่อหลีกเลี่ยงข้อผิดพลาดเช่นนี้ จึงใช้ Bayesian Neural Networks

Bayesian Neural Nets (BNN) ทำงานอย่างไร?

วัตถุประสงค์หลักและแนวคิดเบื้องหลังโครงข่ายประสาทแบบเบย์คือทุกหน่วยเชื่อมโยงกับการกระจายความน่าจะเป็น ซึ่งรวมถึงน้ำหนักและอคติ

สิ่งเหล่านี้เรียกว่าตัวแปรสุ่มซึ่งจะให้ค่าที่แตกต่างกันโดยสิ้นเชิงในแต่ละครั้งที่มีการเข้าถึง

ยกตัวอย่าง ถ้า X เป็นตัวแปรและเป็นตัวแปรสุ่มโดยสมบูรณ์ แสดงว่ามีการแจกแจงแบบปกติ ทุกครั้งที่เข้าถึง X จะได้รับค่าที่แตกต่างกันของ X กระบวนการในการรับค่าความแตกต่างของแต่ละครั้งที่มีการดึงค่าของ X เรียกว่าการสุ่มตัวอย่าง ค่าที่ได้มาจากทุกตัวอย่างจะขึ้นอยู่กับการกระจายความน่าจะเป็น

เมื่อความน่าจะเป็นของการแจกแจงความน่าจะเป็นเพิ่มขึ้น ความไม่แน่นอนจะเป็นสัดส่วนโดยตรง เป็นผลให้มันเพิ่มขึ้นเช่นกัน โดยปกติในโครงข่ายประสาทเทียม ทุกชั้นจะมีน้ำหนักที่คงที่ โดยมีอคติที่มักจะพิจารณาถึงผลลัพธ์ ในทางกลับกัน Bayesian Network จะมีการกระจายความน่าจะเป็นที่จะแนบไปกับเลเยอร์นั้นเอง

มีการส่งต่อหลายครั้งในแต่ละครั้ง โดยมีชุดน้ำหนักใหม่และอคติ จึงใช้เพื่อจัดการกับปัญหาการจัดหมวดหมู่ เอาต์พุตมีให้สำหรับการส่งแต่ละครั้งในลักษณะไปข้างหน้า ข้อมูลที่อัปโหลดเป็นภาพอินพุตเป็นสิ่งที่นำไปสู่ความไม่แน่นอนที่เพิ่มขึ้น ในกรณีเช่นนี้ มันเป็นภาพที่เน็ตไม่เคยพบมาก่อนสำหรับคลาสเอาต์พุต

บทสรุป

สรุปได้อย่างปลอดภัยว่า Bayesian Neural Networks เป็นพรในการบูรณาการและจัดการกับความไม่แน่นอน พวกเขายังได้แสดงเพื่อปรับปรุงประสิทธิภาพการทำนาย

ปัญหาพื้นฐานเบื้องต้นที่เกิดขึ้นในการพัฒนา Bayesian Neural Network หรือแบบจำลองใดๆ ตามความน่าจะเป็นคือการคำนวณที่ยากต่อการแจกแจงครั้งก่อนและความคาดหวังตามลำดับ ยิ่งไปกว่านั้น ชัดเจนเป็นพิเศษว่าปัญหาเรื่องน้ำหนักเกินนั้นได้รับการจัดการอย่างเข้มงวดโดย Bayesian Networks

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ IIIT- สถานะศิษย์เก่า B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

คุณจะสร้างแบบจำลองกราฟิกจากเครือข่ายแบบเบย์ได้อย่างไร

โดยการเชื่อมโยงโหนดทั้งหมดที่เกี่ยวข้องในแต่ละส่วนประกอบ เครือข่าย Bayesian อาจกลายเป็นแบบจำลองกราฟิกแบบไม่มีทิศทาง สิ่งนี้จำเป็นต้องรวมพาเรนต์ของแต่ละโหนดเข้าด้วยกัน กราฟคุณธรรมคือกราฟที่ไม่มีทิศทางซึ่งสอดคล้องกับเครือข่ายแบบเบย์โดยเฉพาะ การคำนวณกราฟคุณธรรมเป็นขั้นตอนแรกในเทคนิคการคำนวณเครือข่ายแบบเบย์จำนวนมาก

ความสัมพันธ์ระหว่างเครือข่ายแบบเบย์กับความน่าจะเป็นคืออะไร

เครือข่ายแบบเบย์ถูกสร้างขึ้นโดยใช้กราฟกำกับแบบวนซ้ำ โครงข่ายประสาทแบบเบย์คือแบบจำลองความน่าจะเป็นที่แยกตัวประกอบโดยใช้การแจกแจงความน่าจะเป็นแบบมีเงื่อนไขเดียวสำหรับแต่ละตัวแปรสำหรับแบบจำลองที่กำหนด การกระจายจะขึ้นอยู่กับผู้ปกครองในกราฟ ตัวแปรในกราฟที่แยกออกมายังคงเป็นอิสระ แต่การแยกกราฟพื้นฐานของกราฟแบบไม่ระบุทิศทางจะถูกแทนที่ด้วยการแยก d ที่ยากขึ้น ซึ่งจะพิจารณาถึงอิทธิพลของคำอธิบายที่แข่งขันกันสำหรับค่าที่สังเกตได้

พูดถึงสมมติฐานข้อใดข้อหนึ่งที่เครือข่ายเบย์เซียนสร้างขึ้น

เมื่อเราได้รับการจัดประเภทเป้าหมาย สมมติฐานที่สำคัญสำหรับตัวแยกประเภทแบบเบย์ที่ไร้เดียงสาก็คือ ค่าตัวแปรทั้งหมดเป็นอิสระจากเงื่อนไข สมมติฐานนี้ช่วยอย่างมากในการลดความซับซ้อนของการคำนวณฟังก์ชันวัตถุประสงค์ในแง่ของความน่าจะเป็นภายหลัง อย่างไรก็ตาม สำหรับบางแอปพลิเคชัน เช่น เอกสารข้อความและสัญญาณคำพูด สมมติฐานนี้อาจไม่ถูกต้อง เครือข่ายความเชื่อแบบเบย์อาจเป็นทางเลือกที่มีประโยชน์ในสถานการณ์นี้ พวกเขาใช้ชุดของความน่าจะเป็นที่ไม่ขึ้นกับเงื่อนไข แทนที่จะกำหนดค่าที่เป็นไปได้ทั้งหมดบนตัวแปรทั้งหมด