ทำความเข้าใจทฤษฎีการตัดสินใจแบบเบย์ด้วยตัวอย่างง่ายๆ

เผยแพร่แล้ว: 2020-12-24

สารบัญ

บทนำ

เราพบปัญหาการจำแนกประเภทมากมายในชีวิตจริง ตัวอย่างเช่น ร้านค้าอิเล็กทรอนิกส์อาจจำเป็นต้องรู้ว่าลูกค้าเฉพาะช่วงอายุหนึ่งจะซื้อคอมพิวเตอร์หรือไม่ ในบทความนี้ เราจะแนะนำวิธีการที่ชื่อ 'ทฤษฎีการตัดสินใจแบบเบย์' ซึ่งช่วยให้เราตัดสินใจว่าจะเลือกคลาสที่มีความน่าจะเป็น 'x' หรือคลาสตรงข้ามที่มีความน่าจะเป็น 'y' ตามคุณลักษณะบางอย่าง

คำนิยาม

ทฤษฎีการตัดสินใจแบบเบย์ เป็นแนวทางที่เรียบง่ายแต่เป็นพื้นฐานสำหรับปัญหาที่หลากหลาย เช่น การจำแนกรูปแบบ จุดประสงค์ทั้งหมดของทฤษฎีการตัดสินใจแบบเบย์คือการช่วยเราเลือกการตัดสินใจที่จะทำให้เรามี 'ความเสี่ยง' น้อยที่สุด การตัดสินใจใด ๆ ที่เราเลือกมีความเสี่ยงอยู่เสมอ เราจะผ่านความเสี่ยงที่เกี่ยวข้องกับการจัดหมวดหมู่นี้ในบทความนี้

การตัดสินใจขั้นพื้นฐาน

ให้เรายกตัวอย่างที่บริษัทร้านขายอุปกรณ์อิเล็กทรอนิกส์ต้องการทราบว่าลูกค้าจะซื้อคอมพิวเตอร์หรือไม่ ดังนั้นเราจึงมีคลาสการซื้อสองคลาสต่อไปนี้:

w1 – ใช่ (ลูกค้าจะซื้อคอมพิวเตอร์)

w2 – ไม่ (ลูกค้าจะไม่ซื้อคอมพิวเตอร์)

ตอนนี้ เราจะดูบันทึกในอดีตของฐานข้อมูลลูกค้าของเรา เราจะจดจำนวนลูกค้าที่ซื้อคอมพิวเตอร์และจำนวนลูกค้าที่ไม่ซื้อคอมพิวเตอร์ด้วย ตอนนี้เราจะคำนวณความน่าจะเป็นของลูกค้าที่ซื้อคอมพิวเตอร์ ปล่อยให้มันเป็น P(w1) ในทำนองเดียวกัน ความน่าจะเป็นที่ลูกค้าไม่ซื้อลูกค้าคือ P(w2)

ตอนนี้เราจะทำการเปรียบเทียบพื้นฐานสำหรับลูกค้าในอนาคตของเรา

สำหรับลูกค้าใหม่

ถ้า P(w1) > P(w2) ลูกค้าจะซื้อคอมพิวเตอร์ (w1)

และถ้า P(w2) > P(w1) ลูกค้าจะไม่ซื้อคอมพิวเตอร์ (w2)

ที่นี่เราได้แก้ปัญหาการตัดสินใจของเราแล้ว

แต่ปัญหาของวิธีการตัดสินใจขั้นพื้นฐานนี้คืออะไร? พวกคุณส่วนใหญ่อาจเดาถูกแล้ว อ้างอิงจากบันทึกก่อนหน้านี้ จะเป็นการตัดสินใจแบบเดียวกันสำหรับลูกค้าในอนาคตทั้งหมด นี่เป็นเรื่องไร้เหตุผลและไร้สาระ

ดังนั้นเราจึงต้องการบางสิ่งที่จะช่วยเราในการตัดสินใจที่ดีขึ้นสำหรับลูกค้าในอนาคต เราทำได้โดยการแนะนำคุณสมบัติบางอย่าง สมมติว่าเราเพิ่มคุณลักษณะ 'x' โดยที่ 'x' หมายถึงอายุของลูกค้า ด้วยฟีเจอร์ที่เพิ่มเข้ามานี้ เราจะสามารถตัดสินใจได้ดีขึ้น

ในการทำสิ่งนี้ เราต้องรู้ว่าทฤษฎีบทเบย์คืออะไร

อ่าน: ประเภทของการเรียนรู้ภายใต้การดูแล

ทฤษฎีบทเบย์และทฤษฎีการตัดสินใจ

สำหรับคลาส w1 และฟีเจอร์ 'x' เรามี:

P(w1 | x) = P(x | w1) * P(w1) P(x)

มีคำศัพท์ 4 คำในสูตรนี้ที่เราต้องเข้าใจ:

  1. ก่อนหน้า – P(w1) คือความน่าจะเป็นก่อนหน้าที่ w1 เป็นจริงก่อนที่จะสังเกตข้อมูล
  2. หลัง – P(w1 | x) คือความน่าจะเป็นหลังที่ w1 เป็นจริงหลังจากสังเกตข้อมูล
  3. หลักฐาน – P(x) คือความน่าจะเป็นทั้งหมดของข้อมูล
  4. ความน่าจะเป็น – P(x | w1) เป็นข้อมูลเกี่ยวกับ w1 ที่จัดเตรียมโดย 'x'

P(w1 | x) ถูกอ่านว่าเป็นความน่าจะเป็นของ w1 ที่กำหนด x

แม่นยำยิ่งขึ้นคือความน่าจะเป็นที่ลูกค้าจะซื้อคอมพิวเตอร์โดยพิจารณาจากอายุของลูกค้าที่เฉพาะเจาะจง

ตอนนี้เราพร้อมที่จะตัดสินใจแล้ว:

สำหรับลูกค้าใหม่

ถ้า P(w1 | x) > P(w2 | x) ลูกค้าจะซื้อคอมพิวเตอร์ (w1)

และถ้า P(w2 | x) > P(w1 | x) ลูกค้าจะไม่ซื้อคอมพิวเตอร์ (w2)

การตัดสินใจนี้ดูสมเหตุสมผลและน่าเชื่อถือมากกว่า เนื่องจากเรามีคุณสมบัติบางอย่างที่ต้องดำเนินการ และการตัดสินใจของเราขึ้นอยู่กับคุณลักษณะของลูกค้าใหม่และบันทึกในอดีต ไม่ใช่แค่บันทึกในอดีตเหมือนในกรณีก่อนหน้านี้

จากสูตร คุณจะเห็นว่าสำหรับทั้งคลาส w1 และ w2 ตัวส่วน P(x) ของเรามีค่าคงที่ ดังนั้นเราจึงสามารถนำแนวคิดนี้ไปใช้และสร้างการตัดสินใจในรูปแบบอื่นได้ดังนี้:

ถ้า P(x | w1)*P(w1) > P(x | w2)*P(w2) ลูกค้าจะซื้อคอมพิวเตอร์ (w1)

และหาก P(x | w2)*P(w2) > P(x | w1)*P(w1) ลูกค้าจะไม่ซื้อคอมพิวเตอร์ (w2)

เราสามารถสังเกตข้อเท็จจริงที่น่าสนใจได้ที่นี่ ถ้าอย่างไรก็ตาม ความน่าจะเป็นก่อนหน้าของเรา P(w1) และ P(w2) เท่ากัน เราก็ยังสามารถตัดสินใจได้โดยพิจารณาจากความน่าจะเป็นของเรา P(x | w1) และ P(x | w2) ในทำนองเดียวกัน หากความน่าจะเป็นของเราเท่ากัน เราสามารถตัดสินใจโดยพิจารณาจากความน่าจะเป็นก่อนหน้าของเรา P(w1) และ P(w2)

ต้องอ่าน: ประเภทของแบบจำลองการถดถอยในการเรียนรู้ของเครื่อง

การคำนวณความเสี่ยง

ดังที่ได้กล่าวไว้ก่อนหน้านี้ มักจะมี 'ความเสี่ยง' หรือข้อผิดพลาดในการตัดสินใจอยู่เสมอ ดังนั้น เราต้องกำหนดความน่าจะเป็นของข้อผิดพลาดในการตัดสินใจด้วย สิ่งนี้ง่ายมาก และฉันจะแสดงให้เห็นในแง่ของการสร้างภาพข้อมูล

ให้เราพิจารณาว่าเรามีข้อมูลบางส่วนและเราได้ทำการตัดสินใจตามทฤษฎีการตัดสินใจแบบเบย์

เราจะได้กราฟดังนี้

แกน y คือความน่าจะเป็นภายหลัง P(w(i) | x) และแกน x คือคุณลักษณะ 'x' ของเรา แกนที่ความน่าจะเป็นภายหลังสำหรับทั้งสองคลาสเท่ากัน แกนนั้นเรียกว่าขอบเขตการตัดสินใจของเรา

ดังนั้นที่ขอบเขตการตัดสินใจ:

P(w1 | x) = P(w2 | x)

ดังนั้น ทางด้านซ้ายของขอบเขตการตัดสินใจ เราตัดสินใจเลือก w1(ซื้อคอมพิวเตอร์) และทางด้านขวาของขอบเขตการตัดสินใจ เราตัดสินใจเลือก w2(ไม่ซื้อคอมพิวเตอร์)

แต่อย่างที่คุณเห็นในกราฟ มีบางขนาดที่ไม่เป็นศูนย์ของ w2 ทางด้านซ้ายของขอบเขตการตัดสินใจ นอกจากนี้ยังมีบางขนาดที่ไม่เป็นศูนย์ของ w1 ทางด้านขวาของขอบเขตการตัดสินใจ ส่วนขยายของคลาสอื่นเหนือคลาสอื่นคือสิ่งที่คุณเรียกว่าความเสี่ยงหรือข้อผิดพลาดความน่าจะเป็น

การคำนวณข้อผิดพลาดความน่าจะเป็น

ในการคำนวณความน่าจะเป็นของข้อผิดพลาดสำหรับคลาส w1 เราจำเป็นต้องค้นหาความน่าจะเป็นที่คลาสนั้นเป็น w2 ในพื้นที่ทางด้านซ้ายของขอบเขตการตัดสินใจ ในทำนองเดียวกัน ความน่าจะเป็นของข้อผิดพลาดสำหรับคลาส w2 คือความน่าจะเป็นที่คลาสนั้นเป็น w1 ในพื้นที่ทางด้านขวาของขอบเขตการตัดสินใจ

ในทางคณิตศาสตร์ ข้อผิดพลาดขั้นต่ำสำหรับชั้นเรียน:

w1 คือ P(w2 | x)

และสำหรับคลาส w2 คือ P(w1 | x)

คุณได้รับข้อผิดพลาดความน่าจะเป็นที่ต้องการ ง่ายใช่มั้ย?

ดังนั้นข้อผิดพลาดทั้งหมดในขณะนี้คืออะไร?

ให้เราแสดงถึงความน่าจะเป็นของข้อผิดพลาดทั้งหมดสำหรับจุดสนใจ x ที่จะเป็น P(E | x) ข้อผิดพลาดทั้งหมดสำหรับจุดสนใจ x จะเป็นผลรวมของความน่าจะเป็นทั้งหมดของข้อผิดพลาดสำหรับจุดสนใจ x โดยใช้การรวมอย่างง่าย เราสามารถแก้ปัญหานี้ได้ และผลลัพธ์ที่เราได้รับคือ:

P(E | x) = ต่ำสุด (P(w1 | x) , P(w2 | x))

ดังนั้น ความน่าจะเป็นของข้อผิดพลาดทั้งหมดจึงเป็นค่าต่ำสุดของความน่าจะเป็นภายหลังสำหรับทั้งสองคลาส เรากำลังเรียนขั้นต่ำของชั้นเรียนเพราะในที่สุดเราจะให้การตัดสินใจตามชั้นเรียนอื่น

บทสรุป

เราได้ศึกษารายละเอียดการใช้งานทฤษฎีการตัดสินใจแบบเบย์อย่างละเอียดแล้ว ตอนนี้คุณรู้ทฤษฎีบทเบย์และข้อกำหนดแล้ว คุณยังรู้วิธีการใช้ทฤษฎีบทเบย์ในการตัดสินใจ คุณยังได้เรียนรู้วิธีระบุข้อผิดพลาดในการตัดสินใจของคุณอีกด้วย

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ IIIT- สถานะศิษย์เก่า B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

ทฤษฎีบทเบย์ในความน่าจะเป็นคืออะไร?

ในด้านความน่าจะเป็น ทฤษฎีบทเบย์ หมายถึงสูตรทางคณิตศาสตร์ สูตรนี้ใช้ในการคำนวณความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์เฉพาะ ความน่าจะเป็นแบบมีเงื่อนไขไม่ได้เป็นเพียงความเป็นไปได้ที่จะเกิดเหตุการณ์ใดเหตุการณ์หนึ่งโดยเฉพาะ ซึ่งขึ้นอยู่กับผลของเหตุการณ์ที่เกิดขึ้นแล้ว ในการคำนวณความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์ ทฤษฎีบทเบย์จะพิจารณาความรู้ของเงื่อนไขทั้งหมดที่เกี่ยวข้องกับเหตุการณ์นั้น ดังนั้น หากเราทราบถึงความน่าจะเป็นแบบมีเงื่อนไขแล้ว ก็จะง่ายกว่าในการคำนวณความน่าจะเป็นแบบย้อนกลับโดยใช้ทฤษฎีบทเบย์

ทฤษฎีบทเบย์มีประโยชน์ในการเรียนรู้ของเครื่องหรือไม่?

ทฤษฎีบทเบย์ถูกนำไปใช้อย่างกว้างขวางในโครงการการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ นำเสนอวิธีเชื่อมต่อโมเดลการเรียนรู้ของเครื่องกับชุดข้อมูลที่มีอยู่ ทฤษฎีบทเบย์ให้แบบจำลองความน่าจะเป็นที่อธิบายความสัมพันธ์ระหว่างสมมติฐานและข้อมูล คุณสามารถพิจารณาโมเดลการเรียนรู้ของเครื่องหรืออัลกอริธึมเป็นเฟรมเวิร์กเฉพาะที่อธิบายการเชื่อมโยงที่มีโครงสร้างในข้อมูล ดังนั้น การใช้ทฤษฎีบทเบย์ในการเรียนรู้ของเครื่องที่ใช้ คุณจึงสามารถทดสอบและวิเคราะห์สมมติฐานหรือแบบจำลองต่างๆ ตามชุดข้อมูลต่างๆ และคำนวณความน่าจะเป็นของสมมติฐานตามความน่าจะเป็นก่อนหน้า เป้าหมายคือการระบุสมมติฐานที่อธิบายชุดข้อมูลเฉพาะได้ดีที่สุด

แอพพลิเคชั่นการเรียนรู้ของเครื่อง Bayesian ที่ได้รับความนิยมมากที่สุดคืออะไร?

ในการวิเคราะห์ข้อมูล แมชชีนเลิร์นนิงแบบเบย์เป็นหนึ่งในเครื่องมือที่ทรงพลังที่สุดที่มีให้สำหรับนักวิทยาศาสตร์ด้านข้อมูล ตัวอย่างที่ยอดเยี่ยมที่สุดของแอปพลิเคชันการเรียนรู้ของเครื่อง Bayesian ในโลกแห่งความเป็นจริงคือการตรวจจับการฉ้อโกงบัตรเครดิต อัลกอริธึมการเรียนรู้ของเครื่อง Bayesian สามารถช่วยตรวจจับรูปแบบที่บ่งบอกถึงการฉ้อโกงบัตรเครดิตได้ ทฤษฎีบท Bayes ในการเรียนรู้ด้วยเครื่องยังใช้ในการวินิจฉัยทางการแพทย์ขั้นสูง และคำนวณความน่าจะเป็นที่ผู้ป่วยจะเป็นโรคเฉพาะตามข้อมูลด้านสุขภาพก่อนหน้านี้ การประยุกต์ใช้ที่สำคัญอื่นๆ ได้แก่ การสอนหุ่นยนต์ในการตัดสินใจ การทำนายสภาพอากาศ การจดจำอารมณ์จากคำพูด เป็นต้น