ประเภทของการแจกแจงความน่าจะเป็น [อธิบายพร้อมตัวอย่าง]
เผยแพร่แล้ว: 2020-12-24ผู้ที่สนใจวิทยาศาสตร์ข้อมูลต้องรู้เกี่ยวกับการกระจายความน่าจะเป็น แนวคิดของ Data Science เช่น สถิติอนุมานไปยังเครือข่าย Bayesian ได้รับการพัฒนาบนแนวคิดพื้นฐานของความน่าจะเป็น ดังนั้นหากต้องการเข้าสู่โลกแห่งสถิติ การเรียนรู้ความน่าจะเป็นจึงเป็นสิ่งจำเป็น
สารบัญ
สถิติคืออะไร?
สถิติกำลังวิเคราะห์ตัวเลขทางคณิตศาสตร์โดยใช้วิธีการต่างๆ
ทำให้เรามีมุมมองแบบองค์รวมมากขึ้นของตัวเลขต่างๆ สถิติสำหรับวิทยาศาสตร์ข้อมูลมีความสำคัญมาก วิทยาศาสตร์ข้อมูลเป็นเรื่องเกี่ยวกับตัวเลข และสถิติทำให้ง่ายขึ้นและครอบคลุมมากขึ้น
ความน่าจะเป็นคืออะไร?
ความน่าจะเป็นเป็นแนวคิดที่เข้าใจได้ง่าย เราใช้โดยไม่รู้ตัวในชีวิตประจำวัน ความน่าจะเป็นเป็นตัววัดว่าเหตุการณ์จะเกิดขึ้นมากน้อยเพียงใด ตัวอย่างเช่น หากพรุ่งนี้มีโอกาสฝนตก 60% ความน่าจะเป็นคือ 60%
การกระจายความน่าจะเป็นคืออะไร?
การแจกแจงความน่าจะเป็นจะแสดงในรูปแบบของตารางหรือสมการ ตารางหรือสมการสอดคล้องกับทุกผลลัพธ์ของการทดลองทางสถิติที่มีความน่าจะเป็นที่จะเกิดขึ้น
การแจกแจงความน่าจะเป็นสามารถคำนวณได้แม้ในเหตุการณ์ง่ายๆ เช่น การโยนเหรียญ

ตารางต่อไปนี้แสดงการกระจายความน่าจะเป็นของแต่ละผลลัพธ์ของการโยนเหรียญแต่ละผลลัพธ์ด้วยความน่าจะเป็น
จำนวนหัว | ความน่าจะเป็น |
0 | 0.25 |
1 | 0.50 |
2 | 0.25 |
นอกจากนี้ยังอาจเป็นเหตุการณ์ที่ซับซ้อน เช่น ความน่าจะเป็นของวัคซีนบางชนิดที่สามารถรักษา COVID-19 ได้สำเร็จ
ข้อกำหนดเบื้องต้นของการกระจายความน่าจะเป็น
หากต้องการทราบเกี่ยวกับการแจกแจงความน่าจะเป็น คุณต้องรู้เกี่ยวกับตัวแปรและตัวแปรสุ่ม
- ตัวแปรคือสัญลักษณ์ (A, B, x, y เป็นต้น) ใช้ชุดค่าที่ระบุใดๆ
- ในการทดลองทางสถิติ ตัวแปรสุ่มคือค่าของตัวแปร
โดยปกติ อักษรตัวใหญ่หมายถึงตัวแปรสุ่ม และอักษรตัวพิมพ์เล็กหมายถึงค่าใดค่าหนึ่ง
ตัวอย่างเช่น,
- X หมายถึงตัวแปรสุ่ม X
- P(X) หมายถึงความน่าจะเป็นของ X
- P(X = x) คือความน่าจะเป็นที่ตัวแปรสุ่ม X เท่ากับค่าใดค่าหนึ่ง แทนด้วย x
ตัวอย่างเช่น P(X = 1) คือความน่าจะเป็นที่ตัวแปรสุ่ม X เท่ากับ 1
ชำระเงิน: ทักษะด้านวิทยาศาสตร์ข้อมูล
ประเภทของการแจกแจงความน่าจะเป็น
นักสถิติแบ่งการแจกแจงความน่าจะเป็นออกเป็นประเภทต่อไปนี้:
- การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง
- การแจกแจงความน่าจะเป็นอย่างต่อเนื่อง
การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง
ฟังก์ชันความน่าจะเป็นแบบไม่ต่อเนื่องคือความน่าจะเป็นของฟังก์ชันมวล จะถือว่าค่าจำนวนไม่ต่อเนื่อง
ตัวอย่างเช่น เมื่อคุณโยนเหรียญ การนับเหตุการณ์จะเป็นฟังก์ชันที่ไม่ต่อเนื่องเนื่องจากไม่มีค่าอยู่ระหว่าง คุณมีเพียงหัวหรือก้อยในการโยนเหรียญ ในทำนองเดียวกัน เมื่อนับจำนวนหนังสือที่ยืมต่อชั่วโมงที่ห้องสมุด คุณสามารถนับหนังสือได้ 31 หรือ 32 เล่ม โดยไม่มีอะไรคั่นระหว่างนั้น
ประเภทของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง
- การแจกแจงแบบทวินาม – การแจกแจงแบบเบอร์นูลลีมีเพียงสองผลลัพธ์คือ 1 และ 0 ดังนั้นตัวแปรสุ่ม X ใช้ค่า 1 โดยมีความน่าจะเป็นของความสำเร็จเป็น p และค่า 0 ที่มีความน่าจะเป็นของความล้มเหลวเป็น q หรือ 1-p
ดังนั้น หากคุณโยนเหรียญ การเกิดขึ้นของหัวหมายถึงความสำเร็จ และส่วนท้ายหมายถึงความล้มเหลว

ฟังก์ชันความน่าจะเป็นคือ px(1-p)1-x โดยที่ x € (0, 1)
- การแจกแจงแบบปกติ – การแจกแจงแบบปกติมีไว้สำหรับสถานการณ์พื้นฐานที่สุด มีลักษณะดังต่อไปนี้:
- ค่ากลาง ค่ามัธยฐาน และโหมดตรงกัน
- เส้นโค้งการกระจายเป็นรูประฆัง
- เส้นโค้งการกระจายมีความสมมาตรตามแนว x = μ
- พื้นที่ใต้เส้นโค้งคือ 1
- การแจกแจงแบบปัวซอง – การนับจำนวนหนังสือที่ห้องสมุดอยู่ภายใต้การแจกแจงความน่าจะเป็น
การแจกแจงแบบปัวซองมีสมมติฐานดังต่อไปนี้:
- เหตุการณ์ที่ประสบความสำเร็จไม่ได้ส่งผลต่อผลลัพธ์ของเหตุการณ์ที่ประสบความสำเร็จอื่น
- ความน่าจะเป็นของความสำเร็จในช่วงเวลาสั้น ๆ เท่ากับความน่าจะเป็นของความสำเร็จในระยะเวลาอันยาวนาน
- ความน่าจะเป็นของความสำเร็จในช่วงเวลาหนึ่งใกล้ศูนย์เมื่อระยะเวลานั้นน้อยลง
อ่านเพิ่มเติม: Data Science vs Data Analytics
การแจกแจงความน่าจะเป็นอย่างต่อเนื่อง
เรียกอีกอย่างว่าฟังก์ชันความหนาแน่นของความน่าจะเป็น มีการแจกแจงแบบต่อเนื่องหากตัวแปรถือว่ามีค่าเป็นอนันต์ระหว่างสองค่าใดๆ ตัวแปรต่อเนื่องวัดจากตาชั่ง เช่น ส่วนสูง น้ำหนัก และอุณหภูมิ
เมื่อเปรียบเทียบกับการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องซึ่งทุกค่าเป็นผลที่ไม่เป็นศูนย์ การแจกแจงแบบต่อเนื่องจะมีความน่าจะเป็นเป็นศูนย์สำหรับฟังก์ชันเฉพาะ ตัวอย่างเช่น ความน่าจะเป็นเป็นศูนย์เมื่อวัดอุณหภูมิที่ 40 องศาพอดี

เรียน รู้หลักสูตรการเรียนรู้ของเครื่อง จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
ประเภทของการแจกแจงความน่าจะเป็นต่อเนื่อง
- การแจกแจงแบบสม่ำเสมอ – เมื่อทอยลูกเต๋า ผลลัพธ์คือ 1 ถึง 6 ความน่าจะเป็นของผลลัพธ์เหล่านี้เท่ากัน และนั่นคือการแจกแจงแบบสม่ำเสมอ
สมมติว่าตัวแปรสุ่ม X ถือว่า k ค่าที่แตกต่างกัน นอกจากนี้ P(X=xk) เป็นค่าคงที่
P(X=xk) = 1/k
- การแจกแจงความน่าจะเป็นสะสม – เมื่อความน่าจะเป็นที่ค่าของตัวแปรสุ่ม X อยู่ในช่วงที่กำหนด ความน่าจะเป็นสะสมจะปรากฏในภาพ
สมมติว่าคุณโยนเหรียญ ความน่าจะเป็นของผลลัพธ์ที่จะออกหัวอย่างน้อยหนึ่งหัวเป็นเท่าใด นี่คือความน่าจะเป็นสะสม
จำนวนหัว: x | ความน่าจะเป็น P(X=x) | ความน่าจะเป็นสะสม: P(X ≤ x) |
0 | 0.25 | 0.25 |
1 | 0.50 | 0.75 |
2 | 0.25 | 1.00 |
ความคิดสุดท้าย
- การกระจายความน่าจะเป็น แสดงผลลัพธ์ที่คาดหวังของค่าที่เป็นไปได้สำหรับกระบวนการสร้างข้อมูลที่กำหนด
- การแจกแจงความน่าจะ เป็นมีหลายประเภทโดยมีลักษณะที่แตกต่างกัน คุณลักษณะส่วนใหญ่กำหนดโดยค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน
- นักลงทุนพึ่งพาการกระจายความน่าจะเป็นอย่างมากในการคาดการณ์ผลตอบแทนของสินทรัพย์ เช่น หุ้นในช่วงเวลาหนึ่ง และเพื่อคาดการณ์ความเสี่ยง
หากคุณมีความหลงใหลและต้องการเรียนรู้เพิ่มเติมเกี่ยวกับปัญญาประดิษฐ์ คุณสามารถเรียนหลักสูตร PG Diploma in Machine Learning และ Deep Learning ของ IIIT-B และ upGrad ที่มีการเรียนรู้มากกว่า 400 ชั่วโมง ภาคปฏิบัติ การช่วยเหลืองาน และอื่นๆ อีกมากมาย
คุณสมบัติของการกระจายความน่าจะเป็นคืออะไร?
มีคุณสมบัติสามประการที่ต้องเรียกว่าการแจกแจงความน่าจะเป็น อย่างแรก มันควรจะเป็นสับเปลี่ยน นี่หมายความว่าเมื่อคุณบวกสองเทอมใดๆ จากการแจกแจง คุณควรได้ผลรวมเท่ากัน ไม่ว่าคุณจะเพิ่มเทอมไหนก่อน ประการที่สอง ควรเป็นแบบโมโนโทนิกทั้งหมด ซึ่งหมายความว่าแต่ละเทอมต้องมากกว่าหรือเท่ากับเทอมก่อนหน้า และประการที่สาม การแจกแจงควรเป็นแบบต่อเนื่อง ซึ่งหมายความว่าคุณไม่สามารถมีช่องว่างระหว่างความน่าจะเป็นสำหรับตัวเลขต่างๆ
การแจกแจงความน่าจะเป็นใช้ในการตัดสินใจอย่างไร
ในการตัดสินใจ การแจกแจงความน่าจะเป็นถูกใช้ในแอพพลิเคชั่นที่หลากหลายซึ่งผลลัพธ์ของกระบวนการนั้นไม่แน่นอน ในคาสิโน การแจกแจงความน่าจะเป็นจะใช้เพื่อกำหนดอัตราต่อรองของผลลัพธ์เฉพาะ ในด้านการแพทย์ การแจกแจงความน่าจะเป็นจะใช้เพื่อกำหนดความน่าจะเป็นของโรคหนึ่งๆ ในธุรกิจ การแจกแจงความน่าจะเป็นใช้เพื่อกำหนดความเป็นไปได้ของผลลัพธ์เฉพาะสำหรับการดำเนินการ การประยุกต์ใช้การแจกแจงความน่าจะเป็นเหล่านี้มีไม่จำกัด
การแจกแจงความน่าจะเป็นคืออะไร?
การแจกแจงความน่าจะเป็นเป็นฟังก์ชันทางคณิตศาสตร์ที่ให้ความน่าจะเป็นที่ตัวแปรสุ่มเป็นค่าเฉพาะใดๆ แนวคิดของตัวแปรสุ่มเป็นศูนย์กลางของทฤษฎีความน่าจะเป็น การแจกแจงความน่าจะเป็นของตัวแปรสุ่มแบบไม่ต่อเนื่องจะอยู่ในรูปของรายการความน่าจะเป็นของค่าที่เป็นไปได้แต่ละรายการ โดยทั่วไป การแจกแจงความน่าจะเป็นเป็นฟังก์ชันทางคณิตศาสตร์ที่อธิบายความน่าจะเป็นของการเกิดค่า (หรือช่วง) เฉพาะสำหรับตัวแปรสุ่มในพื้นที่ที่กำหนด