ประเภทของการแจกแจงความน่าจะเป็น [อธิบายพร้อมตัวอย่าง]

เผยแพร่แล้ว: 2020-12-24

ผู้ที่สนใจวิทยาศาสตร์ข้อมูลต้องรู้เกี่ยวกับการกระจายความน่าจะเป็น แนวคิดของ Data Science เช่น สถิติอนุมานไปยังเครือข่าย Bayesian ได้รับการพัฒนาบนแนวคิดพื้นฐานของความน่าจะเป็น ดังนั้นหากต้องการเข้าสู่โลกแห่งสถิติ การเรียนรู้ความน่าจะเป็นจึงเป็นสิ่งจำเป็น

สารบัญ

สถิติคืออะไร?

สถิติกำลังวิเคราะห์ตัวเลขทางคณิตศาสตร์โดยใช้วิธีการต่างๆ

ทำให้เรามีมุมมองแบบองค์รวมมากขึ้นของตัวเลขต่างๆ สถิติสำหรับวิทยาศาสตร์ข้อมูลมีความสำคัญมาก วิทยาศาสตร์ข้อมูลเป็นเรื่องเกี่ยวกับตัวเลข และสถิติทำให้ง่ายขึ้นและครอบคลุมมากขึ้น

ความน่าจะเป็นคืออะไร?

ความน่าจะเป็นเป็นแนวคิดที่เข้าใจได้ง่าย เราใช้โดยไม่รู้ตัวในชีวิตประจำวัน ความน่าจะเป็นเป็นตัววัดว่าเหตุการณ์จะเกิดขึ้นมากน้อยเพียงใด ตัวอย่างเช่น หากพรุ่งนี้มีโอกาสฝนตก 60% ความน่าจะเป็นคือ 60%

การกระจายความน่าจะเป็นคืออะไร?

การแจกแจงความน่าจะเป็นจะแสดงในรูปแบบของตารางหรือสมการ ตารางหรือสมการสอดคล้องกับทุกผลลัพธ์ของการทดลองทางสถิติที่มีความน่าจะเป็นที่จะเกิดขึ้น

การแจกแจงความน่าจะเป็นสามารถคำนวณได้แม้ในเหตุการณ์ง่ายๆ เช่น การโยนเหรียญ

ตารางต่อไปนี้แสดงการกระจายความน่าจะเป็นของแต่ละผลลัพธ์ของการโยนเหรียญแต่ละผลลัพธ์ด้วยความน่าจะเป็น

จำนวนหัว ความน่าจะเป็น
0 0.25
1 0.50
2 0.25

นอกจากนี้ยังอาจเป็นเหตุการณ์ที่ซับซ้อน เช่น ความน่าจะเป็นของวัคซีนบางชนิดที่สามารถรักษา COVID-19 ได้สำเร็จ

ข้อกำหนดเบื้องต้นของการกระจายความน่าจะเป็น

หากต้องการทราบเกี่ยวกับการแจกแจงความน่าจะเป็น คุณต้องรู้เกี่ยวกับตัวแปรและตัวแปรสุ่ม

  • ตัวแปรคือสัญลักษณ์ (A, B, x, y เป็นต้น) ใช้ชุดค่าที่ระบุใดๆ
  • ในการทดลองทางสถิติ ตัวแปรสุ่มคือค่าของตัวแปร

โดยปกติ อักษรตัวใหญ่หมายถึงตัวแปรสุ่ม และอักษรตัวพิมพ์เล็กหมายถึงค่าใดค่าหนึ่ง

ตัวอย่างเช่น,

  • X หมายถึงตัวแปรสุ่ม X
  • P(X) หมายถึงความน่าจะเป็นของ X
  • P(X = x) คือความน่าจะเป็นที่ตัวแปรสุ่ม X เท่ากับค่าใดค่าหนึ่ง แทนด้วย x

ตัวอย่างเช่น P(X = 1) คือความน่าจะเป็นที่ตัวแปรสุ่ม X เท่ากับ 1

ชำระเงิน: ทักษะด้านวิทยาศาสตร์ข้อมูล

ประเภทของการแจกแจงความน่าจะเป็น

นักสถิติแบ่งการแจกแจงความน่าจะเป็นออกเป็นประเภทต่อไปนี้:

  • การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง
  • การแจกแจงความน่าจะเป็นอย่างต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

ฟังก์ชันความน่าจะเป็นแบบไม่ต่อเนื่องคือความน่าจะเป็นของฟังก์ชันมวล จะถือว่าค่าจำนวนไม่ต่อเนื่อง

ตัวอย่างเช่น เมื่อคุณโยนเหรียญ การนับเหตุการณ์จะเป็นฟังก์ชันที่ไม่ต่อเนื่องเนื่องจากไม่มีค่าอยู่ระหว่าง คุณมีเพียงหัวหรือก้อยในการโยนเหรียญ ในทำนองเดียวกัน เมื่อนับจำนวนหนังสือที่ยืมต่อชั่วโมงที่ห้องสมุด คุณสามารถนับหนังสือได้ 31 หรือ 32 เล่ม โดยไม่มีอะไรคั่นระหว่างนั้น

ประเภทของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

  • การแจกแจงแบบทวินาม – การแจกแจงแบบเบอร์นูลลีมีเพียงสองผลลัพธ์คือ 1 และ 0 ดังนั้นตัวแปรสุ่ม X ใช้ค่า 1 โดยมีความน่าจะเป็นของความสำเร็จเป็น p และค่า 0 ที่มีความน่าจะเป็นของความล้มเหลวเป็น q หรือ 1-p

ดังนั้น หากคุณโยนเหรียญ การเกิดขึ้นของหัวหมายถึงความสำเร็จ และส่วนท้ายหมายถึงความล้มเหลว

ฟังก์ชันความน่าจะเป็นคือ px(1-p)1-x โดยที่ x € (0, 1)

  • การแจกแจงแบบปกติ – การแจกแจงแบบปกติมีไว้สำหรับสถานการณ์พื้นฐานที่สุด มีลักษณะดังต่อไปนี้:
  1. ค่ากลาง ค่ามัธยฐาน และโหมดตรงกัน
  2. เส้นโค้งการกระจายเป็นรูประฆัง
  3. เส้นโค้งการกระจายมีความสมมาตรตามแนว x = μ
  4. พื้นที่ใต้เส้นโค้งคือ 1
  • การแจกแจงแบบปัวซอง – การนับจำนวนหนังสือที่ห้องสมุดอยู่ภายใต้การแจกแจงความน่าจะเป็น

การแจกแจงแบบปัวซองมีสมมติฐานดังต่อไปนี้:

  • เหตุการณ์ที่ประสบความสำเร็จไม่ได้ส่งผลต่อผลลัพธ์ของเหตุการณ์ที่ประสบความสำเร็จอื่น
  • ความน่าจะเป็นของความสำเร็จในช่วงเวลาสั้น ๆ เท่ากับความน่าจะเป็นของความสำเร็จในระยะเวลาอันยาวนาน
  • ความน่าจะเป็นของความสำเร็จในช่วงเวลาหนึ่งใกล้ศูนย์เมื่อระยะเวลานั้นน้อยลง

อ่านเพิ่มเติม: Data Science vs Data Analytics

การแจกแจงความน่าจะเป็นอย่างต่อเนื่อง

เรียกอีกอย่างว่าฟังก์ชันความหนาแน่นของความน่าจะเป็น มีการแจกแจงแบบต่อเนื่องหากตัวแปรถือว่ามีค่าเป็นอนันต์ระหว่างสองค่าใดๆ ตัวแปรต่อเนื่องวัดจากตาชั่ง เช่น ส่วนสูง น้ำหนัก และอุณหภูมิ

เมื่อเปรียบเทียบกับการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องซึ่งทุกค่าเป็นผลที่ไม่เป็นศูนย์ การแจกแจงแบบต่อเนื่องจะมีความน่าจะเป็นเป็นศูนย์สำหรับฟังก์ชันเฉพาะ ตัวอย่างเช่น ความน่าจะเป็นเป็นศูนย์เมื่อวัดอุณหภูมิที่ 40 องศาพอดี

เรียน รู้หลักสูตรการเรียนรู้ของเครื่อง จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

ประเภทของการแจกแจงความน่าจะเป็นต่อเนื่อง

  • การแจกแจงแบบสม่ำเสมอ – เมื่อทอยลูกเต๋า ผลลัพธ์คือ 1 ถึง 6 ความน่าจะเป็นของผลลัพธ์เหล่านี้เท่ากัน และนั่นคือการแจกแจงแบบสม่ำเสมอ

สมมติว่าตัวแปรสุ่ม X ถือว่า k ค่าที่แตกต่างกัน นอกจากนี้ P(X=xk) เป็นค่าคงที่

P(X=xk) = 1/k

  • การแจกแจงความน่าจะเป็นสะสม – เมื่อความน่าจะเป็นที่ค่าของตัวแปรสุ่ม X อยู่ในช่วงที่กำหนด ความน่าจะเป็นสะสมจะปรากฏในภาพ

สมมติว่าคุณโยนเหรียญ ความน่าจะเป็นของผลลัพธ์ที่จะออกหัวอย่างน้อยหนึ่งหัวเป็นเท่าใด นี่คือความน่าจะเป็นสะสม

จำนวนหัว: x ความน่าจะเป็น P(X=x) ความน่าจะเป็นสะสม: P(X ≤ x)
0 0.25 0.25
1 0.50 0.75
2 0.25 1.00

ความคิดสุดท้าย

  • การกระจายความน่าจะเป็น แสดงผลลัพธ์ที่คาดหวังของค่าที่เป็นไปได้สำหรับกระบวนการสร้างข้อมูลที่กำหนด
  • การแจกแจงความน่าจะ เป็นมีหลายประเภทโดยมีลักษณะที่แตกต่างกัน คุณลักษณะส่วนใหญ่กำหนดโดยค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน
  • นักลงทุนพึ่งพาการกระจายความน่าจะเป็นอย่างมากในการคาดการณ์ผลตอบแทนของสินทรัพย์ เช่น หุ้นในช่วงเวลาหนึ่ง และเพื่อคาดการณ์ความเสี่ยง

หากคุณมีความหลงใหลและต้องการเรียนรู้เพิ่มเติมเกี่ยวกับปัญญาประดิษฐ์ คุณสามารถเรียนหลักสูตร PG Diploma in Machine Learning และ Deep Learning ของ IIIT-B และ upGrad ที่มีการเรียนรู้มากกว่า 400 ชั่วโมง ภาคปฏิบัติ การช่วยเหลืองาน และอื่นๆ อีกมากมาย

คุณสมบัติของการกระจายความน่าจะเป็นคืออะไร?

มีคุณสมบัติสามประการที่ต้องเรียกว่าการแจกแจงความน่าจะเป็น อย่างแรก มันควรจะเป็นสับเปลี่ยน นี่หมายความว่าเมื่อคุณบวกสองเทอมใดๆ จากการแจกแจง คุณควรได้ผลรวมเท่ากัน ไม่ว่าคุณจะเพิ่มเทอมไหนก่อน ประการที่สอง ควรเป็นแบบโมโนโทนิกทั้งหมด ซึ่งหมายความว่าแต่ละเทอมต้องมากกว่าหรือเท่ากับเทอมก่อนหน้า และประการที่สาม การแจกแจงควรเป็นแบบต่อเนื่อง ซึ่งหมายความว่าคุณไม่สามารถมีช่องว่างระหว่างความน่าจะเป็นสำหรับตัวเลขต่างๆ

การแจกแจงความน่าจะเป็นใช้ในการตัดสินใจอย่างไร

ในการตัดสินใจ การแจกแจงความน่าจะเป็นถูกใช้ในแอพพลิเคชั่นที่หลากหลายซึ่งผลลัพธ์ของกระบวนการนั้นไม่แน่นอน ในคาสิโน การแจกแจงความน่าจะเป็นจะใช้เพื่อกำหนดอัตราต่อรองของผลลัพธ์เฉพาะ ในด้านการแพทย์ การแจกแจงความน่าจะเป็นจะใช้เพื่อกำหนดความน่าจะเป็นของโรคหนึ่งๆ ในธุรกิจ การแจกแจงความน่าจะเป็นใช้เพื่อกำหนดความเป็นไปได้ของผลลัพธ์เฉพาะสำหรับการดำเนินการ การประยุกต์ใช้การแจกแจงความน่าจะเป็นเหล่านี้มีไม่จำกัด

การแจกแจงความน่าจะเป็นคืออะไร?

การแจกแจงความน่าจะเป็นเป็นฟังก์ชันทางคณิตศาสตร์ที่ให้ความน่าจะเป็นที่ตัวแปรสุ่มเป็นค่าเฉพาะใดๆ แนวคิดของตัวแปรสุ่มเป็นศูนย์กลางของทฤษฎีความน่าจะเป็น การแจกแจงความน่าจะเป็นของตัวแปรสุ่มแบบไม่ต่อเนื่องจะอยู่ในรูปของรายการความน่าจะเป็นของค่าที่เป็นไปได้แต่ละรายการ โดยทั่วไป การแจกแจงความน่าจะเป็นเป็นฟังก์ชันทางคณิตศาสตร์ที่อธิบายความน่าจะเป็นของการเกิดค่า (หรือช่วง) เฉพาะสำหรับตัวแปรสุ่มในพื้นที่ที่กำหนด