Distribusi Probabilitas: Jenis Distribusi Dijelaskan

Diterbitkan: 2020-12-16

Daftar isi

Pengantar Probabilitas dan Distribusi Probabilitas

Untuk memahami distribusi probabilitas, mari kita pahami dulu apa itu probabilitas. Probabilitas adalah ukuran kemungkinan terjadinya suatu peristiwa dalam suatu percobaan. Secara sederhana, ini memberi tahu kita seberapa besar kemungkinan peristiwa itu akan terjadi. Nilai peluang terjadinya suatu peristiwa berkisar antara 0 (paling tidak mungkin) sampai 1 (paling mungkin).

Distribusi probabilitas adalah fungsi yang memberikan probabilitas hasil yang berbeda untuk eksperimen. Ini menunjukkan kemungkinan nilai yang dapat diambil oleh variabel acak dan seberapa sering nilai-nilai ini muncul.

Dalam distribusi probabilitas, jumlah dari semua probabilitas ini selalu dijumlahkan menjadi 1. Dalam domain ilmu data, salah satu penggunaan distribusi probabilitas adalah untuk menghitung interval kepercayaan dan untuk menghitung daerah kritis dalam pengujian hipotesis.

Distribusi Kontinu dan Diskrit

Jenis distribusi probabilitas yang akan digunakan tergantung pada apakah variabel tersebut mengandung nilai diskrit atau nilai kontinu. Distribusi diskrit hanya dapat mengambil satu set nilai yang terbatas sedangkan distribusi kontinu dapat mengambil nilai apa pun dalam rentang yang ditentukan.

Distribusi kontinu direpresentasikan dalam hal kepadatan probabilitas karena mungkin ada nilai tak terbatas dalam rentang tertentu dan probabilitas setiap nilai akan menjadi nol. Dalam kasus distribusi diskrit, kita dapat memperoleh probabilitas untuk setiap nilai karena jumlah nilai terbatas.

Jenis Distribusi – Distribusi Diskrit

Distribusi Binomial

Ini adalah jenis distribusi di mana jumlah hasil dalam satu percobaan hanya dua. Setiap percobaan independen dari percobaan lain; yaitu, hasil setiap percobaan tidak berdampak pada hasil percobaan lainnya. Uji coba yang dilakukan dalam percobaan ini identik satu sama lain.

Dengan demikian, probabilitas keberhasilan dan kegagalan akan sama untuk setiap percobaan. Misalnya, jika probabilitas sukses untuk suatu percobaan adalah 0,8 (yang berarti probabilitas kegagalan adalah 0,2), maka itu akan sama untuk percobaan lainnya juga.

Distribusi Multi nominal

Ini adalah versi umum dari distribusi binomial di mana jumlah hasil bisa lebih besar dari dua. Sifat lain dari distribusi ini mirip dengan distribusi binomial. Misalnya, pertimbangkan ketika dadu yang adil dilempar, probabilitas setiap hasil akan sama untuk semua percobaan karena percobaan ini independen satu sama lain.

Distribusi Bernoulli

Ini adalah varian lain dari distribusi Binomial. Ini adalah kasus khusus dari distribusi Binomial di mana jumlah percobaan yang dilakukan dalam suatu percobaan adalah 1 (n = 1). Karena hanya ada satu percobaan, itu dapat didefinisikan hanya dengan menggunakan satu parameter (p) yang umumnya merupakan probabilitas keberhasilan.

Baca: Distribusi Binomial dengan Python

Distribusi Binomial Negatif

Kondisi berikut dalam distribusi binomial negatif berbeda dari distribusi binomial: –

    • Jumlah percobaan yang dilakukan dalam suatu percobaan tidak tetap.
    • Variabel acak menunjukkan jumlah percobaan yang diperlukan untuk mencapai jumlah keberhasilan yang diinginkan.

Untuk distribusi binomial, variabel acak adalah jumlah keberhasilan yang diperlukan. Kami hanya fokus pada jumlah keberhasilan tidak peduli berapa banyak jalur yang gagal. Tetapi dalam kasus binomial negatif, ini berfokus pada berapa banyak percobaan yang diperlukan untuk mencapai jumlah keberhasilan yaitu Jumlah kegagalan (negatif) juga menjadi pertimbangan itulah sebabnya disebut distribusi binomial negatif.

Proses ini dilanjutkan hanya sampai jumlah keberhasilan yang diinginkan telah tercapai. Hal ini menyebabkan jumlah percobaan untuk percobaan menjadi arbitrer. Disebut juga Distribusi Pascal.

Distribusi racun

Distribusi Poisson memberikan probabilitas sejumlah peristiwa yang terjadi dalam periode waktu tertentu, asalkan kita mengetahui jumlah rata-rata peristiwa yang terjadi selama periode yang sama. Peristiwa ini terjadi secara independen dan tidak berpengaruh atas peristiwa lain. Untuk menerapkan distribusi ini, diasumsikan bahwa tingkat kejadian tetap konstan selama periode waktu.

Distribusi Seragam Diskrit

Dalam distribusi seragam, probabilitas semua hasil adalah sama. Misalnya, pertimbangkan ketika dadu yang adil dilempar, kemungkinan hasil apa pun mulai dari 1 hingga 6 akan sama. Fungsi massa probabilitas dari distribusi ini adalah 1/n di mana n adalah jumlah total nilai diskrit.

Jenis Distribusi – Distribusi Kontinu

Distribusi Seragam Berkelanjutan

Keseragaman dalam distribusi dapat diterapkan pada nilai kontinu juga. Hal ini menunjukkan bahwa distribusi probabilitas seragam antara rentang yang ditentukan. Ini juga disebut distribusi persegi panjang karena bentuknya ketika diplot pada grafik.

Distribusi normal

Distribusi normal (juga dikenal sebagai kurva lonceng) adalah jenis distribusi kontinu yang simetris dari kedua ujung rata-rata. Ini umumnya menunjukkan setengah dari sampel terletak di sisi kiri rata-rata, sedangkan separuh lainnya terletak di sisi kanan. Untuk distribusi normal, rata-rata, modus, dan median adalah sama.

Data yang terdistribusi normal umumnya mengikuti aturan empiris. Aturan empiris menunjukkan penyebaran data dalam hal standar deviasi dan mean sebagai berikut: –

    • Probabilitas 68% bahwa variabel acak berada dalam 1 standar deviasi dari mean.
    • 95% probabilitas bahwa variabel acak berada dalam 2 standar deviasi dari mean.
    • 99,7% probabilitas bahwa variabel acak berada dalam 3 standar deviasi dari mean.

T – Distribusi

Ini mirip dengan distribusi normal, tetapi memiliki probabilitas yang lebih tinggi terhadap nilai-nilai ekstrim dari data. Ini membuatnya lebih bertanggung jawab untuk mengambil nilai yang lebih jauh dari rata-rata. Ketika diplot pada grafik, kurva tampak lebih pendek dan lebih gemuk dari kurva distribusi normal.

Lebih disukai bila jumlah sampel lebih kecil ukurannya. Dengan bertambahnya ukuran sampel, kurva distribusi-t mulai tampak seperti kurva distribusi normal. Karena rumus untuk distribusi normal dan distribusi t sangat kompleks dan memakan waktu untuk dihitung, kami menghitung nilai Z-score dan T-score masing- masing.

Baca Juga: 13 Ide dan Topik Proyek Struktur Data Menarik Untuk Pemula

Distribusi Chi – Persegi

Distribusi chi-kuadrat adalah distribusi penjumlahan kuadrat dari variabel-variabel acak yang diambil dari distribusi normal. Derajat kebebasan yang digunakan dalam distribusi ini sama dengan jumlah variabel yang diambil dari distribusi normal. Rata-rata distribusi chi-kuadrat sama dengan jumlah derajat kebebasan.

Distribusi ini banyak digunakan dalam menghitung interval kepercayaan dan dalam pengujian hipotesis. Ini adalah kasus khusus dari distribusi gamma . Ini juga digunakan dalam uji chi-kuadrat yang merupakan uji kecocokan untuk distribusi yang diamati yang membantu dalam menunjukkan apakah data sampel merupakan representasi yang baik dari seluruh populasi.

Kesimpulan

Artikel ini memberikan gambaran tentang beberapa contoh jenis distribusi diskrit dan kontinu. Distribusi yang berbeda ini digunakan untuk tujuan yang berbeda, dan masing-masing memiliki asumsi sendiri.

Pelajari Kursus ML dari Universitas top Dunia. Dapatkan Master, PGP Eksekutif, atau Program Sertifikat Tingkat Lanjut untuk mempercepat karier Anda.

Meskipun dalam situasi kehidupan nyata, asumsi distribusi ini mungkin tidak terpenuhi, tetapi distribusi ini membantu dalam membuat keputusan penting bagi organisasi.

Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Apa yang membedakan distribusi binomial dari distribusi normal?

Dalam distribusi binomial, tidak ada titik data antara dua titik data yang diberikan. Ini sangat kontras dengan distribusi normal, yang menampilkan titik data diskrit. Distribusi normal tidak diskrit seperti distribusi binomial. Distribusi binomial memiliki jumlah kemunculan yang terbatas, sedangkan distribusi normal memiliki jumlah kemunculan yang tidak terbatas. Bahkan jika ukuran sampel cukup besar, bentuk distribusi binomial akan menyerupai distribusi normal.

Apa yang membedakan distribusi binomial dari distribusi Bernoulli?

Hasil dari percobaan tunggal dari suatu peristiwa ditangani oleh distribusi Bernoulli, tetapi hasil dari beberapa percobaan dari suatu peristiwa ditangani oleh distribusi Binomial. Ketika hasil dari suatu kejadian diperlukan hanya sekali, distribusi Bernoulli diterapkan, tetapi distribusi Binomial digunakan ketika hasilnya diperlukan beberapa kali.

Ketika ada ketidakpastian, bagaimana kita bisa menggunakan distribusi probabilitas?

Ruang probabilitas adalah representasi ketidakpastian kita tentang eksperimen yang mencakup ruang sampel hasil yang mungkin dan ukuran probabilitas yang memperkirakan kemungkinan setiap peristiwa. Dalam analisis ketidakpastian, distribusi persegi panjang adalah distribusi probabilitas yang paling banyak digunakan. Semua hasil memiliki kemungkinan yang sama untuk terjadi dalam distribusi persegi panjang. Anda harus membagi nilai Anda dengan akar kuadrat dari 3 untuk mengubah kontributor ketidakpastian Anda menjadi ekuivalen standar deviasi.