Olasılık Dağılımı: Açıklanan Dağılım Türleri
Yayınlanan: 2020-12-16İçindekiler
Olasılığa Giriş ve Olasılık Dağılımı
Olasılık dağılımını anlamak için önce olasılığın ne olduğunu anlayalım. Olasılık, bir deneyde meydana gelen bir olayın olasılığının ölçüsüdür. Basit bir ifadeyle, bize olayın meydana gelme olasılığının ne kadar olduğunu söyler. Bir olayın meydana gelme olasılığının değeri 0 (en az olası) ile 1 (en olası) arasında değişir.
Olasılık dağılımı, deney için farklı sonuçların olasılıklarını sağlayan bir fonksiyondur. Rastgele bir değişkenin alabileceği olası değerleri ve bu değerlerin ne sıklıkla meydana geldiğini gösterir.
Olasılık dağılımında, tüm bu olasılıkların toplamı her zaman 1 olur. Veri bilimi alanında, olasılık dağılımının kullanımlarından biri, güven aralıklarını hesaplamak ve hipotez testlerinde kritik bölgeleri hesaplamak içindir.
Sürekli ve Ayrık Dağılımlar
Kullanılacak olasılık dağılımının türü, değişkenin kesikli değerler mi yoksa sürekli değerler mi içerdiğine bağlıdır. Kesikli bir dağılım yalnızca sınırlı bir değer kümesi alabilirken, sürekli dağılımlar belirtilen aralıktaki herhangi bir değeri alabilir.
Belirli bir aralıkta sonsuz değerler olabileceğinden ve her bir değerin olasılığı sıfır olacağından, sürekli dağılımlar olasılık yoğunluğu cinsinden temsil edilir. Kesikli dağılım durumunda, değer sayısı sınırlı olduğu için her bir değer için bir olasılık elde edebiliriz.
Dağıtım Türleri – Ayrık Dağıtım
Binom dağılımı
Tek bir denemedeki sonuç sayısının sadece iki olduğu bir dağılım türüdür. Her deneme başka bir denemeden bağımsızdır; yani, her denemenin sonucunun diğer denemelerin sonucu üzerinde bir etkisi yoktur. Bu deneyde gerçekleştirilen denemeler birbiriyle aynıdır.

Bu nedenle, her deneme için başarı ve başarısızlık olasılığı aynı olacaktır. Örneğin, bir deneme için başarı olasılığı 0,8 ise (bu, başarısızlık olasılığı 0,2 olacağı anlamına gelir), bu durumda diğer denemeler için de aynı olacaktır .
Çok nominal Dağıtım
Bu, sonuç sayısının ikiden fazla olabileceği binom dağılımının genelleştirilmiş versiyonudur. Bu dağılımın diğer özellikleri, binom dağılımına benzer. Örneğin, adil bir zar atıldığında, bu denemeler birbirinden bağımsız olduğundan, her bir sonucun olasılığının tüm denemeler için aynı olacağını düşünün.
Bernoulli'nin Dağılımı
Bu, Binom dağılımının başka bir çeşididir. Bir deneyde gerçekleştirilen deneme sayısının 1 (n = 1) olduğu özel bir Binom dağılımı durumudur. Yalnızca bir deneme olduğu için, genellikle başarı olasılığı olan yalnızca bir parametre (p) kullanılarak tanımlanabilir.
Okuyun: Python'da Binom Dağılımı
Negatif Binom Dağılımı
Negatif bir binom dağılımındaki aşağıdaki koşullar, binom dağılımından farklıdır: –
- Bir deneyde gerçekleştirilen deneme sayısı sabit değildir.
- Rastgele değişken, istenen sayıda başarıya ulaşmak için gereken deneme sayısını gösterir.
Binom dağılımı için rasgele değişken, gereken başarıların sayısıdır, yani, kaç tane yol başarısız olursa olsun, yalnızca başarıların sayısına odaklanırız. Ancak negatif binom durumunda, başarı sayısına ulaşmak için kaç denemenin gerekli olacağına odaklanır, yani başarısızlıkların sayısı (negatifler) de dikkate alınır, bu nedenle negatif binom dağılımı olarak adlandırılır.
Süreç sadece istenilen sayıda başarı elde edilene kadar devam ettirilir. Bu, bir deney için deneme sayısının keyfi olmasına neden olur. Pascal Dağılımı olarak da adlandırılır.
Poisson Dağılımı
Poisson Dağılımı, aynı dönemde meydana gelen ortalama olay sayısını bilmemiz koşuluyla, belirli bir zaman diliminde meydana gelen ayrık sayıda olayın olasılığını sağlar. Bu olaylar bağımsız olarak meydana gelir ve diğer olaylar üzerinde hiçbir etkisi yoktur. Bu dağılımı uygulamak için, oluşma oranının zaman periyodu boyunca sabit kaldığını varsayar.

Ayrık Tekdüzen Dağıtım
Düzgün dağılımda, tüm sonuçların olasılıkları eşittir. Örneğin, adil bir zar atıldığında 1 ile 6 arasında herhangi bir sonucun olasılığının eşit olacağını düşünün. Bu dağılımın olasılık kütle fonksiyonu 1/n'dir, burada n, ayrık değerlerin toplam sayısıdır.
Dağıtım Türleri – Sürekli Dağıtım
Sürekli Üniforma Dağıtımı
Dağılımdaki tekdüzelik, sürekli değerlere de uygulanabilir. Olasılık dağılımının belirtilen aralık arasında tek tip olduğunu gösterir. Grafiğe çizildiğinde aldığı şekil nedeniyle dikdörtgen dağılım olarak da adlandırılır.
Normal dağılım
Normal dağılım (çan eğrisi olarak da bilinir), ortalamanın her iki ucundan simetrik olan bir sürekli dağılım türüdür. Genellikle numunelerin yarısının ortalamanın sol tarafında, diğer yarısının ise sağ tarafta olduğunu gösterir. Normal bir dağılım için ortalama, mod ve medyan eşittir.
Normal olarak dağıtılmış veriler genellikle ampirik kuralı takip eder. Ampirik kural, verilerin standart sapma ve ortalama cinsinden dağılımını aşağıdaki gibi gösterir: –
- Rastgele değişkenin ortalamanın 1 standart sapması içinde kalma olasılığı %68.
- Rastgele değişkenin ortalamanın 2 standart sapması içine düşme olasılığı %95.
- Rastgele değişkenin ortalamanın 3 standart sapması içine düşme olasılığı %99.7.
T - Dağıtım
Normal dağılıma benzer , ancak verilerin uç değerlerine doğru daha yüksek bir olasılığa sahiptir. Bu, ortalamadan daha uzak değerler almaya daha yatkın hale getirir. Bir grafik üzerinde çizildiğinde, eğri normal dağılım eğrisinden daha kısa ve daha kalın görünür.
Numune sayısının boyut olarak daha küçük olduğu durumlarda tercih edilir. Örnek boyutunun artmasıyla t-dağılım eğrisi normal dağılım eğrisi gibi görünmeye başlar. Normal dağılım ve t-dağılımı için formüllerin hesaplanması çok karmaşık ve zaman alıcı olduğundan, bunun yerine sırasıyla Z-skoru ve T-skoru değerlerini hesaplıyoruz .
Ayrıca Okuyun: Yeni Başlayanlar İçin 13 İlginç Veri Yapısı Projesi Fikirleri ve Konuları
Ki – Kare Dağılımı
Ki-kare dağılımı, normal bir dağılımdan alınan rastgele değişkenlerin karelerinin toplamının dağılımıdır. Bu dağılımda kullanılan serbestlik dereceleri, normal dağılımdan alınan değişkenlerin sayısına eşittir. Ki-kare dağılımının ortalaması, serbestlik derecesi sayısına eşittir.

Bu dağılım, güven aralıklarının hesaplanmasında ve hipotez testlerinde yaygın olarak kullanılmaktadır. Gama dağılımının özel bir durumudur . Ayrıca, örneklem verilerinin tüm popülasyonu iyi bir şekilde temsil edip etmediğini göstermeye yardımcı olan, gözlemlenen dağılım için uygunluk testi olan ki-kare testinde de kullanılır .
Çözüm
Bu makale, ayrık ve sürekli dağılım türlerinin birkaç örneğine genel bir bakış sağladı. Bu farklı dağılımlar farklı amaçlara hizmet etmek için kullanılır ve her birinin kendi varsayımları vardır.
Dünyanın En İyi Üniversitelerinden ML Kursu öğrenin . Kariyerinizi hızlandırmak için Master, Executive PGP veya Advanced Certificate Programları kazanın.
Gerçek yaşam durumlarında bu dağılımların varsayımları yerine getirilmeyebilir, ancak bu dağılımlar kuruluş için önemli kararlar alınmasına yardımcı olur.
Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.
Binom dağılımını normal dağılımdan ayıran nedir?
Binom dağılımında, verilen herhangi iki veri noktası arasında veri noktası yoktur. Bu, ayrık veri noktalarını içeren normal bir dağılımla tam bir zıtlık içindedir. Normal dağılım, binom dağılımından farklı olarak kesikli değildir. Binom dağılımının sonlu sayıda oluşumu vardır, oysa normal bir dağılımın sonsuz sayıda oluşumu vardır. O zaman bile, örneklem boyutu yeterince büyükse, binom dağılımının şekli normal dağılıma benzeyecektir.
Binom dağılımını Bernoulli dağılımından ayıran nedir?
Bir olayın tek bir denemesinin sonucu Bernoulli dağılımı ile ele alınır, ancak tek bir olayın birkaç denemesinin sonucu Binom dağılımı ile ele alınır. Bir olayın sonucu yalnızca bir kez gerekli olduğunda, Bernoulli dağılımı uygulanır, ancak sonuç birkaç kez gerekli olduğunda Binom dağılımı kullanılır.
Belirsizlik olduğunda, olasılık dağılımını nasıl kullanabiliriz?
Olasılık uzayı, olası sonuçların bir örnek uzayını ve her olayın olasılığını tahmin eden bir olasılık ölçüsünü içeren bir deney hakkındaki belirsizliğimizin bir temsilidir. Belirsizlik analizinde dikdörtgen dağılım en yaygın olarak kullanılan olasılık dağılımıdır. Tüm sonuçların dikdörtgen bir dağılımda meydana gelme olasılığı eşittir. Belirsizlik katkılarınızı standart sapma eşdeğerlerine dönüştürmek için değerlerinizi 3'ün kareköküne bölmeniz gerekecektir.
