Bayesian vs. Sık Kullanılanlar: Bir Sonraki Probleminiz İçin Hangisini Seçmelisiniz?
Yayınlanan: 2020-12-23Daha önce istatistikle ilgilendiyseniz, büyük bir tartışmayı okumuşsunuzdur - Bayesian vs. Frequentists. Bunların her biri, olasılıklarla ilgili istatistiksel bir problemi çözmeye yönelik bir yaklaşımdır. Şimdi, Bayes istatistikçiler yöntemleri için Frequentists'i suçluyorlar ve bunun tersi de geçerli. Bu tartışmanın sonu yok. Her ikisinin de avantaj ve dezavantajları var.
Bu yazıda, her iki yaklaşımı da inceleyeceğiz ve bir sonraki istatistiksel probleminiz için ikisinden hangisinin sizin için iyi olduğunu bulacağız.
İçindekiler
Bayesçiler ve Sık Kullanılanlar— Olasılık Tanımı Açısından
Tanım 1: Bir İnanç Derecesi Olarak Olasılık, Frank Ramsey (Bayes Yaklaşımı)
Bir olayın olasılığı, subjektif inanç derecesi ile ölçülür. Aynı zamanda 'Mantıksal Olasılık' olarak da adlandırılır. Bu, sizden daha fazla kanıtı varsa, olasılık tanımınızın başka birininkinden farklı olabileceği anlamına gelir. Bu tamamen iyidir ve diğer kişi ne isterse düşünebilir.
Tanım 2: Uzun Vadeli Bir Frekans Olarak Olasılık, Ronald Fisher (Sık Kullanılanlar Yaklaşımı)
Bir olayın olasılığı, defalarca tekrarlandığında o olayın uzun dönemli sıklığına eşittir. Tek bir evrensel cevap vardır ve tanım 1'den farklı olarak, bir olayın olasılığına ilişkin görüşler, az çok kanıt olsa bile kişiden kişiye değişemez.

Örnek vermek:
Bir tarafında tura, diğer tarafında tura olan tarafsız bir normal madeni param olduğunu varsayalım. Şimdi parayı atıyorum. Sonuçlar elimde. Ancak, bir izleyici olarak madalyonun yazı tura mı yoksa tura mı olduğunu bilmiyorsunuz.
Bu yüzden cevaplamanızı istiyorum - " Attığım paranın tura gelme olasılığı nedir ?"
Olasılığın iki farklı tanımına dayalı olarak iki farklı yanıt türü olacaktır .
Bayesçiler
Bayesçiler, madalyonun teke tek gelme olasılığının %50 olduğu yanıtını vereceklerdir. Bir Bayesçi olarak bana şöyle diyeceksiniz: " Cevap benim için %50 teke tek. Ama evet, savurmanın sonucunu biliyorsun. Yani, madeni paranın tura veya tura olma olasılığı %100'dür. Ama biliyor musun, umurumda değil. Çünkü elimdeki kaynaklara göre cevap benim için %50. ”
sık sık
Sıkça sorulan kişiler şu soruyu yanıtlayacaklardır: “ Madalyonun teke tek gelme olasılığı %100 veya %0. Madeni para indiği için bu sabit ve sabit değere bir olasılık bağlamanın bir anlamı yoktur. Atmanın sonucu kesindir ve bunda herhangi bir değişiklik yoktur. Hiç kimse arasında cevap farklılığı olmayacak.
Okuyun: Denetimli Öğrenme Türleri
Bayesian ve Sık Kullanılanlar—Önceki Olasılıkların Kullanımı Açısından
Başka bir örneğe bakalım.
Yukarıdaki örneği bir adım daha ileri götüreceğiz. Parayı birçok kez atacağım, varsayalım 14 kez. Son 14 yazı tura atışının sonuçlarını not ettiniz. Şimdi 15. kez yazı tura atıyorum. Şimdi size “ Bu atılan paranın tura gelme olasılığı nedir? ” diye sorulur .

Bayesçiler
Bayes iseniz, kullanacağınız şey, öncel olarak bilinen bir terimdir . Bayes'in koşullu olasılık formülüne bakalım:
burada A ve B bazı olaylardır ve P(A | B), belirli bir B olayının gerçekleştiği A olayının Olasılığı olarak tanımlanır.
Şimdi, P(A) terimi, veriler dikkate alınmadan önce A olayının doğru olma olasılığı olarak tanımlanan önsel olarak tanımlanır.
Örneğe dönecek olursak, bir Bayesçi olarak, "öncelikli" terimini kullanacaksınız, yani, yazı turalarının geçmiş sonuçlarına göre bir karar vereceksiniz.
Diyelim ki 14 yazı tura atışından 9 kez tura geldi. “Eh, kafa bulma şansım daha yüksek” diyebilirsiniz. Bunu sadece siz söylemiyorsunuz, hesaplamanız da argümanınızı destekleyecek. Yani kararınız 'önceki' sonuçlar nedeniyle değiştirildi. Birinin karar verme yeteneği, seçilen önceliğe olan inanç derecesine bağlıdır. Önceden olasılıkların atanması, Bayesian'ın sonuçlarındaki kilit faktörlerden biri olmuştur.
Mutlaka Okuyun: Makine Öğreniminde Regresyon Modellerinin Türleri
sık sık
Bir Frequentist iseniz, Bayesçilerin söylediklerine tamamen katılmayacaksınız. Önceki genellikle tahmin edilen bir değer olduğundan, öncekiyle herhangi bir ilginiz yoktur. Bunun yerine, fikriniz maksimum olabilirlik tahminine dayanmaktadır. Yapacağınız şey, bir popülasyondan örnek veriler toplayacaksınız. Şimdi, verilerin ortalaması ile çoğunlukla tekdüze olan ortalama değeri tahmin edin. Bu değer, belirsiz parametrenin maksimum olabilirlik noktasıdır (tahmin).
Şimdi, Sıkça kullanılanlar, örnek ortalamanın popülasyon ortalamasına eşit olacağını varsayabilir, bu yanlış olabilir ve çoğu zaman gerçekten de yanlıştır. Böylece p-değerleri ve güven aralıkları gibi terimler getirdiler.
P değeri, sıfır hipotezi doğru olduğunda gözlemlenen veya aşırı sonuçları bulma olasılığını ölçmenin basit bir yoludur. p değeri 0,05 anlamlılık seviyesinin altında olduğunda boş hipotezi reddedersiniz. Şimdi, p değerleri ve güven aralıkları, onlara ayrı bir makale ayıracak kadar önemlidir.
Şimdi ilk adım olarak popülasyondan örnek alacaksınız. Prosedürü çok sayıda tekrarlarsınız. Şimdi, gerçek ortalamanız, seçtiğiniz güven aralıkları içinde ve belirli bir olasılığa sahip olmalıdır. Yazı tura sorumun sonucunu almak için yapmanız gereken şey bu.

Frekansçıların çok karmaşık olduğunu düşünüyor olabilirsiniz. Eh, onlar bir anlamda. Çeşitli koşullara rağmen herkes tarafından kabul edilebilecek mükemmel evrensel cevabı bulma eğilimindedirler. Ve bunu yaparak, Frequentists, yeni başlayanların anlayamayabileceği ciddi hesaplamalar ve karmaşıklık içerir.
Çözüm
Bayesian vs. Frequentist — yol hangisi?
Bayesian vs. Frequentist tartışması devam edecek. Ancak, mevcut kaynaklara bağlı olarak hangi yaklaşımı kullanacağınız size bağlıdır. Her iki yaklaşımın da çok sayıda uygulaması vardır. Büyük Matematikçi Laplace, Frequentist yöntemle çok daha zor olabilecek Bayes çıkarımını kullanarak Satürn'ün kütlesini hesapladı.
Öte yandan, Frequentist düşünce tarzı, son araştırmacıların özellikle tıp bilimi alanında Bayesci çıkarımla yapılamayacak sorunları verimli bir şekilde çözmelerine yardımcı oldu.
Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.