Bayes Ağları: Giriş, Örnekler ve Pratik Uygulamalar

Yayınlanan: 2020-02-23

Veri veya istatistikle çalışmış olan herkes bir şeyi kesin olarak bilir: korelasyon mutlaka nedensellik anlamına gelmez veya ima etmez. Şimdi, bu oldukça açık görünse de, verilerdeki çoğu hatanın iki terim arasındaki karışıklıktan kaynaklandığını öğrenmek sizi şok edebilir. Bunun temel nedeni, korelasyonu tanımlamanın uygun olmasına rağmen, nedenselliği tanımlamanın veya nicelleştirmenin neredeyse imkansız olmasıdır.

Aslında, Nedensellik: Modeller, Akıl Yürütme ve Çıkarım'ın yazarı Judea Pearl, kitapta insanların matematiksel çabalarını olasılıksal ve istatistiksel çıkarımlara odakladığını ve nedensel düşünceleri "sezginin ve sağduyunun merhametine" bıraktığını belirtiyor. Bunun, bilimsel ilerleme açısından hala çok geride olduğumuz önemli bir faktör olduğunu söylüyor.

Bu, Bayes Ağlarının bizim için kolaylaştırdığı zamandır. Çeşitli bağımsız nedenleri aynı anda görmemize izin vererek korelasyonu nedensellikten ayırmamıza yardımcı olurlar. Tüm bunlar, makine öğrenimi algoritmaları öznellik veya sezgi üzerinde çalışmadığından doğru bir şekilde yapılır; veriler üzerinde çalışırlar.

Bayes Ağlarının nasıl çalıştığını anlamak için bir örnek görelim.

İçindekiler

Bayes Ağları Örneği

Bu örnek için, farz edelim ki, dünya son derece nadir ama ölümcül bir hastalığa yakalanmış; Diyelim ki hastalığa yakalanma ihtimaliniz 1000'de 1'dir.

Şimdi, birinin hastalıktan muzdarip olup olmadığını anlamak için doktorlar bir test geliştiriyor. Yakalama, sadece% 99 doğru olmasıdır.

Hastalığınızın olup olmadığından nasıl emin olacaksınız? Başka bir test yapmak sonuçları etkiler mi?

Bakalım uyguladığınız zaman ne olacak…

Test 1

Hastalık 1000'de sadece 1'i etkilediğinden, enfekte olma olasılığınız:

Enfekte	0.001
Özgür	0,999

Hastalık CPT (Koşullu Olasılık Tablosu)

Açıkça, 1000'de 1'inin hastalıktan muzdarip olma şansı olduğu gibi, 1000'de 999'u da hastalıktan muaftır.

Benzer şekilde, testin olasılığını hesaplamak için bir tablo oluşturacağız. Daha önce de belirtildiği gibi, eğer test sadece %99 doğruysa. Bu, sonucun doğru olma ihtimalinin yalnızca %99 olduğu anlamına gelir. Negatif sonuçlarda da benzer bir durum söz konusudur.

virüs varlığı	Enfekte	Özgür
Test 1 (Pozitif)	0.99	0.01
Test 1 (Negatif)	0.01	0.99

Test1 CPT (Koşullu Olasılık Tablosu)

Şimdi, hastalığın varlığının test sonuçlarından nasıl etkilendiğini görmek için bir grafik çizelim.

Bu hücreleri testin sonuçlarıyla doldurmak bana aşağıdaki sonucu verecektir.

Görüntü kaynağı

Gördüğünüz gibi, test pozitif çıkarsa, hastalığa yakalanma şansınız sadece %9'dur.

Şimdi, bu numarayı nasıl aldık?

Bayes teoremi!

Görüntü kaynağı

Örneğimizde,

P(H|E) = P(H) x P(E|H) / P(E)

P(H|E) = P(H) x P(E|H) / {P(E|H) x P(H) + P(E|Hc) x P(Ec)}
P(H|E) = (0,99 x 0,001) / (0,001 x 0,99 + 0,999 x 0,01) = 0,9 = %9

Bu bize ne anlatıyor?

Test pozitif olsa bile, hastalığın nadir olması nedeniyle, hastalığa yakalanma şansı sadece %9'dur.

Öyleyse, emin olmak için başka bir test yaptığınızda ne olur ve o da pozitif çıkar.

Okuyun: Yeni Başlayanlar için Makine Öğrenimi Proje Fikirleri

2. test

Yine, ikinci test de sadece %99 doğru olacaktır.

virüs varlığı	Enfekte	Özgür
Test 2 (Pozitif)	0.99	0.01
Test 2 (Negatif)	0.01	0.99

Bayes Ağı şimdi şöyle olurdu:

Görüntü kaynağı

Sonuçlar tersine döndü!

Bu, iki testte iki pozitif sonuç alırsanız, virüs tarafından enfekte olma ihtimalinin %9'dan %91'e yükseldiği anlamına gelir. Ama yine %100 demiyor!

Şimdi, testten bir pozitif ve bir negatif sonuç alırsanız ne olur?

Görüntü kaynağı

Gördüğünüz gibi, iki testten birinin negatif çıkması durumunda hastalığınız olmama ihtimali %100'dür.

Test 3

Üç test yaptığınızda ve hepsinin doğru olduğu ortaya çıktığında daha da iyi oluyor.

Görüntü kaynağı

Açıkçası, şimdi, enfekte olma ihtimalin %100.

Şimdi testlerden biri negatif diğer ikisi pozitif çıkınca ne olacağını görelim.

Görüntü kaynağı

Yine, bir virüsün varlığı için sonuçlar %91 pozitiftir.

Bayes Ağları ve Veri Modelleme

Yukarıdaki örnekte, Bayes Ağlarının, doğru sonuçlar elde etmek için verilerin modellenmesi söz konusu olduğunda önemli bir rol oynadığı görülebilir.

Aslında, sonucu etkileyebilecek daha fazla faktör dahil ederek ağı iyileştirmek, Bayes Ağlarını kullanarak farklı senaryoları görselleştirmemize ve simüle etmemize de olanak tanır.

Bayes Ağları ayrıca verilerdeki adaletsizliği ölçmek ve bu adaletsizliği azaltmak için teknikleri geliştirmek için harika bir araçtır.

Bu gibi durumlarda, nihai sonuçları etkileyen hassas faktörleri belirlemek için yola özgü teknikleri kullanmak en iyisidir.

Bayes Ağlarının En İyi 5 Pratik Uygulaması

Bayes Ağları, belirsiz verilerle doğru sonuçlar elde etmek için veri bilimi alanında yaygın olarak kullanılmaktadır.

Bayes Ağlarının Uygulamaları

1. İstenmeyen Posta Filtresi

Gmail'in spam e-postaları (istenmeyen ve istenmeyen e-postaları) nasıl filtrelediğini hiç merak etmediğinizi söylüyorsanız yalan söylüyorsunuz. En sağlam filtre olan Bayesian spam filtresini kullanıyor.

2. Turbo Kodu

Bayes Ağları, yüksek performanslı ileri hata düzeltme kodları olan turbo kodları oluşturmak için kullanılır. Bunlar 3G ve 4G mobil ağlarda kullanılır.

3. Görüntü İşleme

Bayes Ağları, görüntüleri dijital formata dönüştürmek için matematiksel işlemleri kullanır. Ayrıca görüntü iyileştirmeye izin verir.

4. Biyoizleme

Kimyasalların konsantrasyonunu ölçmek, Bayes Ağları ile olduğundan daha kolay olamazdı. Bunda, insanlarda kan ve doku miktarı göstergeler kullanılarak ölçülür.

5. Gen Düzenleyici Ağ (GNR)

Bir GNR, protein ve RNA ekspresyon ürünleri aracılığıyla diğer hücre içerikleri ile etkileşime giren bir hücrenin çeşitli DNA segmentlerini içerir. Davranışının tahminleri Bayes Ağları kullanılarak analiz edilebilir.

Çözüm

Bu çevrimiçi blog gönderisinde, Bayes Ağlarının elimizdeki verilerden doğru sonuçlar almamıza nasıl yardımcı olduğunu öğrendiniz. Verilerdeki küçük farklılıklar bile nihai sonucu önemli ölçüde etkileyebilir. Bayes Ağları, yalnızca korelasyon yerine nedensellik kullanarak verileri analiz etmemize yardımcı olur.

Veri bilimi alanında devrimsel olduklarını kanıtladılar. Açıkçası, bu bilimde kariyer yapmak, hayalinizdeki işi elde etmenize yardımcı olabilir. Öyleyse, veri bilimi kurslarımızdan birine kaydolun ve uzmanlardan öğrenin! Ayrıca birinci sınıf ve deneyimli kariyer danışmanlarından ücretsiz kariyer desteği sunuyoruz. Kurs hakkında daha fazla bilgi edinmek için broşürü indirin.

Makine Öğrenimi ve Yapay Zeka alanındaki kariyerler hakkında daha fazla bilgi edinmek istiyorsanız, IIT Madras ve upGrad'ın Makine Öğrenimi ve Bulutta Gelişmiş Sertifikasyonuna göz atın.

Bayes ağının bileşenleri nelerdir?

Bayes Ağlarının kökeni, adını ünlü İngiliz matematikçi Thomas Bayes'ten alan Bayes Teoremine dayanmaktadır. Bu teorem esasen koşullu olasılığı belirlemek için kullanılan matematiksel bir formüldür. Yapay zeka alanındaki Bayes Ağları, temel katmanı Bayes Teoremi olan Bayes İstatistiklerinden türetilmiştir. Bir Bayes Ağı iki modülden oluşur - nicel modülde koşullu olasılık ve nitel modülünde yönlendirilmiş asiklik grafik. AI ve makine öğreniminde Bayes Ağları, belirsiz inançlara dayalı olarak akıl yürütme ve modelleme için kullanılan araçlardır.

Makine öğrenimi için ne kadar olasılık ve istatistik bilmeniz gerekiyor?

AI'nın önemli bir kısmı ve farklı alt alanları, olasılık ve istatistiklere dayanmaktadır. Makine öğrenimi söz konusu olduğunda, onu daha çok olasılık, istatistik ve çeşitli algoritmalar kullanan disiplinler arası bir alan olarak düşünmeniz gerekir. İstatistik ve olasılık, olayların göreceli oluşumunu analiz etmek için kullanılan ilgili matematik alanlarıdır. Bu istatistik, olasılık ve algoritma kombinasyonu, sonuçta verilerden öğrenen ve aynı zamanda değerli bilgiler sunan akıllı uygulamalar oluşturmak için kullanılır. Bu nedenle, makine öğrenimini öğrenmek istiyorsanız, temel bir istatistik ve olasılık anlayışı zorunludur. Deneysel ve teorik olasılık, ortak olasılık, koşullu olasılık, Bayes Teoremi, tanımlayıcı istatistikler, tek değişkenli ve iki değişkenli tanımlayıcı istatistikler, korelasyon vb. gibi temel kavramlara aşina olmalısınız.

AI'da Bayes Ağlarını kullanmanın avantajları nelerdir?

Bayes Ağları, karmaşık ve belirsiz alanlar için modeller oluşturmak için oldukça popüler bir tekniktir. Bayes Ağlarını kullanarak ekosistemler ve çevre yönetimi gibi belirsiz manzaralar için matematiksel olarak mantıklı ve sağlam bir çerçeve geliştirebilirsiniz. Bu tekniği kullanmanın en önemli avantajı, heterojen kaynaklardan ve değişen doğruluk düzeylerinden gelen verileri matematiksel olarak tutarlı bir modele kolayca dahil edebilmenizdir. Bu, uzman bilgisini, verisi olmayan değişkenler hakkındaki verilerle birleştirmeye yardımcı olur.