Çok Terimli Naive Bayes Açıklaması: İşlev, Avantajlar ve Dezavantajlar, 2022'deki Uygulamalar

Yayınlanan: 2021-01-03

İçindekiler

Tanıtım

Sayısal verilerin analizi için binlerce yazılım veya araç var ama metinler için çok azı var. Çok terimli Naive Bayes, kategorik metin verilerinin analizi için kullanılan en popüler denetimli öğrenme sınıflandırmalarından biridir.

Metin veri sınıflandırması popülerlik kazanıyor çünkü e-postada, belgelerde, web sitelerinde vb. analiz edilmesi gereken çok büyük miktarda bilgi mevcut. Belirli bir metin türü etrafındaki bağlamı bilmek, onu kullanacak kullanıcılara bir yazılım veya ürün algısını bulmada yardımcı olur.

Bu makale size çok terimli Naive Bayes algoritması ve onunla ilgili tüm kavramlar hakkında derinlemesine bir anlayış verecektir. Algoritmaya, nasıl çalıştığına, faydalarına ve uygulamalarına kısa bir genel bakış üzerinden geçiyoruz.

Çok terimli Naive Bayes algoritması nedir?

Çok terimli Naive Bayes algoritması, çoğunlukla Doğal Dil İşleme'de (NLP) kullanılan olasılıksal bir öğrenme yöntemidir. Algoritma Bayes teoremine dayanır ve bir e-posta veya gazete makalesi gibi bir metnin etiketini tahmin eder. Belirli bir örnek için her etiketin olasılığını hesaplar ve ardından çıktı olarak en yüksek olasılığa sahip etiketi verir.

Naive Bayes sınıflandırıcı, tüm algoritmaların ortak bir ilkeyi paylaştığı ve sınıflandırılan her bir özelliğin başka bir özellikle ilgili olmadığı birçok algoritmanın bir koleksiyonudur. Bir özelliğin varlığı veya yokluğu, diğer özelliğin varlığını veya yokluğunu etkilemez.

Kariyerinizi hızlandırmak için Makine Öğrenimi Eğitimine dünyanın en iyi üniversitelerinden - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve Makine Öğrenimi ve Yapay Zeka alanında İleri Düzey Sertifika Programından çevrimiçi katılın .

Çok terimli Naive Bayes nasıl çalışır?

Naive Bayes, metin veri analizi için ve birden çok sınıfla ilgili problemlerde kullanılan güçlü bir algoritmadır. Naive Bayes teoreminin işleyişini anlamak için önce Bayes teoremi kavramını anlamak önemlidir, çünkü ikincisine dayalıdır.

Thomas Bayes tarafından formüle edilen Bayes teoremi, bir olayla ilgili koşulların ön bilgisine dayanarak bir olayın meydana gelme olasılığını hesaplar. Aşağıdaki formüle dayanmaktadır:

P(A|B) = P(A) * P(B|A)/P(B)

B tahmincisi zaten sağlandığında, A sınıfı olasılığını hesapladığımız yer.

P(B) = B'nin önceki olasılığı

P(A) = A sınıfının önceki olasılığı

P(B|A) = A sınıfı olasılığı verilen B tahmincisinin oluşumu

Bu formül, metindeki etiketlerin olasılığını hesaplamaya yardımcı olur.

Naive Bayes algoritmasını bir örnekle anlayalım. Aşağıdaki tabloda, güneşli, bulutlu ve yağmurlu hava koşullarının bir veri setini aldık. Şimdi hava şartlarına göre oyuncuların oynayıp oynamayacağı ihtimalini tahmin etmemiz gerekiyor.

Mutlaka Okuyun: Naive Bayes'e Giriş

Eğitim Veri Seti

Hava Durumu

Güneşli

bulutlu

Yağmurlu

Güneşli

bulutlu

Yağmurlu

Güneşli

Yağmurlu

Güneşli

bulutlu

Yağmurlu

Oynamak

Numara

Evet

Numara

Evet

Numara

Evet

Numara

Bu, aşağıda verilen adımları izleyerek kolayca hesaplanabilir:

Yukarıdaki problem cümlesinde verilen eğitim veri setinin sıklık tablosunu oluşturunuz. İlgili hava durumuna karşı tüm hava koşullarının sayısını listeleyin.

Hava Durumu	Evet	Numara
Güneşli	3	2
bulutlu	4	0
Yağmurlu	2	3
Toplam	9	5

Her hava koşulunun olasılıklarını bulun ve bir olasılık tablosu oluşturun.

Hava Durumu	Evet	Numara
Güneşli	3	2	=5/14(0.36)
bulutlu	4	0	=4/14(0.29)
Yağmurlu	2	3	=5/14(0.36)
Toplam	9	5
	=9/14 (0.64)	=5/14 (0.36)

Naive Bayes teoremini kullanarak her hava koşulu için arka olasılığı hesaplayın. En yüksek olasılığa sahip hava durumu, oyuncuların oynayıp oynamayacaklarının sonucu olacaktır.

Tüm hava koşullarının arka olasılığını hesaplamak için aşağıdaki denklemi kullanın:

P(A|B) = P(A) * P(B|A)/P(B)

Yukarıdaki formüldeki değişkenleri değiştirdikten sonra şunu elde ederiz:

P(Evet|Güneşli) = P(Evet) * P(Güneşli|Evet) / P(Güneşli)

Yukarıdaki olabilirlik tablosundan değerleri alın ve yukarıdaki formüle koyun.

P(Güneşli|Evet) = 3/9 = 0.33, P(Evet) = 0.64 ve P(Güneşli) = 0.36

Dolayısıyla, P(Evet|Güneşli) = (0.64*0.33)/0.36 = 0.60

P(Hayır|Güneşli) = P(Hayır) * P(Güneşli|Hayır) / P(Güneşli)

Yukarıdaki olabilirlik tablosundan değerleri alın ve yukarıdaki formüle koyun.

P(Güneşli|Hayır) = 2/5 = 0,40, P(Hayır) = 0,36 ve P(Güneşli) = 0,36

P(Hayır|Güneşli) = (0,36*0,40)/0,36 = 0,6 = 0,40

Güneşli hava koşullarında oynama olasılığı daha yüksektir. Bu nedenle, hava güneşliyse oyuncu oynayacak.

Benzer şekilde, yağışlı ve bulutlu koşulların arka olasılığını hesaplayabiliriz ve en yüksek olasılığa dayanarak; Oyuncunun oynayıp oynamayacağını tahmin edebiliyoruz.

Ödeme: Açıklanan Makine Öğrenimi Modelleri

Avantajlar

Naive Bayes algoritması aşağıdaki avantajlara sahiptir:

Yalnızca olasılığı hesaplamanız gerektiğinden uygulanması kolaydır.
Bu algoritmayı hem sürekli hem de ayrık verilerde kullanabilirsiniz.
Basittir ve gerçek zamanlı uygulamaları tahmin etmek için kullanılabilir.
Yüksek düzeyde ölçeklenebilirdir ve büyük veri kümelerini kolayca işleyebilir.

Dezavantajları

Naive Bayes algoritması aşağıdaki dezavantajlara sahiptir:

Bu algoritmanın tahmin doğruluğu diğer olasılık algoritmalarına göre daha düşüktür.
Gerileme için uygun değildir. Naive Bayes algoritması yalnızca metinsel veri sınıflandırması için kullanılır ve sayısal değerleri tahmin etmek için kullanılamaz.

Uygulamalar

Naive Bayes algoritması aşağıdaki yerlerde kullanılır:

Yüz tanıma
Hava Durumu tahmini
Tıbbi teşhis
Spam algılama
Yaş/cinsiyet kimliği
Dil tanımlama
duygusal analiz
yazar kimliği
Haber sınıflandırması

Çözüm

Çok terimli Naive Bayes algoritmasını öğrenmeye değer çünkü birçok endüstride pek çok uygulamaya sahiptir ve bu algoritma tarafından yapılan tahminler çok hızlıdır. Haber sınıflandırması, Naive Bayes algoritmasının en popüler kullanım örneklerinden biridir. Haberleri siyasi, bölgesel, küresel vb. gibi farklı bölümlere ayırmak için oldukça kullanılır.

Bu makale, Multinomial Naive Bayes algoritmasına ve adım adım Naive Bayes sınıflandırıcısının çalışmasına başlamak için bilmeniz gereken her şeyi kapsar.

Yapay zeka, makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saatlik zorlu eğitim, 30'dan fazla vaka çalışması ve ödev sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka alanında Yönetici PG Programına göz atın , IIIT-B Mezunları statüsü, 5'ten fazla pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Çok terimli saf bayes algoritması ile ne demek istiyorsunuz?

Çok terimli Naive Bayes algoritması, Doğal Dil İşleme'de (NLP) popüler olan bir Bayes öğrenme yaklaşımıdır. Program, Bayes teoremini kullanarak bir e-posta veya gazete haberi gibi bir metnin etiketini tahmin eder. Belirli bir örnek için her bir etiketin olasılığını hesaplar ve en büyük şansa sahip etiketi verir. Naive Bayes sınıflandırıcısı, hepsinde ortak olan bir dizi algoritmadan oluşur: Sınıflandırılan her bir özellik, diğer herhangi bir özellikle ilgisizdir. Bir özelliğin varlığının veya yokluğunun, başka bir özelliğin dahil edilmesi veya hariç tutulmasıyla hiçbir ilgisi yoktur.

Çok terimli saf bayes algoritması nasıl çalışır?

Naive Bayes yöntemi, metin girişini analiz etmek ve çok sayıda sınıfla ilgili sorunları çözmek için güçlü bir araçtır. Naive Bayes teoremi Bayes teoremine dayandığından, önce Bayes teoremi kavramını anlamak gerekir. Thomas Bayes tarafından geliştirilen Bayes teoremi, olayın koşullarının önceden bilinmesine dayalı olarak gerçekleşme olasılığını tahmin eder. B tahmincisi mevcut olduğunda, A sınıfının olasılığını hesaplarız. Aşağıdaki formüle dayanır: P(A|B) = P(A) * P(B|A)/P(B).

Çok terimli saf bayes algoritmasının avantajları ve dezavantajları nelerdir?

Uygulaması basittir çünkü tek yapmanız gereken olasılığı hesaplamaktır. Bu yaklaşım hem sürekli hem de ayrık verilerle çalışır. Basittir ve gerçek zamanlı uygulamaları tahmin etmek için kullanılabilir. Çok ölçeklenebilir ve çok büyük veri kümelerini kolaylıkla işleyebilir.

Bu algoritmanın tahmin doğruluğu, diğer olasılık algoritmalarından daha düşüktür. Gerileme için uygun değildir. Naive Bayes tekniği yalnızca metin girdisini sınıflandırmak için kullanılabilir ve sayısal değerleri tahmin etmek için kullanılamaz.