Penjelasan Multinomial Naive Bayes: Fungsi, Kelebihan & Kekurangan, Aplikasi di 2022

Diterbitkan: 2021-01-03

Daftar isi

pengantar

Ada ribuan perangkat lunak atau alat untuk analisis data numerik tetapi sangat sedikit untuk teks. Multinomial Naive Bayes adalah salah satu klasifikasi pembelajaran terawasi yang paling populer yang digunakan untuk analisis data teks kategorikal.

Klasifikasi data teks semakin populer karena ada banyak sekali informasi yang tersedia di email, dokumen, situs web, dll. yang perlu dianalisis. Mengetahui konteks di sekitar jenis teks tertentu membantu dalam menemukan persepsi perangkat lunak atau produk kepada pengguna yang akan menggunakannya.

Artikel ini akan memberi Anda pemahaman mendalam tentang algoritma multinomial Naive Bayes dan semua konsep yang terkait dengannya. Kami membahas ikhtisar singkat tentang algoritme, cara kerjanya, manfaatnya, dan aplikasinya.

Apa yang dimaksud dengan algoritma Multinomial Naive Bayes?

Algoritma Multinomial Naive Bayes merupakan metode pembelajaran probabilistik yang banyak digunakan dalam Natural Language Processing (NLP). Algoritme didasarkan pada teorema Bayes dan memprediksi tag teks seperti sepotong email atau artikel surat kabar. Ini menghitung probabilitas setiap tag untuk sampel yang diberikan dan kemudian memberikan tag dengan probabilitas tertinggi sebagai output.

Pengklasifikasi Naive Bayes adalah kumpulan dari banyak algoritma di mana semua algoritma berbagi satu prinsip umum, dan bahwa setiap fitur yang diklasifikasikan tidak terkait dengan fitur lainnya. Ada tidaknya suatu fitur tidak mempengaruhi ada atau tidaknya fitur lainnya.

Bergabunglah dengan Pelatihan Pembelajaran Mesin online dari Universitas top dunia – Magister, Program Pascasarjana Eksekutif, dan Program Sertifikat Tingkat Lanjut di ML & AI untuk mempercepat karier Anda.

Bagaimana Multinomial Naive Bayes bekerja?

Naive Bayes adalah algoritma yang kuat yang digunakan untuk analisis data teks dan dengan masalah dengan beberapa kelas. Untuk memahami cara kerja teorema Naive Bayes, penting untuk memahami konsep teorema Bayes terlebih dahulu karena didasarkan pada yang terakhir.

Teorema Bayes, dirumuskan oleh Thomas Bayes, menghitung probabilitas suatu peristiwa terjadi berdasarkan pengetahuan sebelumnya tentang kondisi yang terkait dengan suatu peristiwa. Ini didasarkan pada rumus berikut:

P(A|B) = P(A) * P(B|A)/P(B)

Dimana kita menghitung probabilitas kelas A ketika prediktor B sudah tersedia.

P(B) = probabilitas sebelumnya dari B

P(A) = peluang awal kelas A

P(B|A) = kemunculan prediktor B dengan probabilitas kelas A

Rumus ini membantu dalam menghitung probabilitas tag dalam teks.

Mari kita pahami algoritma Naive Bayes dengan sebuah contoh. Pada tabel di bawah ini, kami telah mengambil kumpulan data kondisi cuaca yaitu cerah, mendung, dan hujan. Sekarang, kita perlu memprediksi probabilitas apakah para pemain akan bermain berdasarkan kondisi cuaca.

Harus Dibaca: Pengantar Naive Bayes

Kumpulan Data Pelatihan

Cuaca

Cerah

Mendung

Hujan

Cerah

Mendung

Hujan

Cerah

Hujan

Cerah

Mendung

Hujan

Bermain

Tidak

Ini dapat dengan mudah dihitung dengan mengikuti langkah-langkah yang diberikan di bawah ini:

Buat tabel frekuensi dari kumpulan data pelatihan yang diberikan dalam pernyataan masalah di atas. Daftar hitungan semua kondisi cuaca terhadap kondisi cuaca masing-masing.

Cuaca	Ya	Tidak
Cerah	3	2
Mendung	4	0
Hujan	2	3
Total	9	5

Temukan probabilitas setiap kondisi cuaca dan buat tabel kemungkinan.

Cuaca	Ya	Tidak
Cerah	3	2	=5/14(0,36)
Mendung	4	0	=4/14(0.29)
Hujan	2	3	=5/14(0,36)
Total	9	5
	=9/14 (0,64)	=5/14 (0,36)

Hitung probabilitas posterior untuk setiap kondisi cuaca menggunakan teorema Naive Bayes. Kondisi cuaca dengan probabilitas tertinggi akan menjadi hasil apakah para pemain akan bermain atau tidak.

Gunakan persamaan berikut untuk menghitung probabilitas posterior semua kondisi cuaca:

P(A|B) = P(A) * P(B|A)/P(B)

Setelah mengganti variabel dalam rumus di atas, kita mendapatkan:

P(Ya|Cerah) = P(Ya) * P(Cerah|Ya) / P(Cerah)

Ambil nilai dari tabel kemungkinan di atas dan masukkan ke dalam rumus di atas.

P(Cerah|Ya) = 3/9 = 0,33, P(Ya) = 0,64 dan P(Cerah) = 0,36

Jadi, P(Ya|Cerah) = (0,64*0,33)/0,36 = 0,60

P(Tidak|Cerah) = P(Tidak) * P(Cerah|Tidak) / P(Cerah)

Ambil nilai dari tabel kemungkinan di atas dan masukkan ke dalam rumus di atas.

P(Cerah|Tidak) = 2/5 = 0,40, P(Tidak) = 0,36 dan P(Cerah) = 0,36

P(Tidak|Cerah) = (0,36*0,40)/0,36 = 0,6 = 0,40

Probabilitas bermain dalam kondisi cuaca cerah lebih tinggi. Oleh karena itu, pemain akan bermain jika cuaca cerah.

Demikian pula, kita dapat menghitung probabilitas posterior kondisi hujan dan mendung, dan berdasarkan probabilitas tertinggi; kita bisa memprediksi apakah pemain akan bermain.

Lihat: Model Pembelajaran Mesin Dijelaskan

Keuntungan

Algoritma Naive Bayes memiliki keuntungan sebagai berikut:

Sangat mudah untuk diterapkan karena Anda hanya perlu menghitung probabilitas.
Anda dapat menggunakan algoritme ini pada data kontinu dan diskrit.
Ini sederhana dan dapat digunakan untuk memprediksi aplikasi waktu nyata.
Ini sangat skalabel dan dapat dengan mudah menangani kumpulan data besar.

Kekurangan

Algoritma Naive Bayes memiliki kelemahan sebagai berikut:

Keakuratan prediksi algoritma ini lebih rendah dari algoritma probabilitas lainnya.
Ini tidak cocok untuk regresi. Algoritma Naive Bayes hanya digunakan untuk klasifikasi data tekstual dan tidak dapat digunakan untuk memprediksi nilai numerik.

Aplikasi

Algoritma Naive Bayes digunakan di tempat-tempat berikut:

Pengenalan wajah
Prediksi cuaca
Diagnosa medis
Deteksi spam
Identifikasi usia/jenis kelamin
Identifikasi bahasa
Analisis sentimen
Identifikasi kepengarangan
Klasifikasi berita

Kesimpulan

Sangatlah berharga untuk mempelajari algoritma Multinomial Naive Bayes karena memiliki begitu banyak aplikasi di beberapa industri, dan prediksi yang dibuat oleh algoritma ini sangat cepat. Klasifikasi berita adalah salah satu kasus penggunaan paling populer dari algoritma Naive Bayes. Hal ini sangat digunakan untuk mengklasifikasikan berita ke dalam bagian yang berbeda seperti politik, regional, global, dan sebagainya.

Artikel ini mencakup semua yang harus Anda ketahui untuk memulai algoritma Multinomial Naive Bayes dan cara kerja pengklasifikasi Naive Bayes langkah demi langkah.

Jika Anda tertarik untuk mempelajari lebih lanjut tentang AI, pembelajaran mesin, lihat Program PG Eksekutif IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas , Status Alumni IIIT-B, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Apakah yang Anda maksud: algoritme naive bayes multinomial

Algoritma Multinomial Naive Bayes adalah pendekatan pembelajaran Bayesian yang populer di Natural Language Processing (NLP). Program menebak tag teks, seperti email atau cerita surat kabar, menggunakan teorema Bayes. Ini menghitung kemungkinan setiap tag untuk sampel yang diberikan dan mengeluarkan tag dengan peluang terbesar. Pengklasifikasi Naive Bayes terdiri dari sejumlah algoritma yang semuanya memiliki satu kesamaan: setiap fitur yang diklasifikasikan tidak terkait dengan fitur lainnya. Keberadaan atau ketidakhadiran suatu fitur tidak berpengaruh pada penyertaan atau pengecualian fitur lain.

Bagaimana cara kerja algoritma naive bayes multinomial?

Metode Naive Bayes adalah alat yang kuat untuk menganalisis input teks dan memecahkan masalah dengan banyak kelas. Karena teorema Naive Bayes didasarkan pada teorema Bayes, maka perlu terlebih dahulu memahami gagasan teorema Bayes. Teorema Bayes, yang dikembangkan oleh Thomas Bayes, memperkirakan kemungkinan terjadinya berdasarkan pengetahuan sebelumnya tentang kondisi peristiwa. Ketika prediktor B itu sendiri tersedia, kami menghitung kemungkinan kelas A. Ini berdasarkan rumus di bawah ini: P(A|B) = P(A) * P(B|A)/P(B).

Apa kelebihan dan kekurangan algoritma naive bayes multinomial?

Ini mudah diterapkan karena yang harus Anda lakukan hanyalah menghitung probabilitas. Pendekatan ini bekerja dengan data kontinu dan diskrit. Ini mudah dan dapat digunakan untuk meramalkan aplikasi waktu nyata. Ini sangat terukur dan dapat menangani kumpulan data yang sangat besar dengan mudah.

Akurasi prediksi algoritma ini lebih rendah dari algoritma probabilitas lainnya. Itu tidak cocok untuk regresi. Teknik Naive Bayes hanya dapat digunakan untuk mengklasifikasi input tekstual dan tidak dapat digunakan untuk memperkirakan nilai numerik.