Bayesian vs. Frequentists: Mana Yang Harus Dipilih Untuk Masalah Anda Selanjutnya?
Diterbitkan: 2020-12-23Jika Anda pernah mendalami statistik, kemungkinan Anda telah membaca tentang debat hebat— Bayesian vs. Frequentist. Masing-masing hanyalah sebuah pendekatan untuk memecahkan masalah statistik yang terkait dengan probabilitas. Sekarang, ahli statistik Bayesian menyalahkan Frequentist atas metode mereka dan sebaliknya. Tidak ada akhir dari perdebatan ini. Keduanya memiliki kelebihan dan kekurangan masing-masing.
Dalam artikel ini, kita akan melihat kedua pendekatan tersebut dan mencari tahu mana di antara keduanya yang baik untuk Anda untuk masalah statistik Anda berikutnya.
Daftar isi
Bayesians vs. Frequentists— Dalam Definisi Probabilitas
Definisi 1: Probabilitas sebagai Derajat Keyakinan oleh Frank Ramsey (Pendekatan Bayesian)
Probabilitas suatu peristiwa diukur dengan derajat subjektif dari keyakinan. Ini juga disebut 'Probabilitas Logis'. Ini berarti definisi probabilitas Anda mungkin berbeda dari definisi orang lain, jika dia memiliki lebih banyak bukti daripada Anda. Ini benar-benar baik-baik saja dan orang lain dapat berpikir apa pun yang dia inginkan.
Definisi 2: Probabilitas sebagai Frekuensi Jangka Panjang oleh Ronald Fisher (Pendekatan Frekuensi)
Probabilitas suatu peristiwa sama dengan frekuensi jangka panjang dari peristiwa itu ketika itu diulang beberapa kali berulang-ulang. Ada satu jawaban universal dan tidak seperti definisi 1, pendapat tentang kemungkinan suatu peristiwa tidak dapat berbeda dari orang ke orang bahkan jika mereka memiliki lebih/kurang bukti.

Contoh:
Misalkan saya memiliki koin normal yang tidak memihak yang memiliki kepala di satu sisi dan ekor di sisi lain. Sekarang saya melemparkan koin. Saya memiliki hasilnya. Tapi, Anda sebagai penonton tidak tahu apakah koin itu head-up atau tails-up.
Jadi saya ingin Anda menjawab – “ Berapa peluang koin yang saya lempar mengarah ke atas ?”
Akan ada dua jenis jawaban yang berbeda berdasarkan dua definisi probabilitas yang berbeda .
orang Bayesian
Bayesians akan menjawab bahwa ada kemungkinan 50% bahwa koin itu mengarah ke atas. Anda sebagai seorang Bayesian akan berkata kepada saya, “ Jawabannya adalah 50% untuk saya. Tapi ya, Anda tahu hasil lemparan itu. Jadi, Anda memiliki probabilitas 100% bahwa koin itu adalah kepala atau ekor. Tapi, kau tahu apa, aku tidak peduli. Karena, sesuai sumber daya yang tersedia bagi saya, jawabannya adalah 50% untuk saya. ”
pengunjung yang sering
Orang yang sering berkunjung akan menjawab pertanyaan “ Ada peluang 100% atau peluang 0% bahwa koin mengarah ke atas. Karena koin telah mendarat, tidak ada gunanya melampirkan probabilitas pada nilai tetap dan konstan ini. Hasil lemparan adalah final dan tidak ada perubahan. Tidak akan ada variasi jawaban di antara siapa pun.
Baca: Jenis-Jenis Pembelajaran Terawasi
Bayesian vs. Frequentist— Dalam Hal Penggunaan Probabilitas Sebelumnya
Mari kita lihat contoh lain.
Kami akan mengambil contoh di atas selangkah lebih maju. Saya akan melempar koin berkali-kali, misalkan 14 kali. Anda telah mencatat hasil dari 14 lemparan koin terakhir. Sekarang untuk ke-15 kalinya, saya melempar koin lagi. Sekarang, Anda ditanya, “ Berapa peluang koin yang dilempar ini mengarah ke atas ”.
orang Bayesian
Jika Anda Bayesian, apa yang akan Anda gunakan, adalah istilah yang dikenal sebagai prior . Mari kita lihat rumus Bayes untuk probabilitas bersyarat:

dimana A dan B adalah beberapa kejadian dan P(A | B) didefinisikan sebagai Peluang kejadian A kejadian B tertentu telah terjadi.
Sekarang, istilah P(A) didefinisikan sebagai prior yang didefinisikan sebagai probabilitas bahwa kejadian A benar sebelum data dipertimbangkan.
Kembali ke contoh, sebagai Bayesian, Anda akan menggunakan istilah sebelumnya yaitu, Anda akan membuat keputusan berdasarkan hasil lemparan koin sebelumnya.
Misalkan dari 14 pelemparan koin, saya mendapat head-up 9 kali. Anda mungkin mengatakan bahwa "Yah, saya memiliki peluang lebih tinggi untuk mendapatkan kepala". Anda tidak hanya mengatakan itu, tetapi perhitungan Anda juga akan mendukung argumen Anda. Jadi keputusan Anda telah diubah karena hasil 'sebelumnya'. Kemampuan seseorang untuk membuat keputusan tergantung pada tingkat kepercayaan seseorang terhadap prior yang dipilih. Menetapkan probabilitas sebelumnya telah menjadi salah satu faktor kunci dalam hasil Bayesian.
Wajib Dibaca: Jenis-Jenis Model Regresi dalam Machine Learning
pengunjung yang sering
Jika Anda seorang Frequentist, Anda akan sepenuhnya tidak setuju dengan apa pun yang dikatakan orang Bayesian. Anda tidak tertarik pada prior karena prior seringkali merupakan nilai yang dapat ditebak. Sebaliknya ide Anda didasarkan pada perkiraan kemungkinan maksimum. Apa yang akan Anda lakukan adalah, Anda akan mengumpulkan data sampel dari suatu populasi. Sekarang perkirakan nilai rata-rata yang sebagian besar seragam dengan rata-rata data. Nilai ini adalah titik kemungkinan maksimum (estimasi) dari parameter yang tidak pasti.
Sekarang, Frequentist mungkin berasumsi bahwa rata-rata sampel akan sama dengan rata-rata populasi, yang bisa saja salah dan memang sering salah. Jadi mereka telah memperkenalkan istilah seperti nilai-p dan interval kepercayaan.
Nilai-P adalah cara sederhana untuk mengukur probabilitas menemukan hasil yang teramati atau ekstrem ketika hipotesis nol benar. Anda menolak hipotesis nol ketika nilai p di bawah tingkat signifikansi 0,05. Sekarang, nilai-p dan interval kepercayaan cukup penting untuk mendedikasikan artikel terpisah untuk mereka.
Jadi sekarang sebagai langkah pertama, Anda mengumpulkan sampel dari populasi. Anda mengulangi prosedur beberapa kali. Sekarang, rata-rata Anda yang sebenarnya harus berada dalam interval kepercayaan yang Anda pilih, memiliki probabilitas tertentu. Inilah yang harus Anda lakukan untuk mendapatkan hasil dari pertanyaan lempar koin saya.

Anda mungkin berpikir Frequentist terlalu rumit. Yah, mereka dalam arti tertentu. Mereka cenderung mencari jawaban universal yang sempurna yang dapat diterima oleh siapa saja, meskipun dengan berbagai kondisi. Dan dengan melakukan itu, Frequentist benar-benar melibatkan perhitungan dan kerumitan serius yang mungkin tidak dipahami oleh pemula.
Kesimpulan
Bayesian vs. Frequentist— yang mana?
Debat Bayesian vs. Frequentist akan berlanjut. Tetapi terserah Anda, berdasarkan sumber daya yang tersedia, pendekatan mana yang digunakan. Kedua pendekatan memiliki sejumlah besar aplikasi. Matematikawan hebat Laplace menghitung massa Saturnus menggunakan inferensi Bayesian yang bisa jadi jauh lebih sulit dengan cara Frequentist.
Di sisi lain, cara berpikir Frequentist telah membantu para peneliti baru-baru ini dalam memecahkan masalah secara efisien terutama di bidang ilmu kedokteran yang tidak dapat dilakukan dengan inferensi Bayesian.
Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.