Analisis Daya dalam Statistik: Apa itu & Bagaimana Melakukannya?
Diterbitkan: 2021-01-08Pengujian hipotesis adalah aspek penting dari setiap Analisis Statistik. Namun, ada banyak hal yang harus ditentukan sebelumnya agar tes yang kita lakukan bisa seakurat mungkin. Di sinilah konsep kekuasaan berperan dan mendefinisikan heuristik Uji Statistik.
Pada akhir tutorial ini, Anda akan tahu:
- Heuristik Uji Statistik
- Apa Kekuatan sebuah ujian?
- Apa perlunya Analisis Daya?
- Bagaimana melakukan Analisis Daya
Daftar isi
Heuristik Uji Statistik
Melakukan Uji Statistik yang benar pada beberapa heuristik yang perlu diatur sebelumnya sebelum melakukan pengujian. Sangat penting untuk mengatur heuristik yang tepat karena ini tidak dapat diubah setelah pengujian dimulai. Mari kita lihat beberapa di antaranya.
1. Tingkat Signifikansi dan Interval Keyakinan
Sebelum memulai uji statistik apa pun, ambang batas probabilitas perlu ditetapkan. Ambang batas atau tingkat signifikansi ini disebut Nilai Kritis (alpha). Wilayah lengkap di bawah kurva probabilitas di luar nilai alfa disebut Wilayah Kritis.
Nilai alfa memberi tahu kita seberapa jauh titik data sampel (atau titik eksperimental) harus dari hipotesis nol (titik rata-rata asli) sebelum menyimpulkan bahwa cukup tidak biasa untuk menolak hipotesis nol. Nilai umum dari alpha yang digunakan adalah 0,05 atau 95% confidence interval.
2. Nilai-P
Untuk mengevaluasi apakah hasil pengujian yang kami peroleh signifikan secara statistik atau tidak, kami membandingkan Nilai Kritis (alpha) yang telah kami tetapkan sebelum pengujian dengan Nilai-P pengujian. Nilai p adalah probabilitas untuk mendapatkan nilai yang ekstrim atau bahkan lebih ekstrim dari nilai yang kita uji.
3. Kesalahan Tipe 1 & Tipe 2
Tes Statistik tidak pernah bisa 100% pasti. Selalu ada ruang untuk kesalahan dan disesatkan oleh hasilnya. Seperti dibahas di atas, jika kita menetapkan nilai alpha 0,05, ada interval kepercayaan 95%. Oleh karena itu, ada kemungkinan 5% bahwa hasil yang Anda dapatkan salah dan menyesatkan. Hasil yang salah inilah yang kami sebut sebagai kesalahan. Ada 2 jenis kesalahan – Tipe 1 & Tipe 2.
Nilai tingkat signifikansi 0,05 berarti uji statistik Anda akan 95% kali benar. Yang juga berarti ada kemungkinan 5% salah! Itu akan menjadi kasus Anda menolak hipotesis nol ketika itu benar. Ini adalah contoh dari Kesalahan Tipe 1. Dan kita juga dapat mengatakan bahwa alpha( ) adalah probabilitas melakukan kesalahan Tipe 1.
Ini juga bisa menjadi kasus ketika Anda menyimpulkan bahwa hipotesis nol itu benar atau menerimanya ketika itu salah. Secara teknis, kita tidak pernah bisa menerima hipotesis nol. Kita hanya bisa gagal untuk menolaknya. Inilah yang kami sebut Kesalahan Tipe 2. Demikian pula, kemungkinan Anda membuat kesalahan Tipe 2 diberikan oleh Beta — .
Baca: Analis Data: Keterampilan & Alat Teratas untuk Dikuasai
Apa Kekuatan Tes Statistik?
Kekuatan tes adalah probabilitas benar menolak Hipotesis Null ketika itu salah. Atau dengan kata lain, Daya berbanding terbalik dengan probabilitas membuat kesalahan tipe 2. Oleh karena itu, Daya = 1- . Misalnya, jika kita menetapkan kekuatan menjadi 80%, maka yang kita maksudkan adalah bahwa 80% dari uji statistik kita benar dan bukan yang palsu. Oleh karena itu, semakin tinggi nilai daya, semakin kecil kemungkinan melakukan kesalahan tipe 2.
Tapi kenapa hasilnya bisa palsu? Ini karena kita berurusan dengan sampel acak di sini. Dan terkadang sampel yang diambil terlalu jauh dari rata-rata distribusi sehingga memberikan hasil yang tidak realistis, memaksa kita untuk membuat keputusan yang salah. Seluruh tujuan Analisis Daya adalah untuk mencegah kita membuat keputusan yang salah ini.
Apakah kita P-Hacking?
Mari kita ambil contoh di mana kita telah membuat vaksin untuk COVID-19 dan kita sangat yakin bahwa vaksin itu akan memberikan hasil yang signifikan. Kami melanjutkan untuk melakukan uji statistik untuk melihat apakah keyakinan kami juga benar secara statistik. Jadi tetapkan alfa sebagai 0,05 dan lakukan pengujian menggunakan 100 sampel.
Setelah pengujian, kami mendapatkan nilai P sebagai 0,06. Kami melihat bahwa itu sangat dekat dengan alfa kami tetapi tidak kurang dari itu sehingga kami dapat dengan aman menolak hipotesis nol. Sangat menggoda untuk melihat apa yang terjadi jika kita menambah sampel dan mengulang pengujian.
Jadi kami menambahkan 50 sampel lagi dan melihat bahwa P-Value sekarang menjadi 0,045. Apakah kita baru saja membuktikan bahwa vaksin kita signifikan secara statistik? TIDAK! Kami baru saja meretas P saat kami meningkatkan jumlah sampel setelah kami mendapatkan hasil pertama. Pelajari lebih lanjut tentang Apa itu P-Hacking & Bagaimana Cara Menghindarinya?
Apa itu Analisis Daya?
Seperti yang kita lihat pada contoh di atas, kami menemukan bahwa ukuran sampelnya kecil dan kami meningkatkannya nanti. Ini salah dan tidak boleh dilakukan. Nilai ukuran sampel harus ditetapkan sebelum memulai pengujian itu sendiri. Tapi berapa nilai ukuran sampel yang tepat untuk kita?

Mari kita pertimbangkan contoh di mana kita melakukan beberapa tes menggunakan ukuran sampel hanya 1. Oleh karena itu, ketika kita mengambil sampel 1 titik data secara acak dari populasi, itu bisa berupa sekitar rata-rata yang mewakili data kita dengan benar, atau bisa juga banyak jauh dari mean dan tidak mewakili data dengan baik.
Masalah muncul ketika kami melakukan uji statistik menggunakan titik data yang jauh ini. Nilai P yang akan kita dapatkan akan salah. Kami sekarang melakukan serangkaian tes lain dengan mengambil 2 sebagai ukuran sampel. Sekarang bahkan jika satu nilai jauh dari rata-rata data, nilai lain yang berada di sisi lain dari distribusi akan menarik rata-ratanya ke tengah, sehingga mengurangi efek dari nilai yang jauh itu. Oleh karena itu, dengan ukuran sampel 2, hasil kami akan lebih benar dengan Nilai-P yang benar.
Analisis Daya adalah teknik yang digunakan untuk mengetahui jumlah ukuran sampel yang tepat yang diperlukan untuk melakukan pengujian dengan sebaik-baiknya. Semakin tinggi Kekuatan yang kita butuhkan lebih banyak adalah jumlah ukuran sampel yang akan dibutuhkan. Jadi, Anda mungkin berpikir mengapa tidak mengambil ukuran sampel yang besar saja karena ukuran sampel yang besar berarti hasil yang lebih baik dan lebih dapat dipercaya. Ini tidak benar karena pengumpulan data mahal dan pengetahuan tentang ukuran sampel yang diperlukan sangat penting.
Bagaimana cara melakukan Analisis Daya?
Kekuatan tes tergantung pada beberapa faktor. Langkah pertama untuk melakukan analisis daya adalah menetapkan Nilai Daya. Pertimbangkan bahwa Anda menetapkan kekuatan umum 0,8, artinya Anda ingin memiliki setidaknya 80% peluang untuk menolak hipotesis nol dengan benar. Jika kami memvalidasi efek vaksin COVID-19 pada sekelompok orang, kami ingin membuktikan bahwa distribusi titik data orang yang divaksinasi berbeda dengan orang yang diberi plasebo.
1. Jumlah tumpang tindih
Kita perlu mempertimbangkan jumlah tumpang tindih antara dua distribusi yang kita bandingkan. Semakin tumpang tindih, semakin sulit bagi kita untuk menolak nol dengan aman dan karenanya kita akan membutuhkan lebih banyak ukuran sampel. Namun, jika tumpang tindihnya sangat sedikit, maka kita dapat dengan mudah menolak nol dengan aman. Dan kami membutuhkan ukuran sampel yang lebih sedikit. Tumpang tindih tergantung pada jarak antara rata-rata dari dua distribusi dan simpangan bakunya.
2. Ukuran efek
Ukuran efek adalah cara untuk menggabungkan efek dari perbedaan antara rata-rata dan standar deviasi dari populasi. Ukuran efek (d) dihitung sebagai Perkiraan perbedaan antara rata-rata dibagi dengan perkiraan simpangan baku gabungan. Salah satu cara paling sederhana untuk menghitung Pooled Estimasi Standar Deviasi adalah Akar kuadrat dari jumlah kuadrat dari Standar deviasi dibagi 2.
Jadi setelah kita memiliki nilai Daya, nilai alfa, dan ukuran efek, kita dapat memasukkan nilai-nilai ini ke Kalkulator Daya Statistik dan mendapatkan nilai ukuran sampel. Kalkulator Daya Statistik semacam itu mudah tersedia di internet.
Dapatkan sertifikasi ilmu data dari Universitas top dunia. Pelajari Program PG Eksekutif, Program Sertifikat Tingkat Lanjut, atau Program Magister untuk mempercepat karir Anda.
Sebelum kamu pergi
Kami menghitung ukuran sampel dengan melakukan Analisis Daya menggunakan Daya, alfa, dan ukuran efek. Jadi jika kita mendapatkan nilai ukuran sampel 7, itu berarti kita membutuhkan ukuran sampel 7 untuk memiliki peluang 80% untuk menolak Hipotesis Null dengan benar. Memiliki jumlah keahlian domain yang tepat juga penting untuk memperkirakan sarana populasi dan tumpang tindihnya serta daya yang dibutuhkan.
Jika Anda penasaran untuk belajar tentang ilmu data, lihat Diploma PG IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan pakar industri, 1- on-1 dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.
Apa itu Analisis Daya?
Kekuatan tes atau analisis Power adalah probabilitas benar menolak Hipotesis Null ketika itu salah. Atau dengan kata lain, Daya berbanding terbalik dengan probabilitas membuat kesalahan tipe 2. Oleh karena itu, Daya = 1-β. Misalnya, jika kita menetapkan kekuatan menjadi 80%, maka yang kita maksudkan adalah bahwa 80% dari pengujian statistik kita benar dan bukan palsu. Oleh karena itu, semakin tinggi nilai daya, semakin kecil kemungkinan melakukan kesalahan tipe 2. Analisis Daya adalah tentang mencegah keputusan yang salah karena kami menangani berbagai sampel acak dan ada kemungkinan besar bahwa rata-rata mereka akan memberikan rata-rata yang tidak realistis dan membuat kami membuat keputusan yang salah.
Faktor-faktor apa yang dipertimbangkan saat membawa Analisis Daya kami?
Ada faktor-faktor tertentu yang mempengaruhi pengujian untuk analisis daya. Langkah pertama adalah mengatur nilai daya. Misalkan kita memiliki kekuatan nilai 0,7 yang menyiratkan bahwa Anda memiliki peluang 70% untuk menolak hipotesis nol. Di bawah ini adalah faktor-faktor yang mempengaruhi analisis Power. Besarnya overlap adalah overlap antara dua distribusi yang dibandingkan. Tumpang tindih harus sekecil mungkin karena jumlah tumpang tindih berbanding lurus dengan kesulitan menghitung nol. Ukuran efek adalah metode untuk mengelompokkan perbedaan antara mean dan standar deviasi populasi. Hal ini dilambangkan dengan “d” dan dihitung sebagai estimasi perbedaan antara rata-rata dibagi dengan estimasi deviasi standar Pooled. Karena sekarang kami memiliki nilai daya, nilai alfa (jumlah tumpang tindih), dan ukuran efek, kami dapat dengan mudah melakukan Analisis Daya.
Apa itu P-Hacking?
P-Hacking atau Pengerukan Data adalah suatu metode penyalahgunaan teknik analisis data untuk menemukan pola dalam data yang tampak signifikan tetapi tidak signifikan. Metode ini mempengaruhi penelitian secara negatif karena memberikan janji palsu untuk memberikan pola data yang signifikan yang pada gilirannya dapat menyebabkan peningkatan drastis dalam jumlah positif palsu. P-hacking tidak dapat dicegah sepenuhnya tetapi ada beberapa metode yang pasti dapat menguranginya dan membantu menghindari jebakan.