Anova Dua Faktor dengan Replikasi [Dengan Perbandingan]
Diterbitkan: 2020-09-18Daftar isi
pengantar
Analisis Varians atau Anova, singkatnya, adalah teknik memahami varians variabel. Itu memungkinkan untuk menghitung seberapa besar variabel tertentu mempengaruhi hasil akhir. Teknik Anova melakukan ini dengan menghilangkan atau mengkonfirmasi hipotesis nol. Hipotesis nol berarti bahwa tidak ada hubungan sama sekali antara dua entitas yang diamati. Misalnya, jika ada dua variabel A dan B, kita katakan bahwa hipotesis nol antara A dan B berlaku jika perubahan A tidak akan mempengaruhi hasil B dan sebaliknya.
Sebelum masuk ke rincian Anova dua faktor dengan replikasi , mari kita bahas dulu konsep dasar Anova.
Konsep
Anova adalah konsep statistik, dan tidak ada statistik yang berlaku tanpa angka. Anova membutuhkan nomor tertentu yang dapat digunakan untuk menganalisis hipotesis nol yang kami ajukan pada awal analisis. Tiga nilai kritis untuk perhitungan ini adalah rasio F dan kritis F, dengan beberapa nilai signifikansi. Sekarang di sini kita tidak akan banyak membahas perhitungan matematis yang terperinci, tetapi kita akan membahas bagian-bagian konseptual dengan contoh-contoh.
Signifikansi variabel atau entitas tertentu dihitung dengan membandingkan nilai dengan dampak keseluruhan pada nilai target. Sebagai contoh, signifikansi X akan lebih besar pada A, jika perubahan kecil pada X dapat mempengaruhi perubahan nilai A. Rasio F dihitung dengan jumlah Mean kuadrat suatu entitas dan jumlah rata-rata kuadrat residual. Jumlah rata-rata kuadrat dihitung dengan membagi jumlah rata-rata kuadrat dengan derajat kebebasan. Derajat kebebasan adalah jumlah kemungkinan kasus dari variabel nominal, dikurangi satu.
F kritis didasarkan pada nilai signifikansi. Rasio F dihitung secara manual melalui proses yang dijelaskan di atas. Validitas hipotesis tergantung pada nilai F rasio dan F kritis. Berikut adalah kasus-kasusnya:
· Jika F-kritis > F rasio, maka hipotesis berlaku, dan tidak ada hubungan antara variabel yang diamati
· Jika F-kritis < F rasio, maka hipotesis dapat dinyatakan tidak valid, dan pada gilirannya mendukung gagasan bahwa variabel saling mempengaruhi.
Baca: Top 10 Pekerjaan Data Science dengan Gaji Tertinggi di India
Perbedaan antara Satu arah dan dua arah
Seperti disebutkan, di sini, kami membahas konsep Anova dua faktor dengan replikasi . Tapi apa sebenarnya perbedaan antara satu faktor dan dua faktor? Anova one-factor hanya berurusan dengan satu variabel nominal (Variabel yang memiliki dua atau lebih kelas atau kategori, tetapi urutan kategori tidak penting. Misalnya, jenis kelamin adalah variabel nominal dengan kelas pria dan wanita).
Pelajari kursus sertifikasi ilmu data dari Universitas top dunia. Dapatkan Program PG Eksekutif, Program Sertifikat Tingkat Lanjut, atau Program Magister untuk mempercepat karier Anda.
Namun, dua faktor Anova berurusan dengan dua variabel nominal. Karena variabelnya lebih sedikit, ada juga perubahan jumlah hipotesis nol di kedua jenis analisis. Hipotesis pada Anova dua arah adalah sebagai berikut:
· Sarana pengamatan oleh satu variabel adalah sama. Artinya, variabel satu tidak mempengaruhi nilai target dengan cara apapun.
· Sarana pengamatan variabel lain adalah sama. Artinya, variabel dua tidak mempengaruhi nilai target dengan cara apapun.
· Tidak ada interaksi antara variabel satu dan variabel dua.
Dalam Anova satu arah, terdapat hipotesis nol dan hipotesis alternatif. Pertama, rata-rata variabel tersebut sama, dan kedua, rata-rata variabel lainnya sama.
Untuk memahami lebih jelas, mari kita ambil bantuan sebuah contoh.
Contoh 1
| SID | Kebisingan Tinggi | SID | Kebisingan Sedang | SID | Kebisingan Rendah |
| S1 | 23 | S5 | 23 | S9 | 39 |
| S2 | 45 | S6 | 64 | S10 | 43 |
| S3 | 34 | S7 | 73 | S11 | 26 |
| S4 | 46 | S8 | 48 | S12 | 11 |
Tabel menunjukkan tanda siswa yang berbeda di hadapan berbagai suara yang berbeda. Dalam anova satu arah, hanya ada satu variabel nominal. Di sini, variabel nominalnya adalah kebisingan. Jadi, hipotesis akan mencoba untuk memeriksa apakah kebisingan memiliki pengaruh yang signifikan terhadap nilai siswa atau tidak.

Mari kita ambil tabel lain:
| Murid | Kebisingan Tinggi | Kebisingan Sedang | Kebisingan Rendah |
| Pria | 13 | 24 | 29 |
| 12 | 23 | 45 | |
| 11 | 32 | 33 | |
| 4 | 11 | 33 | |
| Perempuan | 16 | 17 | 56 |
| 12 | 24 | 34 | |
| 8 | 23 | 23 | |
| 3 | 29 | 67 |
Sekarang di tabel ini, nilai ditunjukkan dengan kategori siswa. Oleh karena itu, kami memiliki dua variabel nominal, jenis kelamin siswa dan tingkat kebisingan. Di sini, dapat dilakukan analisis dua faktor, yang akan dilakukan dengan menggunakan tiga hipotesis.
Tapi sekarang apa sebenarnya yang dimaksud dengan Anova dua faktor dengan replikasi ?
Baca Juga: Ide Proyek Ilmu Data
Perbedaan antara dengan-replikasi dan tanpa-replikasi
Perbedaan mendasar antara Anova dua faktor dengan replikasi dan tanpa replikasi adalah ukuran sampel yang berbeda. Pada teknik dengan replikasi, jumlah sampel sebagian besar seragam. Jika itu masalahnya, berarti dihitung secara independen. Jenis data ini juga dikenal sebagai data seimbang. Tetapi jika ukuran sampel tidak seragam, analisisnya sulit. Lebih baik mendapatkan ukuran sampel yang seragam untuk mendapatkan hasil yang lebih cepat.
Pada teknik tanpa ulangan, ukuran sampel pengamatan adalah satu. Artinya hanya ada satu observasi untuk setiap kombinasi variabel nominal. Di sini, analisis dapat dilakukan dengan menggunakan rata-rata kedua variabel serta rata-rata total dengan mempertimbangkan setiap pengamatan sebagai satu klaster. Rasio-F kemudian dapat dihitung dengan rata-rata sisa dan rata-rata total.
Lihat: 12 Pustaka Python Teratas untuk Ilmu Data
Kesimpulan
Jadi, beginilah cara kerja Anova dua faktor dengan replikasi . Ada banyak konsep seperti itu dalam statistik di mana perhitungannya tampak sulit, tetapi semuanya menjadi lebih sederhana jika ada kejelasan konseptual. Kami membahas apa yang dimaksud dengan Anova, konsep, Anova dua arah, dan kriteria replikasi. Kami harap artikel ini memberikan detail yang cukup tentang cara kerja dua faktor Anova dengan replikasi untuk Anda coba sendiri.
Jika Anda penasaran untuk belajar tentang ilmu data, lihat Program PG Eksekutif IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan pakar industri, 1 -on-1 dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.
Apakah uji-t sama dengan Anova?
Uji-t menguji apakah dua populasi berbeda secara statistik, sedangkan Anova menguji apakah tiga atau lebih populasi berbeda secara statistik. Untuk membandingkan rata-rata dua kelompok, digunakan uji-t, tetapi Anova digunakan ketika membandingkan rata-rata tiga kelompok atau lebih. Di Anova, langkah pertama adalah menemukan nilai P yang sama. Nilai P yang signifikan dalam uji Anova menunjukkan bahwa perbedaan rata-rata antara setidaknya satu pasangan signifikan secara statistik.
Di Anova, bagaimana Anda menerima atau menolak hipotesis nol?
Interpretasi tipikal adalah bahwa data signifikan secara statistik ketika nilai-p kurang dari tingkat signifikansi, dan Anda menolak H 0. Ketika ada cukup informasi untuk mengidentifikasi bahwa tidak semua rata-rata sama, kita dapat menolak hipotesis nol. dalam Anova satu arah.
Di Anova, bagaimana Anda menginterpretasikan nilai F?
Signifikansi F adalah probabilitas bahwa hipotesis nol dari model regresi Anda tidak dapat ditolak. Dengan kata lain, ini menunjukkan probabilitas bahwa semua koefisien dalam hasil regresi Anda adalah nol! Perbedaan antara dua nilai kuadrat rata-rata setara dengan rasio F. Jika hipotesis nol akurat, F harus mendekati 1,0 sebagian besar waktu. Rasio F yang tinggi menyiratkan bahwa varians rata-rata kelompok lebih tinggi daripada yang diantisipasi secara kebetulan.
