Anova Çoğaltma ile İki Faktör [Karşılaştırmalı]
Yayınlanan: 2020-09-18İçindekiler
Tanıtım
Kısaca Varyans Analizi veya Anova, değişkenlerin varyansını anlama tekniğidir. Belirli bir değişkenin nihai sonucu ne kadar etkilediğini hesaplamayı mümkün kılar. Anova tekniği bunu boş hipotezi ortadan kaldırarak veya onaylayarak yapar. Boş bir hipotez, gözlem altındaki iki varlık arasında hiçbir ilişki olmadığı anlamına gelir. Örneğin, iki A ve B değişkeni varsa, A'daki bir değişiklik B'nin sonuçlarını etkilemeyecekse A ve B arasındaki sıfır hipotezinin geçerli olduğunu söyleriz ve bunun tersi de geçerlidir.
Anova'nın iki faktörlü replikasyon ile detaylarına girmeden önce, Anova'nın temel kavramını tartışalım.
konsept
Anova istatistiksel bir kavramdır ve sayı olmadan hiçbir istatistik tutmaz. Anova, analizin başında ortaya koyduğumuz sıfır hipotezini analiz edebilmesi için belirli bir sayı gerektirir. Bu hesaplama için üç kritik değer, bazı anlamlılık değerleriyle birlikte F oranları ve F-kritik değerlerdir. Şimdi burada detaylı matematiksel hesaplamaya pek girmeyeceğiz, ancak kavramsal kısımlara örneklerle değineceğiz.
Belirli bir değişkenin veya varlığın önemi, değerlerin hedef değer üzerindeki genel etkiyle karşılaştırılmasıyla hesaplanır. Örneğin, X'teki küçük bir değişiklik bile A'nın değerini değiştirmeyi etkileyebiliyorsa, X'in önemi A üzerinde daha fazla olacaktır. F oranları, bir varlığın ortalama kareleri toplamı ve artık karelerin ortalama toplamı ile hesaplanır. Ortalama kareler toplamı, ortalama kareler toplamının serbestlik derecesine bölünmesiyle hesaplanır. Serbestlik derecesi, nominal değişkenin olası durumlarının sayısı, eksi birdir.
F kritik, önem değerlerine dayanmaktadır. F oranları yukarıda açıklanan işlemle manuel olarak hesaplanır. Hipotezin geçerliliği F oranları ve F kritik değerlerine bağlıdır. İşte durumlar:
· F-kritik > F oranı ise, hipotez geçerlidir ve gözlem altındaki değişkenler arasında hiçbir ilişki yoktur.
· F-kritik < F oranı ise, hipotez geçersiz ilan edilebilir ve bu da değişkenlerin birbirini etkilediği fikrini destekler.
Okuyun: Hindistan'da En Yüksek Ödeme Yapan 10 Veri Bilimi İşi
Tek yönlü ve iki yönlü arasındaki fark
Bahsedildiği gibi, burada Anova iki faktörlü replikasyon kavramını tartışıyoruz . Fakat bir faktör ile iki faktör arasındaki fark tam olarak nedir? Anova tek faktörlü, yalnızca bir nominal değişkenle ilgilenir (İki veya daha fazla sınıfı veya kategorisi olan ancak kategorilerin sırası önemli olmayan bir değişken. Örneğin, cinsiyet, erkek ve kadın sınıfları olan nominal bir değişkendir).
Dünyanın en iyi Üniversitelerinden veri bilimi sertifika kurslarını öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.
Ancak, Anova iki faktörlü, iki nominal değişkenle ilgilenir. Değişkenler daha az olduğu için her iki analiz türünde de boş hipotez sayısında bir değişiklik olur. İki yönlü Anova'daki hipotezler aşağıdaki gibidir:
· Bir değişkene göre gözlem araçları aynıdır. Yani değişken bir, hedef değeri hiçbir şekilde etkilemez.
· Diğer değişkenin gözlem araçları aynıdır. Yani değişken iki, hedef değeri hiçbir şekilde etkilemez.
· Değişken bir ve değişken iki arasında etkileşim yoktur.
Tek yönlü Anova'da bir boş hipotez ve bir alternatif hipotez vardır. Birincisi, değişkenin ortalamaları aynıdır ve ikincisi, diğer değişkenin ortalamaları aynıdır.
Daha net anlamak için bir örnekten yardım alalım.
Örnek 1
SID | Yüksek Gürültü | SID | Orta Gürültü | SID | Düşük Gürültü |
S1 | 23 | S5 | 23 | S9 | 39 |
S2 | 45 | S6 | 64 | S10 | 43 |
S3 | 34 | S7 | 73 | S11 | 26 |
S4 | 46 | S8 | 48 | S12 | 11 |
Tablo, farklı gürültü aralığının varlığında farklı öğrencilerin notlarını göstermektedir. Tek yönlü bir anovada, yalnızca bir nominal değişken vardır. Burada nominal değişken gürültüdür. Böylece hipotez, gürültünün öğrencilerin notları üzerinde anlamlı bir etkisinin olup olmadığını kontrol etmeye çalışacaktır.

Bir tablo daha alalım:
Öğrenci | Yüksek Gürültü | Orta Gürültü | Düşük Gürültü |
Erkek | 13 | 24 | 29 |
12 | 23 | 45 | |
11 | 32 | 33 | |
4 | 11 | 33 | |
Dişi | 16 | 17 | 56 |
12 | 24 | 34 | |
8 | 23 | 23 | |
3 | 29 | 67 |
Şimdi bu tabloda, notlar öğrenci kategorileri ile gösterilmektedir. Dolayısıyla, öğrencinin cinsiyeti ve gürültü seviyesi olmak üzere iki nominal değişkenimiz var. Burada, üç hipotez kullanılarak yapılacak olan iki faktörlü analiz olabilir.
Ama şimdi Anova'nın replikasyonlu iki faktörlü tam olarak anlamı nedir?
Ayrıca Okuyun: Veri Bilimi Proje Fikirleri
Çoğaltmalı ve çoğaltmasız arasındaki fark
Anova iki faktörlü replikasyonlu ve replikasyonsuz arasındaki temel fark , örneklem büyüklüğünün farklı olmasıdır. Replikasyonlu teknikte, toplam numune sayısı çoğunlukla tekdüzedir. Bu durumda, ortalamalar bağımsız olarak hesaplanır. Bu tür veriler aynı zamanda dengeli veriler olarak da bilinir. Ancak örnek boyutu tek tip değilse, analiz zordur. Daha hızlı sonuç almak için numune boyutunu tek tip almak daha iyidir.
Tekrarlamasız teknikte örnek gözlem büyüklüğü birdir. Bu, her bir nominal değişken kombinasyonu için yalnızca tek bir gözlem olduğu anlamına gelir. Burada analiz, hem değişkenlerin ortalamaları hem de her gözlemin tek bir küme olarak ele alınmasının toplam ortalaması kullanılarak yapılabilir. F oranı daha sonra kalan ortalama ve toplam ortalama ile hesaplanabilir.
Kontrol edin: Veri Bilimi için En İyi 12 Python Kitaplığı
Çözüm
Yani, Anova iki faktörlü çoğaltma böyle çalışır. İstatistikte hesaplamanın zor göründüğü bu tür birçok kavram vardır, ancak kavramsal netlik varsa işler daha da basitleşir. Anova'nın ne anlama geldiğini, kavramı, iki yönlü Anova'yı ve çoğaltma kriterlerini tartıştık. Makalenin, kendi başınıza denemeniz için Anova'nın çoğaltma ile iki faktörlü çalışmaları hakkında yeterli ayrıntı sağladığını umuyoruz .
Veri bilimi hakkında bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın çalışan profesyoneller için oluşturulmuş ve 10'dan fazla vaka çalışması ve proje, uygulamalı uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk, 1 Endüstri danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.
T-testi Anova ile aynı mı?
T testi, iki popülasyonun istatistiksel olarak farklı olup olmadığını incelerken Anova, üç veya daha fazla popülasyonun istatistiksel olarak farklı olup olmadığını test eder. İki grubun ortalamalarını karşılaştırmak için t-testi kullanılır, ancak üç veya daha fazla grubun ortalamalarını karşılaştırırken Anova kullanılır. Anova'da ilk adım ortak bir P değeri bulmaktır. Anova testinde anlamlı bir P değeri, en az bir çift arasındaki ortalama farkın istatistiksel olarak anlamlı olduğunu gösterir.
Anova'da sıfır hipotezini nasıl kabul eder veya reddedersiniz?
Tipik yorum, p değeri anlamlılık düzeyinden küçük olduğunda verilerin istatistiksel olarak anlamlı olduğu ve sizin H 0'ı reddettiğinizdir. Ortalamaların hepsinin eşit olmadığını belirlemek için yeterli bilgi olduğunda, sıfır hipotezini reddedebiliriz. tek yönlü Anova.
Anova'da F değerini nasıl yorumlarsınız?
F'nin önemi, regresyon modelinizin sıfır hipotezinin reddedilememesi olasılığıdır. Başka bir deyişle, regresyon sonucunuzdaki tüm katsayıların sıfır olma olasılığını gösterir! İki ortalama kare değeri arasındaki fark, F oranına eşdeğerdir. Boş hipotez doğruysa, F çoğu zaman 1.0'a yakın olmalıdır. Yüksek bir F oranı, grup ortalama varyansının şans eseri tahmin edilenden daha yüksek olduğu anlamına gelir.