Anova Two Factor with Replication [مقارنة]
نشرت: 2020-09-18جدول المحتويات
مقدمة
تحليل التباين أو Anova ، باختصار ، هو أسلوب لفهم تباين المتغيرات. يجعل من الممكن حساب مدى تأثير متغير معين على النتيجة النهائية. تقوم تقنية Anova بذلك عن طريق حذف أو تأكيد فرضية العدم. تعني الفرضية الصفرية أنه لا توجد علاقة على الإطلاق بين الكيانين الخاضعين للملاحظة. على سبيل المثال ، إذا كان هناك متغيرين A و B ، فإننا نقول إن الفرضية الصفرية بين A و B تظل ثابتة إذا كان التغيير في A لن يؤثر على نتائج B والعكس صحيح.
قبل الخوض في تفاصيل Anova ثنائي العامل مع النسخ ، دعونا أولاً نناقش المفهوم الأساسي لـ Anova.
مفهوم
Anova هو مفهوم إحصائي ، ولا توجد إحصائيات بدون أرقام. تتطلب Anova عددًا معينًا يمكنها من خلاله تحليل الفرضية الصفرية التي نطرحها في بداية التحليل. القيم الحرجة الثلاثة لهذا الحساب هي نسب F و F الحرجة ، مع بعض قيم الأهمية. الآن لن نتطرق كثيرًا إلى الحساب الرياضي التفصيلي ، لكننا سنتناول الأجزاء المفاهيمية بأمثلة.
يتم حساب أهمية متغير أو كيان معين من خلال مقارنة القيم مع التأثير الكلي على القيمة المستهدفة. على سبيل المثال ، ستكون أهمية X أكثر في A ، إذا كان حتى تغيير بسيط في X يمكن أن يؤثر في تغيير قيمة A. يتم حساب نسب F من خلال متوسط مجموع مربعات الكيان والمجموع المتوسط لمربعات القيم المتبقية. يتم حساب متوسط مجموع المربعات بقسمة متوسط مجموع المربعات على درجة الحرية. درجة الحرية هي عدد الحالات المحتملة للمتغير الاسمي ، ناقص واحد.
يعتمد F الحرج على قيم الأهمية. يتم حساب نسب F يدويًا من خلال العملية الموضحة أعلاه. تعتمد صحة الفرضية على قيم نسب F و F حرجة. فيما يلي الحالات:
· إذا كانت النسبة F الحرجة> F ، فإن الفرضية صحيحة ، ولا توجد علاقة بين المتغيرات تحت الملاحظة
· إذا كانت نسبة F الحرجة <F ، فيمكن اعتبار الفرضية غير صالحة ، وهذا بدوره يدعم فكرة أن المتغيرات تؤثر على بعضها البعض.
اقرأ: أفضل 10 وظائف مدفوعة في علوم البيانات في الهند
الفرق بين الاتجاه الواحد وذات الاتجاهين
كما ذكرنا ، هنا ، نناقش مفهوم Anova ثنائي العامل مع النسخ المتماثل . ولكن ما هو الفرق بالضبط بين العامل الواحد والعامل الثاني؟ يتعامل عامل Anova الأحادي مع متغير اسمي واحد فقط (متغير يحتوي على فئتين أو أكثر من الفئات أو الفئات ، ولكن ترتيب الفئات ليس بالغ الأهمية. على سبيل المثال ، الجنس هو متغير اسمي مع فئتي الذكور والإناث).
تعلم دورات شهادة علوم البيانات من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.
ومع ذلك ، فإن Anova ثنائي المعامل يتعامل مع متغيرين اسميين. نظرًا لأن المتغيرات أقل ، فهناك أيضًا تغيير في عدد الفرضية الصفرية في كلا نوعي التحليل. الفرضيات في اتجاهين Anova هي كما يلي:
· وسائل الملاحظة من خلال متغير واحد هي نفسها. بمعنى ، المتغير الأول لا يؤثر على القيمة المستهدفة بأي شكل من الأشكال.
· وسيلة الملاحظة بالمتغير الآخر واحدة. بمعنى ، لا يؤثر المتغير الثاني على القيمة المستهدفة بأي شكل من الأشكال.
· لا يوجد تفاعل بين المتغير الأول والمتغير الثاني.
في Anova أحادي الاتجاه ، توجد فرضية فارغة وفرضية بديلة. أولاً ، الوسيلة بالمتغير هي نفسها ، وثانيًا ، الوسيلة بالمتغير الآخر هي نفسها.
لفهم أكثر وضوحا ، دعونا نأخذ مساعدة من مثال.
مثال 1
SID | ضوضاء عالية | SID | ضوضاء متوسطة | SID | انخفاض مستوى الضجيج |
S1 | 23 | S5 | 23 | S9 | 39 |
ق 2 | 45 | S6 | 64 | S10 | 43 |
S3 | 34 | S7 | 73 | S11 | 26 |
4 س | 46 | S8 | 48 | S12 | 11 |
يوضح الجدول علامات الطلاب المختلفين في وجود مجموعة مختلفة من الضوضاء. في anova أحادي الاتجاه ، يوجد متغير اسمي واحد فقط. هنا ، المتغير الاسمي هو الضوضاء. لذلك ، ستحاول الفرضية التحقق مما إذا كان للضوضاء تأثير كبير على علامات الطلاب أم لا.

لنأخذ طاولة أخرى:
طالب علم | ضوضاء عالية | ضوضاء متوسطة | انخفاض مستوى الضجيج |
ذكر | 13 | 24 | 29 |
12 | 23 | 45 | |
11 | 32 | 33 | |
4 | 11 | 33 | |
أنثى | 16 | 17 | 56 |
12 | 24 | 34 | |
8 | 23 | 23 | |
3 | 29 | 67 |
الآن في هذا الجدول ، يتم عرض العلامات مع فئات الطلاب. ومن ثم ، لدينا متغيرين اسميين ، جنس الطالب ومستوى الضوضاء. هنا ، يمكن أن يكون هناك تحليل عاملين ، والذي سيتم إجراؤه باستخدام ثلاث فرضيات.
ولكن الآن ما هو المقصود بالتحديد بـ Anova ثنائي العامل مع النسخ المتماثل ؟
اقرأ أيضًا: أفكار مشروع علوم البيانات
الفرق بين مع تكرار وبدون تكرار
يتمثل الاختلاف الأساسي بين Anova ثنائي العامل مع النسخ المتماثل وبدون النسخ المتماثل في أن حجم العينة مختلف. في تقنية النسخ المتماثل ، يكون العدد الإجمالي للعينات موحدًا في الغالب. إذا كان الأمر كذلك ، يتم حساب الوسائل بشكل مستقل. يُعرف هذا النوع من البيانات أيضًا باسم البيانات المتوازنة. ولكن إذا كان حجم العينة غير موحد ، فإن التحليل صعب. من الأفضل توحيد حجم العينة للحصول على نتائج أسرع.
في التقنية بدون تكرار ، يكون حجم ملاحظة العينة واحدًا. هذا يعني أنه لا توجد سوى ملاحظة واحدة لكل مجموعة من المتغيرات الاسمية. هنا ، يمكن إجراء التحليل باستخدام وسائل كل من المتغيرات وكذلك المتوسط الكلي للنظر في كل ملاحظة على أنها مجموعة واحدة. يمكن بعد ذلك حساب نسبة F بالمتوسط المتبقي والمتوسط الإجمالي.
تحقق من: أفضل 12 مكتبة Python لعلوم البيانات
خاتمة
إذن ، هذه هي الطريقة التي يعمل بها Anova ذو العاملين الثنائي مع النسخ المتماثل . هناك العديد من هذه المفاهيم في الإحصاء حيث يبدو الحساب صعبًا ، لكن الأمور تصبح أبسط إذا كان هناك وضوح مفاهيمي. ناقشنا ما هو المقصود بـ Anova ، والمفهوم ، و Anova ثنائي الاتجاه ، ومعايير النسخ المتماثل. نأمل أن يكون المقال قد قدم تفاصيل كافية حول أساليب العمل الثنائية لـ Anova مع النسخ المتماثل لتجربتها بنفسك.
إذا كنت مهتمًا بالتعرف على علوم البيانات ، فراجع برنامج IIIT-B & upGrad التنفيذي PG في علوم البيانات الذي تم إنشاؤه للمهنيين العاملين ويقدم أكثر من 10 دراسات حالة ومشاريع ، وورش عمل عملية عملية ، وإرشاد مع خبراء الصناعة ، 1 - في 1 مع موجهين في الصناعة ، أكثر من 400 ساعة من التعلم والمساعدة في العمل مع الشركات الكبرى.
هل اختبار t هو نفسه اختبار Anova؟
يفحص اختبار t ما إذا كانت مجموعتان مختلفتان إحصائيًا ، بينما يختبر Anova ما إذا كانت ثلاثة أو أكثر من المجموعات السكانية مختلفة إحصائيًا. لمقارنة وسائل مجموعتين ، يتم استخدام اختبار t ، ولكن يتم استخدام Anova عند مقارنة وسائل ثلاث مجموعات أو أكثر. في Anova ، تتمثل الخطوة الأولى في إيجاد قيمة P مشتركة. تشير قيمة P الهامة في اختبار Anova إلى أن متوسط الفرق بين زوج واحد على الأقل كان ذا دلالة إحصائية.
في Anova ، كيف تقبل أو ترفض فرضية العدم؟
التفسير النموذجي هو أن البيانات ذات دلالة إحصائية عندما تكون القيمة p أقل من مستوى الأهمية ، وأنت ترفض H 0. عندما تكون هناك معلومات كافية لتحديد أنه ليست كل الوسائل متساوية ، فقد نرفض فرضية العدم في اتجاه واحد Anova.
في Anova ، كيف تفسر قيمة F؟
تكمن أهمية F في احتمال عدم إمكانية رفض الفرضية الصفرية لنموذج الانحدار الخاص بك. بعبارة أخرى ، يشير إلى احتمال أن تكون جميع المعاملات في نتيجة الانحدار صفراً! الفرق بين قيمتين متوسطتين للمربع يكافئ النسبة F. إذا كانت الفرضية الصفرية دقيقة ، فيجب أن تكون F قريبة من 1.0 في الغالبية العظمى من الوقت. تشير نسبة F العالية إلى أن تباين متوسط المجموعة أعلى مما هو متوقع بالصدفة.