التحليل التمييزي الخطي لتعلم الآلة: ما الذي تحتاج إلى معرفته؟
نشرت: 2020-05-22أتاح التقدم التكنولوجي في السنوات الأخيرة للأجهزة المتصلة التعامل مع كميات هائلة من البيانات. ومع ذلك ، لا يزال تخزين البيانات وأمنها مصدر قلق كبير عند التعامل مع مثل هذه الكميات الضخمة من البيانات. هذا هو السبب في أنه من المهم للغاية التعامل مع البيانات بالطريقة الصحيحة. غالبًا ما تكون مهمة تستغرق وقتًا طويلاً.
هذا هو المكان الذي تظهر فيه تقنيات تقليل أبعاد البيانات ، مثل تحليل التمايز الخطي أو LDA . يمكن أن تساعدك هذه التقنيات في التعامل مع مجموعات البيانات بطريقة أفضل بكثير مع ضمان أمن وخصوصية البيانات. سينصب تركيزنا في هذه المدونة على مناقشة تقنية تقليل أبعاد بيانات التحليل الخطي التمييزي. لنبدأ بالحديث عن تقليل الأبعاد.
جدول المحتويات
ما هو تقليل الأبعاد؟
ستكون قادرًا على فهم أسلوب التحليل التمايز الخطي بشكل أفضل إذا كنت تعرف خلفية المفهوم الذي يعتمد عليه. عندما تتعامل مع بيانات متعددة الأبعاد ، فلديك بيانات بها عدد من الميزات المرتبطة ببعضها البعض. إذا قمنا برسم بيانات متعددة الأبعاد في بعدين أو ثلاثة أبعاد ، فإننا نستخدم تقنية تقليل الأبعاد.
البديل الذي يتم استخدامه أيضًا بشكل شائع كبديل لتقليل الأبعاد هو رسم البيانات باستخدام الرسوم البيانية ومخططات التبعثر والمخططات الصندوقية ، من بين أمور أخرى. يمكن استخدام هذه الرسوم البيانية للعثور على أنماط في مجموعة معينة من البيانات الأولية. ومع ذلك ، لا تقدم المخططات البيانات بطريقة يسهل فهمها لعامة الناس. أيضًا ، ستحتاج البيانات التي تحتوي على الكثير من الميزات إلى العديد من المخططات لتحديد الأنماط في مجموعة البيانات هذه.
تساعد تقنيات تقليل أبعاد البيانات ، مثل LDA ، في التغلب على هذه المخاوف باستخدام بعدين أو ثلاثة أبعاد لرسم البيانات. سيسمح لك ذلك بأن تكون أكثر وضوحًا في عرضك للبيانات ، الأمر الذي سيكون منطقيًا حتى لأولئك الأشخاص الذين ليس لديهم خلفية تقنية.
قراءة: 25 أسئلة وأجوبة مقابلة التعلم الآلي

ما هو التحليل الخطي المميز؟
إنها واحدة من أكثر تقنيات تقليل الأبعاد استخدامًا. يتم استخدامه في التعلم الآلي وكذلك التطبيقات التي لها علاقة بتصنيف الأنماط. يخدم LDA غرضًا محددًا للغاية ، وهو عرض الميزات الموجودة في مساحة عالية الأبعاد على الفضاء في بعد أقل.
يتم ذلك للتخلص من مشكلات الأبعاد الشائعة وتقليل تكاليف وموارد الأبعاد. يحمل رونالد أ فيشر الفضل في تطوير المفهوم الأصلي في عام 1936 - التحليل التمييزي لفيشر أو التمييز الخطي . في الأصل ، كان التمييز الخطي عبارة عن تقنية من فئتين. جاء الإصدار متعدد الفئات في وقت لاحق.
التحليل التمييزي الخطي هو طريقة تصنيف خاضعة للإشراف تُستخدم لإنشاء نماذج التعلم الآلي. يتم استخدام هذه النماذج القائمة على تقليل الأبعاد في التطبيق ، مثل التحليل التنبئي للتسويق والتعرف على الصور ، من بين أمور أخرى. سنناقش الطلبات بعد ذلك بقليل.
إذن ما الذي نبحث عنه بالضبط مع LDA؟ هناك مجالان تساعد تقنية تقليل الأبعاد في اكتشافهما - المعلمات التي يمكن استخدامها لشرح العلاقة بين المجموعة والكائن - نموذج مُدرب التصنيف الذي يمكن أن يساعد في فصل المجموعات. هذا هو سبب استخدام LDA على نطاق واسع لنمذجة الأصناف في مجموعات مختلفة. لذا يمكنك استخدام هذه التقنية لاستخدام فئتين أو أكثر من فئتين لتوزيع متغير.
امتدادات لتحليل التمايز الخطي
تعتبر LDA واحدة من أبسط الطرق وأكثرها فاعلية المتاحة للتصنيف. نظرًا لأن الطريقة بسيطة جدًا وسهلة الفهم ، فلدينا بعض الاختلافات بالإضافة إلى الإضافات المتاحة لها. بعض هذه تشمل:

1. التحليل التمييزي المنتظم أو RDA
يستخدم قانون التمييز العنصري لجلب التنظيم إلى تقدير التباين أو التباين المشترك. يتم ذلك لتخفيف تأثير المتغيرات على LDA.
2. التحليل المميز التربيعي أو QDA
في QDA ، تستخدم الفئات المختلفة تقدير التباين الخاص بها. في حالة زيادة عدد متغير الإدخال عن المعتاد ، تستخدم كل فئة تقدير التغاير الخاص بها.
3. تحليل مرن للتمييز أو FDA
تستخدم إدارة الغذاء والدواء الأمريكية المدخلات مع التركيبات غير الخطية. المفاتيح هي مثال جيد.
تعرف على: أفكار وموضوعات مشروع Python
تطبيقات LDA الشائعة
يجد LDA استخدامه في العديد من التطبيقات. يمكن استخدامه في أي مشكلة يمكن أن تتحول إلى مشكلة تصنيف. تشمل الأمثلة الشائعة التعرف على السرعة ، والتعرف على الوجوه ، والكيمياء ، وتصنيف بيانات المصفوفات الدقيقة ، واسترجاع الصور ، والقياسات الحيوية ، والمعلوماتية الحيوية على سبيل المثال لا الحصر. دعونا نناقش القليل من هؤلاء.
1. التعرف على الوجوه
في رؤية الكمبيوتر ، يعتبر التعرف على الوجوه أحد أكثر التطبيقات شيوعًا. يتم التعرف على الوجوه من خلال تمثيل الوجوه باستخدام كميات كبيرة من قيم البكسل. يتم استخدام LDA لتقليل عدد الميزات لإعداد أسس لاستخدام طريقة التصنيف. الأبعاد الجديدة هي مجموعات من قيم البكسل تُستخدم لإنشاء قالب.

2. تحديد هوية العميل
إذا كنت ترغب في تحديد العملاء على أساس احتمالية شرائهم لمنتج ما ، فيمكنك استخدام LDA لتجميع ميزات العميل. يمكنك تحديد واختيار تلك الميزات التي تصف مجموعة العملاء الذين يظهرون فرصًا أكبر لشراء منتج.
3. الطبية
يمكن استخدام LDA لتصنيف الأمراض إلى فئات مختلفة ، مثل شديدة أو خفيفة أو معتدلة. هناك العديد من معايير المريض التي ستدخل في تنفيذ مهمة التصنيف هذه. يسمح هذا التصنيف للأطباء بتحديد وتيرة العلاج.
اقرأ أيضًا: 15 فكرة مثيرة للاهتمام لمشروع تعلم الآلة للمبتدئين
خاتمة
LDA هي تقنية بسيطة ومفهومة جيدًا تستخدم بشكل شائع في نماذج ML التصنيف. PCA والانحدار اللوجستي من تقنيات تقليل الأبعاد الأخرى المتاحة لنا. ولكن عندما يتعلق الأمر بمشكلات التصنيف الخاصة ، يُفضل LDA على الاثنين الآخرين.
إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.
ما هو التحليل الخطي المميز؟
التحليل التمييزي الخطي (LDA) هو خوارزمية تصنيف لمعرفة الميزات الأساسية التي تعتبر جيدة للتمييز بين مجموعة من العينات من جميع المجموعات الأخرى. نتيجة لتطبيق خوارزمية LDA ، حصلنا على مجموعة ميزات جديدة يمكن استخدامها للتنبؤ بعضوية المجموعة. على سبيل المثال ، لنفترض أنك تجمع عناوين IP وتريد معرفة البلد الذي تنتمي إليه. لديك مجموعة تدريب من عينات عناوين IP ويمكنك تحديد بلد المنشأ بدقة عالية جدًا. إذا كان لديك عنوان IP جديد وتريد معرفة البلد الذي يأتي منه ، فيمكنك إعطائه لـ LDA وسيخصصه للفئة ذات الاحتمالية الأعلى.
ما هي تطبيقات تحليل التمايز الخطي؟
التحليل التمييزي الخطي (LDA) عبارة عن مجموعة من التقنيات في إطار التعلم الخاضع للإشراف. LDA هي طريقة ، حيث يمكن فصل المتغير التابع خطيًا في مساحة الميزة. يتم استخدام LDA في التسويق والتمويل ومجالات أخرى لأداء عدد من مهام التصنيف مثل تحديد سمات العملاء واكتشاف الاحتيال. على سبيل المثال ، ضع في اعتبارك أننا نريد العثور على مجموعة خطية من المتغيرات المستقلة التي تفصل بين مجموعتين من نقاط البيانات. يجد LDA مجموعة خطية من المتغيرات المستقلة التي تنتج أقصى فصل بين مجموعتي نقاط البيانات في مساحة الميزة.
ما هو تقليل الأبعاد؟
يشير تقليل الأبعاد إلى مجموعة من الأساليب لتقليل عدد المتغيرات في مجموعة البيانات. أكثر تقنيات تقليل الأبعاد شيوعًا هي تحليل المكونات الرئيسية (PCA). PCA هي تقنية تقليل الأبعاد الأكثر شيوعًا نظرًا لبساطتها وأناقتها الرياضية وخصائصها الإحصائية العالية. يتم استخدام PCA لتقليل أبعاد مجموعة البيانات من خلال تحديد المحور الذي يحتوي على أكبر قدر من التباين مع أقل عدد من الأخطاء.