Análisis discriminante lineal para el aprendizaje automático: ¿Qué necesita saber?
Publicado: 2020-05-22El avance de la tecnología en los últimos años ha permitido que los dispositivos conectados manejen cantidades masivas de datos. Sin embargo, el almacenamiento y la seguridad de los datos siguen siendo grandes preocupaciones cuando se trata de cantidades tan grandes de datos. Por eso es muy importante manejar los datos de la manera correcta. A menudo puede ser una tarea que requiere mucho tiempo.
Aquí es donde entran en escena las técnicas de reducción de la dimensionalidad de los datos, como el análisis discriminante lineal o LDA . Estas técnicas pueden ayudarlo a manejar conjuntos de datos de una manera mucho mejor al tiempo que garantizan la seguridad y la privacidad de los datos. Nuestro enfoque en este blog será discutir la técnica de reducción de la dimensionalidad de los datos del análisis discriminante lineal. Comencemos hablando de la reducción de la dimensionalidad.
Tabla de contenido
¿Qué es la reducción de dimensionalidad?
Podrá comprender mejor la técnica del análisis discriminante lineal si conoce los antecedentes del concepto en el que se basa. Cuando se trata de datos multidimensionales, tiene datos que tienen una serie de características que están correlacionadas entre sí. Si graficamos datos multidimensionales en dos o tres dimensiones, estamos usando la técnica de reducción de dimensionalidad.
Una alternativa que también se utiliza con bastante frecuencia como sustituto de la reducción de la dimensionalidad es el trazado de datos mediante histogramas, diagramas de dispersión y diagramas de caja, entre otros. Estos gráficos se pueden usar para encontrar patrones en un conjunto dado de datos sin procesar. Sin embargo, los gráficos no presentan datos de una manera que sea fácil de descifrar para la gente común. Además, los datos con muchas características necesitarían varios gráficos para identificar patrones en ese conjunto de datos.
Las técnicas de reducción de la dimensionalidad de los datos, como LDA, ayudan a superar estas preocupaciones mediante el uso de dos o tres dimensiones para trazar los datos. Esto le permitirá ser más explícito en su presentación de datos, lo que tendrá sentido incluso para aquellas personas que no tienen formación técnica.
Leer: 25 preguntas y respuestas de la entrevista de aprendizaje automático

¿Qué es el análisis discriminante lineal?
Es una de las técnicas de reducción de dimensionalidad más utilizadas. Se utiliza en el aprendizaje automático, así como en aplicaciones que tienen algo que ver con la clasificación de patrones. LDA tiene un propósito muy específico, que es proyectar características que existen en un espacio de alta dimensión en un espacio de una dimensión más baja.
Esto se hace para eliminar los problemas de dimensionalidad comunes y reducir los costos y recursos dimensionales. Ronald A. Fisher tiene el crédito por el desarrollo del concepto original en 1936: el análisis discriminante de Fisher o el discriminante lineal . Originalmente, el discriminante lineal era una técnica de dos clases. La versión multiclase llegó más tarde.
El análisis discriminante lineal es un método de clasificación supervisado que se utiliza para crear modelos de aprendizaje automático. En la aplicación se utilizan estos modelos basados en la reducción de dimensionalidad, como el análisis predictivo de marketing y el reconocimiento de imágenes, entre otros. Discutiremos las aplicaciones un poco más tarde.
Entonces, ¿qué estamos buscando exactamente con LDA? Hay dos áreas en las que esta técnica de reducción de dimensionalidad ayuda a descubrir: los parámetros que se pueden usar para explicar la relación entre un grupo y un objeto; el modelo de preceptor de clasificación que puede ayudar a separar los grupos. Esta es la razón por la que LDA se usa ampliamente para modelar variedades en diferentes grupos. Entonces puede usar esta técnica para usar dos o más de dos clases para la distribución de una variable.
Extensiones al análisis discriminante lineal
LDA se considera uno de los métodos más simples y efectivos disponibles para la clasificación. Como el método es tan simple y fácil de entender, tenemos algunas variaciones y extensiones disponibles para él. Algunos de estos incluyen:
1. Análisis discriminante regularizado o RDA
RDA se utiliza para llevar la regularización a la estimación de varianza o covarianza. Esto se hace para moderar el impacto que tienen las variables en LDA.

2. Análisis cuadrático discriminante o QDA
En QDA, las diferentes clases usan su propia estimación de varianza. En caso de que el número de la variable de entrada sea mayor de lo habitual, cada clase utiliza su estimación de covarianza.
3. Análisis discriminante flexible o FDA
FDA hace uso de entradas con combinaciones no lineales. Las estrías son un buen ejemplo.
Más información sobre: Temas e ideas de proyectos de Python
Aplicaciones comunes de LDA
LDA encuentra su uso en varias aplicaciones. Se puede utilizar en cualquier problema que se pueda convertir en un problema de clasificación. Los ejemplos comunes incluyen reconocimiento de velocidad, reconocimiento facial, química, clasificación de datos de micromatrices, recuperación de imágenes, biometría y bioinformática, por nombrar algunos. Vamos a discutir algunos de estos.
1. Reconocimiento facial
En visión artificial, el reconocimiento facial se considera una de las aplicaciones más populares. El reconocimiento facial se lleva a cabo mediante la representación de rostros utilizando grandes cantidades de valores de píxeles. LDA se utiliza para reducir el número de características para preparar las bases para el uso del método de clasificación. Las nuevas dimensiones son combinaciones de valores de píxeles que se utilizan para crear una plantilla.

2. Identificación del cliente
Si desea identificar a los clientes en función de la probabilidad de que compren un producto, puede utilizar LDA para recopilar las características de los clientes. Puede identificar y elegir aquellas características que describen el grupo de clientes que muestran mayores posibilidades de comprar un producto.
3. Médico
LDA se puede utilizar para clasificar enfermedades en diferentes categorías, como grave, leve o moderada. Hay varios parámetros del paciente que se utilizarán para realizar esta tarea de clasificación. Esta clasificación permite a los médicos definir el ritmo del tratamiento.
Lea también: 15 ideas interesantes de proyectos de aprendizaje automático para principiantes
Conclusión
LDA es una técnica simple y bien entendida que se usa comúnmente en modelos de clasificación ML. PCA y la regresión logística son otras técnicas de reducción de dimensionalidad disponibles para nosotros. Pero cuando se trata de problemas de clasificación especiales, se prefiere LDA a los otros dos.
Si está interesado en obtener más información sobre el aprendizaje automático, consulte el Diploma PG en aprendizaje automático e IA de IIIT-B y upGrad, que está diseñado para profesionales que trabajan y ofrece más de 450 horas de capacitación rigurosa, más de 30 estudios de casos y asignaciones, IIIT- B Estado de exalumno, más de 5 proyectos prácticos finales prácticos y asistencia laboral con las mejores empresas.
¿Qué es el análisis discriminante lineal?
El análisis discriminante lineal (LDA) es un algoritmo de clasificación para aprender las características subyacentes que son buenas para discriminar un grupo de muestras de todos los demás grupos. Como resultado de aplicar el algoritmo LDA, obtenemos un nuevo conjunto de funciones que se puede usar para predecir la pertenencia a un grupo. Por ejemplo, supongamos que recopila direcciones IP y desea averiguar a qué país pertenecen. Tiene un conjunto de entrenamiento de direcciones IP de muestra y puede identificar el país de origen con una precisión muy alta. Si tienes una nueva dirección IP y quieres saber de qué país proviene, puedes dársela a una LDA y se la asignará a la clase con mayor probabilidad.
¿Cuáles son las aplicaciones del análisis discriminante lineal?
El análisis discriminante lineal (LDA) es un conjunto de técnicas en el marco de aprendizaje supervisado. LDA es un método, donde la variable dependiente es linealmente separable en el espacio de características. LDA se utiliza en marketing, finanzas y otras áreas para realizar una serie de tareas de clasificación, como la creación de perfiles de clientes y la detección de fraudes. Por ejemplo, considere que queremos encontrar una combinación lineal de variables independientes que separe dos grupos de puntos de datos. LDA encuentra una combinación lineal de las variables independientes que produce la separación máxima entre los dos grupos de puntos de datos en el espacio de características.
¿Qué es la Reducción de Dimensionalidad?
La reducción de dimensionalidad se refiere a una colección de técnicas para reducir el número de variables en un conjunto de datos. La técnica de reducción de dimensionalidad más común es el análisis de componentes principales (PCA). PCA es la técnica de reducción de dimensionalidad más popular debido a su simplicidad, elegancia matemática y altas propiedades estadísticas. PCA se utiliza para reducir la dimensionalidad de un conjunto de datos al identificar el eje que contiene la mayor variación junto con la menor cantidad de errores.