Álgebra lineal para aprendizaje automático: conceptos críticos, por qué aprender antes que ML
Publicado: 2020-04-30El aprendizaje automático, la robótica, la ciencia de datos, la inteligencia artificial y la visión por computadora se encuentran entre las áreas que han sido fundamentales para llevar nuestra tecnología al nivel en el que se encuentra ahora. A medida que comience a adquirir más conocimientos sobre estas tecnologías, se encontrará con un conjunto de jergas o palabras específicas que son comunes a estas tecnologías.
Algunos de estos términos incluyen regresión de lazo, condiciones KKT, kernel PCA, máquinas de vectores de soporte (SVM), multiplicadores de Lagrange y regresión de cresta, entre otros. Ahora, estas jergas pueden ser acuñadas solo para mantener alejados a los extraños, pero dicen mucho sobre su asociación con el álgebra lineal típica que conocemos de nuestros días en la escuela.
Por lo tanto, se vuelve imperativo para cada individuo que está aprendiendo aprendizaje automático o ciencia de datos primero llegar a un acuerdo con lo que son el álgebra lineal y la teoría de la optimización. También necesita aprender ciencia de datos y saber cómo usarlos al resolver problemas usando ML o al dar más sentido a la enorme cantidad de datos disponibles usando ciencia de datos.
En este blog, nos centraremos en cómo se relacionan el aprendizaje automático y el álgebra lineal y cómo una mejor comprensión de este último puede ayudarlo a dominar el primero.
Hay conceptos en el aprendizaje automático, como SVM y regresión, que no podrá comprender correctamente si no conoce su conexión con el álgebra lineal. Puede continuar sin profundizar en el álgebra lineal y cómo se asocia con el aprendizaje automático si solo está repasando estos conceptos para saber qué son realmente y no desea continuar con su estudio.
Sin embargo, si planea convertirse en un ingeniero de aprendizaje automático que va a entrenar máquinas en el futuro o investigar y hacer contribuciones significativas en el campo, tendrá que profundizar. No hay otra alternativa. Tener una sólida formación en álgebra lineal es imprescindible. Nuestro objetivo principal al escribir este blog es presentarle los fundamentos del álgebra lineal, asegurándonos de presentar cómo se utilizan en el aprendizaje automático. Empecemos por entender qué es exactamente el álgebra lineal.

Tabla de contenido
¿Qué es el álgebra lineal?
En palabras simples, es una rama de las matemáticas que encuentra aplicaciones significativas en la ingeniería y la ciencia. Aunque tiene tanta importancia y tiene aplicaciones que van mucho más allá de nuestra imaginación, vemos que nuestros científicos se quedan atrás cuando se trata de tener una comprensión más profunda del mismo. La razón principal detrás de esto es que no son las matemáticas discretas las que la mayoría de los científicos usan con frecuencia.
Pertenece a la parte continua de las matemáticas, lo que las hace menos interesantes para los científicos y las personas que trabajan en el campo de la tecnología. Ahora dejemos una cosa muy clara. Si ni siquiera tiene una comprensión básica de cómo funciona el álgebra lineal, le resultará muy difícil aprender y utilizar varios algoritmos de aprendizaje automático, incluidos los de aprendizaje profundo.
Cuando haya terminado con cómo funciona fundamentalmente el aprendizaje automático y cómo y dónde puede usar sus algoritmos, se le pedirá que dedique un poco más de tiempo al aprendizaje de las matemáticas. Esto lo ayudará a comprender muchas cosas nuevas sobre los algoritmos de aprendizaje automático que antes no conocía. Sabrá mucho sobre sus limitaciones, suposiciones subyacentes y demás.
Ahora se encontrará con diferentes áreas de las matemáticas que estudia en este punto para aprender a hacer más con el aprendizaje automático. Puedes estudiar geometría, álgebra, cálculo y estadística entre otros temas; sin embargo, debe ser inteligente aquí y seleccionar el área que cree que realmente lo ayudará a enriquecer su experiencia y brindarle una base más firme a medida que avanza en su carrera de aprendizaje automático. Incluso puede pedirle a los expertos que lo ayuden a tomar una decisión.
La siguiente pregunta que te estarás haciendo ahora será cómo debes llevar a cabo este proceso de aprendizaje. No puedes estudiar álgebra lineal desde cero. Tendrá que seleccionar y elegir los temas que se utilizan en el aprendizaje automático de una forma u otra. En la siguiente sección, discutiremos algunos de esos temas de álgebra lineal que puede elegir estudiar.
Saber más: Los 5 mejores modelos de aprendizaje automático explicados para principiantes
Conceptos importantes de álgebra lineal
Es muy importante tener suficiente conocimiento de algunos conceptos de álgebra lineal si busca comprender los conceptos subyacentes detrás del aprendizaje automático. Si no conoce las matemáticas detrás de estos algoritmos avanzados de aprendizaje automático, no puede desear desarrollar un dominio sobre ellos. Aquí hay algunos conceptos de álgebra lineal que necesita aprender para saber cómo funciona el aprendizaje automático.
1. Vectores y Matriz
No estará mal decir que estos dos conceptos son posiblemente los dos más importantes que necesita aprender considerando su estrecha lealtad con el aprendizaje automático. Los vectores consisten en una matriz de números, mientras que una matriz comprende vectores 2-D que generalmente se mencionan en mayúsculas.
Ahora veamos cómo están vinculados a los algoritmos de aprendizaje automático. Los vectores resultan útiles en algoritmos de aprendizaje automático supervisado donde están presentes en forma de variables objetivo. Por otro lado, las características disponibles en los datos forman la matriz. Puede realizar una serie de operaciones usando la matriz: conjugado, multiplicación, rango, transformación y otros. También se pueden usar dos vectores que tienen el mismo número de elementos y la misma forma para realizar restas y sumas.
2. Matriz simétrica
La matriz simétrica tiene importancia tanto en el álgebra lineal como en el aprendizaje automático. Las matrices de álgebra lineal se utilizan principalmente para transportar funciones. La mayoría de las veces, estas funciones son simétricas, al igual que las matrices que les corresponden. Estas funciones y los valores que contienen se pueden usar para medir la distancia de características. También se pueden usar para medir la covarianza de características. A continuación se enumeran algunas propiedades de las matrices simétricas:
- Las matrices simétricas y su inversa son ambas simétricas.
- Todos los valores en los valores propios son números reales. No hay números complejos presentes.
- Una matriz simétrica se forma cuando una matriz se multiplica por su transpuesta.
- Las matrices simétricas también tienen la propiedad de factorización.
- Para matrices que tienen columnas linealmente independientes, el resultado cuando la matriz se multiplica con su transpuesta es invertible.
3. Valores propios y vectores propios
Los vectores propios son vectores que solo cambian por un factor escalar y no hay ningún cambio en su dirección. El valor propio correspondiente a los vectores propios es la magnitud por la cual se escalan. Los valores propios y los vectores propios se encuentran en los fundamentos de las matemáticas y la computación. Cuando trazamos un vector en un gráfico XY, sigue una dirección específica. Cuando aplicamos la transformación lineal en algunos vectores, vemos que no cambian su dirección. Estos vectores son muy importantes en el aprendizaje automático.
Los valores propios y los vectores propios se utilizan para minimizar el ruido de datos. También podemos usar los dos para mejorar la eficiencia de las tareas que se sabe que son computacionalmente intensivas. También se pueden utilizar para eliminar el sobreajuste. También hay varios otros escenarios en los que los valores propios y los vectores propios resultan útiles.
Es bastante difícil visualizar las características de los datos de sonido, texto o imagen. Estos datos generalmente se representan en 3-D. Aquí es donde los valores propios y los vectores propios entran en escena. Se pueden usar para capturar toda la enorme cantidad que se almacena en una matriz. Los valores propios y los vectores propios también se utilizan en el reconocimiento facial.

Leer: Ideas de proyectos de aprendizaje automático para principiantes
4. Análisis de componentes principales (PCA)
Hay muchas ocasiones en las que la dimensionalidad dificulta las cosas a la hora de resolver ciertos problemas de aprendizaje automático. En estos problemas, estamos tratando con datos cuyas características tienen una correlación muy alta entre sí y están en una dimensión más alta de lo habitual.
El problema que surge con este problema de dimensionalidad es que se vuelve muy difícil comprender la influencia que cada característica tiene en la variable objetivo. Esto se debe a que las características con una correlación más alta de lo normal tienden a influir en el objetivo de la misma manera. También es muy difícil visualizar datos que están en una dimensión superior.
El análisis de componentes principales es la solución a estos problemas. Le ayuda a reducir su dimensión de datos a 2-D o 3-D. Esto se hace asegurando que no se pierda información debido a cambios en la varianza máxima. Las matemáticas detrás de PCA se relacionan con la ortogonalidad. PCA es el mejor método disponible para hacer que el modelo sea menos complejo al reducir la cantidad de características en el conjunto de datos.
Sin embargo, debe evitar usarlo como el paso inicial para eliminar el sobreajuste. Debe comenzar limitando la cantidad de características en los datos o aumentando la cantidad de datos. A continuación, debe intentar utilizar la regularización L1 o L2. Si nada funciona, solo entonces debe recurrir a PCA.
Lea también: Las 9 principales bibliotecas de aprendizaje automático que debe conocer
¿Por qué debería aprender álgebra lineal antes que el aprendizaje automático?
1. El álgebra lineal es la clave para sobresalir en el aprendizaje automático
No se puede negar el hecho de que el cálculo triunfa sobre el álgebra lineal cuando se trata de matemáticas avanzadas. El cálculo integral y diferencial lo ayuda mucho más que solo con integración, diferenciación y límites, también sirven como conocimiento fundamental requerido para aplicaciones, como tensores y vectores.
Aprender estas cosas te ayudará a comprender mejor las ecuaciones lineales y las funciones lineales, entre otras áreas. También conocerás conceptos avanzados, como el método Simplex y los vectores espaciales. Si necesita ayuda con la programación lineal, puede usar el método Simplex. Para mejorar en estos conceptos, empieza por dedicarle más tiempo al álgebra lineal.
2. Predicción de aprendizaje automático
Cuando aprende álgebra lineal, mejora la conciencia o el instinto que juega un papel tan importante en el aprendizaje automático. Ahora podrá proporcionar más perspectivas. Las matrices y los vectores que estudiaste te ayudarán a ampliar tu pensamiento y hacerlo más firme. Las posibilidades son infinitas. Podrías empezar a hacer cosas que a los que te rodean les resultará muy difícil entender. Puede comenzar a visualizar y configurar diferentes gráficos. Podría comenzar a usar más parámetros para diferentes componentes de aprendizaje automático.
3. El álgebra lineal ayuda a crear mejores algoritmos de aprendizaje automático
Puede utilizar su aprendizaje de álgebra lineal para crear mejores algoritmos de aprendizaje automático supervisados y no supervisados. La regresión logística, la regresión lineal, los árboles de decisión y las máquinas de vectores de soporte (SVM) son algunos algoritmos de aprendizaje supervisado que puede crear desde cero con la ayuda del álgebra lineal.
Por otro lado, también puede usarlo para algoritmos no supervisados, incluida la descomposición de valor único (SVD), la agrupación en clústeres y el análisis de componentes. El álgebra lineal lo ayudará a desarrollar una comprensión más profunda del proyecto de aprendizaje automático en el que está trabajando y, por lo tanto, le brindará la flexibilidad para personalizar diferentes parámetros. Puede obtener más información sobre la regresión lineal en el aprendizaje automático.
4. Álgebra lineal para un mejor procesamiento gráfico en aprendizaje automático
Los proyectos de aprendizaje automático le brindan diferentes interpretaciones gráficas para trabajar: imágenes, audio, video y detección de bordes. Los algoritmos de aprendizaje automático tienen clasificadores que entrenan una parte del conjunto de datos dado en función de sus categorías. Otro trabajo de los clasificadores es eliminar los errores de los datos que ya han sido entrenados.

Es en esta etapa que entra el álgebra lineal para ayudar a calcular este conjunto de datos complejo y grande. Utiliza técnicas de descomposición de matrices para procesar y manejar grandes datos para diferentes proyectos. Los métodos de descomposición de matrices más populares son la descomposición QR y LU.
5. Álgebra lineal para mejorar tu comprensión de las estadísticas
Las estadísticas son muy importantes para organizar e integrar datos en el aprendizaje automático. Si desea comprender mejor los conceptos estadísticos, primero debe saber cómo funciona el álgebra lineal. El álgebra lineal tiene métodos, operaciones y notaciones que pueden ayudar a integrar temas estadísticos avanzados como el análisis multivariante en su proyecto.
Suponga que está trabajando con datos de pacientes que incluyen peso, altura, presión arterial y frecuencia cardíaca. Estas son las múltiples variables del conjunto de datos en el que está trabajando. Supongamos aquí que un aumento de peso conducirá a un aumento de la presión arterial. No es demasiado difícil entender que se trata de una relación lineal. Entonces, para comprender mejor cómo un aumento en una variable afecta a la otra, deberá tener una buena comprensión del álgebra lineal.
Conclusión
El aprendizaje automático en sí mismo es un tema bastante amplio; sin embargo, hay otros conceptos, como el álgebra lineal, que son tan importantes de aprender como el propio ML. Aprender álgebra lineal y otros temas similares ayudará a comprender mejor los conceptos de aprendizaje automático.
Si está interesado en obtener más información sobre el aprendizaje automático, consulte el Diploma PG en aprendizaje automático e IA de IIIT-B y upGrad, que está diseñado para profesionales que trabajan y ofrece más de 450 horas de capacitación rigurosa, más de 30 estudios de casos y asignaciones, IIIT- B Estado de exalumno, más de 5 proyectos prácticos finales prácticos y asistencia laboral con las mejores empresas.
¿Qué es más importante para el aprendizaje automático: el cálculo o el álgebra lineal?
Si planea desarrollar una carrera en el aprendizaje automático, ya debe saber que los cimientos de este campo se encuentran profundamente en las matemáticas. Las matemáticas de aprendizaje automático consisten en 3 áreas clave, cálculo, álgebra lineal y estadística. Dado que el aprendizaje automático involucra muchos vectores y matrices, el álgebra lineal constituye sus partes más fundamentales. Pero luego, el cálculo también es una parte integral de ML, ya que ayuda a comprender cómo funciona el mecanismo de aprendizaje automático. Entonces, tanto el cálculo como el álgebra lineal son igualmente importantes. Sin embargo, la cantidad de ambos que debe usar depende principalmente de sus funciones y responsabilidades laborales.
¿Es el álgebra lineal más difícil de aprender que el cálculo?
El álgebra lineal se trata de estudiar líneas rectas usando ecuaciones lineales, mientras que el cálculo se trata de componentes que varían suavemente que involucran derivadas, vectores, integrales, curvas y más. Dicho esto, el álgebra lineal es mucho más fácil de aprender que incluso el cálculo básico. En álgebra lineal, si puede comprender la teoría detrás de los teoremas de álgebra lineal, puede resolver todas las preguntas relacionadas. Sin embargo, eso no es suficiente para resolver problemas de cálculo. Más que simplemente memorizar algoritmos, es decir, la parte teórica, necesita comprender los aspectos computacionales para responder preguntas computacionales en cálculo. El cálculo es la parte más desafiante de las matemáticas, mientras que el álgebra lineal es más concreta y menos abstracta; de ahora en adelante más fácil de entender.
¿Es importante la estadística en el aprendizaje automático?
Cuando se trata de aprendizaje automático, no puede dejar de lado las estadísticas. Los expertos opinan que el aprendizaje automático es estadística aplicada, por lo que es un requisito previo para aquellos que desean seguir una carrera en el aprendizaje automático. En el diseño de modelos de aprendizaje automático, los datos juegan un papel fundamentalmente vital. Se necesitan técnicas estadísticas para encontrar respuestas basadas en datos acumulados que se utilizarán para entrenar diferentes modelos de aprendizaje automático. Por lo tanto, una familiaridad básica con las estadísticas es obligatoria para el aprendizaje automático.