Cómo funciona el aprendizaje automático: una guía fácil

Publicado: 2019-07-31

Netflix y Amazon se han vuelto bastante buenos en su juego: siempre parecen saber qué contenido o producto te gustaría ver/comprar. ¿No te encanta ver todo ya seleccionado a tu gusto y preferencia?

Si bien la mayoría de nosotros conocemos el secreto detrás del ingenioso motor de recomendación de Netflix y Amazon (¡aprendizaje automático, por supuesto!), ¿cuántos de nosotros estamos familiarizados con los mecanismos internos del aprendizaje automático?

En pocas palabras, ¿cómo funciona el aprendizaje automático ?

En esencia, Machine Learning es una técnica de análisis de datos (un subconjunto de AI) que tiene como objetivo "aprender" de la experiencia y permitir que las máquinas realicen tareas que requieren inteligencia. Los algoritmos de Machine Learning aplican métodos computacionales para extraer información y aprender directamente de los datos sin estar programados explícitamente para ello (no tener que depender de una ecuación predeterminada).

La anatomía de los sistemas de aprendizaje automático

Todos los sistemas de ML se pueden desintegrar en tres partes:

Modelo: el componente que se ocupa de las identificaciones, es decir, las predicciones.
Parámetros: se refiere a los factores utilizados por el modelo para llegar a sus decisiones (predicciones).
Aprendiz: el componente que ajusta los parámetros (y, en su conjunto, el modelo) al considerar las diferencias en las predicciones en comparación con el resultado real.

Tipos de aprendizaje automático

Ahora que está familiarizado con los componentes centrales de los sistemas ML, es hora de echar un vistazo a las diferentes formas en que "aprenden".

Aprendizaje supervisado

En el aprendizaje supervisado, se entrena explícitamente a un modelo sobre cómo asignar la entrada a la salida. Un algoritmo de aprendizaje supervisado toma un conjunto reconocido de datos de entrada junto con respuestas conocidas (salida) a esos datos y entrena el modelo para generar predicciones razonables en respuesta a nuevos datos de entrada.

El aprendizaje supervisado utiliza dos enfoques para desarrollar modelos predictivos:

Clasificación : como sugiere el nombre, esta técnica clasifica los datos de entrada en diferentes categorías etiquetándolos. Se utiliza para predecir respuestas discretas (por ejemplo, si una célula cancerosa es benigna o maligna). Las imágenes médicas, el reconocimiento de voz y la calificación crediticia son tres casos de uso populares de clasificación.
Regresión : esta técnica se utiliza para predecir respuestas continuas mediante la identificación de patrones en los datos de entrada. Por ejemplo, las fluctuaciones en la temperatura o el clima. La regresión se utiliza para pronosticar el clima, la carga de electricidad y el comercio algorítmico.

Aprendizaje sin supervisión

El enfoque de aprendizaje no supervisado utiliza datos no etiquetados y busca desentrañar los patrones ocultos dentro de ellos. Por lo tanto, la técnica extrae inferencias de conjuntos de datos que consisten en datos de entrada sin respuestas etiquetadas.

Agrupamiento : uno de los métodos de aprendizaje no supervisado más comunes, el agrupamiento es una técnica de análisis de datos exploratorios que clasifica los datos en "grupos" sin ninguna información conocida sobre las credenciales del grupo. El reconocimiento de objetos y el análisis de secuencias de genes son dos ejemplos de agrupamiento.
Reducción de dimensionalidad : la reducción de dimensionalidad limpia los datos de entrada de toda la información redundante y retiene solo las partes esenciales. Por lo tanto, los datos no solo se limpian, sino que también se reducen de tamaño, por lo que ocupan menos espacio de almacenamiento.

Cómo funciona el aprendizaje automático

Aprendizaje reforzado

El aprendizaje reforzado tiene como objetivo construir modelos autosostenidos y de autoaprendizaje que puedan aprender y mejorar a través de prueba y error. En el proceso de aprendizaje (entrenamiento), si el algoritmo puede realizar con éxito acciones específicas, se activan señales de recompensa. Las señales de recompensa funcionan como luces de guía para los algoritmos. Hay dos señales de recompensa:

Se activa una señal positiva para alentar y continuar una secuencia particular de acción.
Una señal negativa es una penalización por una acción incorrecta en particular. Exige la corrección del error antes de continuar con el proceso de formación.

El aprendizaje por refuerzo es muy utilizado en los videojuegos. También es el mecanismo detrás de los autos sin conductor.

Dentro de la función de 'aprendizaje' de los algoritmos de ML

Detrás del funcionamiento de los algoritmos de ML y cómo aprenden a través de la experiencia, hay tres principios comunes.

Aprendiendo una función

El primer paso en el proceso de aprendizaje es donde los algoritmos de ML aprenden sobre la función de destino (f) que mejor asigna la variable de entrada (X) a la variable de salida (Y). Entonces,

Y = f(X).

Aquí, la forma de la función objetivo (f) es desconocida, de ahí el modelo predictivo.

En esta fase general de aprendizaje, el algoritmo ML aprende a hacer predicciones futuras (Y) en función de las nuevas variables de entrada (X). Naturalmente, el proceso no está libre de errores. Aquí el error (e) existe independientemente de los datos de entrada (X). Entonces,

Y = f(X) + e

Dado que el error (e) puede no tener suficientes atributos para caracterizar mejor el escenario de mapeo de X a Y, se denomina error irreducible; independientemente de qué tan bueno sea el algoritmo para estimar la función objetivo (f), no puede reducir el error ( mi).

Hacer predicciones y aprender a mejorarlas

En el punto anterior, entendimos cómo un algoritmo ML aprende una función objetivo (f). Y ya sabemos que nuestro único y único objetivo aquí es encontrar la mejor manera posible de mapear Y desde X. En otras palabras, necesitamos encontrar la forma más precisa de mapear la entrada a la salida.

Habrá errores (e), sí, pero el algoritmo tiene que seguir tratando de entender qué tan lejos está de la salida deseada (Y) y cómo llegar a ella. En este proceso, ajustará continuamente los parámetros o los valores de entrada (X) para que coincidan mejor con la salida (Y). Esto continuará hasta que alcance un alto grado de semejanza y precisión con el modelo de salida deseado.

Cómo Aprender Aprendizaje Automático – Paso a Paso

El enfoque de aprendizaje 'Gradient Descent'

Puede que sea cierto que hemos tenido éxito en la creación de máquinas 'inteligentes', pero su ritmo de aprendizaje es diferente: las máquinas tienden a tomárselo con calma. Creen en el proceso de aprendizaje de "descenso de gradiente": no se da el salto de una vez, sino que se dan pequeños pasos y se desciende lentamente desde la cima (la metáfora aquí es la de escalar una montaña).

Al descender una montaña, no saltas ni corres ni te lanzas hacia abajo de una sola vez; en cambio, se toman pasos medidos y calculados para llegar al fondo con seguridad y evitar percances.

Los algoritmos de ML utilizan este enfoque: siguen ajustándose a los parámetros cambiantes (imagine el terreno accidentado e inexplorado de una montaña nuevamente) para obtener finalmente el resultado deseado.

Para concluir…

El objetivo fundamental de todos los algoritmos de Machine Learning es desarrollar un modelo predictivo que se generalice mejor a datos de entrada específicos. Dado que los algoritmos y sistemas de ML se entrenan a sí mismos a través de diferentes tipos de entradas/variables/parámetros, es imperativo tener una gran cantidad de datos. Esto es para permitir que los algoritmos de ML interactúen con diferentes tipos de datos para aprender su comportamiento y producir los resultados deseados.

¡Esperamos que con esta publicación podamos desmitificar el funcionamiento de Machine Learning para usted!

Aprendizaje automático para todos‎

Cree aplicaciones e implemente inteligencia artificial y aprendizaje automático para resolver problemas del mundo real. Obtenga un Diploma PG en Aprendizaje Automático e IA de upGrad.

Inscríbase ahora @ Actualizar