Principales tipos de modelos de aprendizaje profundo que los ingenieros de IA deberían aprender en 2022

Publicado: 2021-01-01

Tabla de contenido

Introducción

Deep Learning es una técnica de aprendizaje automático que aprovecha diferentes capas de procesamiento de información no lineal para la transformación supervisada y no supervisada, la extracción de características, la clasificación y el análisis de patrones.

Cuando se trata de procesamiento de información de manera no lineal, consta de diferentes capas jerárquicas. Aquí, algunos conceptos de bajo nivel son capaces de definir conceptos de nivel superior. El aprendizaje supervisado es una forma de aprendizaje automático, un conjunto de entrenamiento, y un conjunto de ejemplos se envían como entrada en el sistema durante la fase de entrenamiento.

Como cada entrada está etiquetada con un valor de salida, el sistema conoce la salida cuando se proporciona un conjunto de entradas. Por otro lado, en el aprendizaje no supervisado, las entradas no están etiquetadas con la clase a la que pertenece. Por lo tanto, depende del sistema desarrollar y organizar los datos buscando características comunes y haciendo los cambios necesarios basados en el conocimiento interno.

Las redes neuronales artificiales son superficiales. Por lo tanto, no pueden manejar datos complejos como los que se encuentran en aplicaciones cotidianas como imágenes, voz natural, recuperación de información y aplicaciones de procesamiento de información similares a las humanas. Para este tipo de aplicaciones, los modelos de aprendizaje profundo son perfectos. Con la ayuda del aprendizaje profundo, es posible clasificar, reconocer y categorizar patrones de datos para una máquina con menos esfuerzo.

Artículo relacionado: Principales técnicas de aprendizaje profundo

Tipos de modelos de aprendizaje profundo

Los modelos de aprendizaje profundo han ido evolucionando y la mayoría de ellos se basan en redes neuronales artificiales. La más importante de ellas son las redes neuronales convolucionales (CNN). También incluye variables latentes y fórmulas proposicionales organizadas por capas en modelos generativos profundos.

Codificadores automáticos

Es una red neuronal artificial, que puede aprender de diferentes patrones de codificación. Un codificador automático es similar a un perceptrón multicapa que tiene una capa de entrada, una capa oculta o una capa de salida en su forma más simple. La capa de salida posee el mismo número de nodos que una capa de salida. No predice valores objetivo en función del vector de salida; en cambio, el Autoencoder puede predecir su entrada. Este mecanismo de aprendizaje se puede resumir de la siguiente manera:

Para cada entrada x,

Calcule la activación dejando pasar un feedforward en cada capa oculta y capas de salida
Hacer uso de funciones de error apropiadas para detectar la desviación entre los valores calculados
Actualice los pesos propagando hacia atrás el error
Siga repitiendo la tarea hasta que genere un resultado satisfactorio

Si la capa oculta tiene menos nodos que los nodos de entrada y salida, la activación de la última capa oculta se considera como una representación comprimida de las entradas. Si los nodos de la capa oculta son más numerosos, un codificador automático aprenderá la función de identidad y resultará inútil en la mayoría de los casos.

Red de creencias profundas

Proporciona una solución para manejar mínimos locales y funciones objetivo no convexas que poseen un perceptrón multicapa típico. Puede considerarlo como un tipo alternativo de aprendizaje profundo que consta de múltiples capas de variables latentes interconectadas con otras capas. Es una versión restringida de las máquinas Boltzmann.

Aquí, las capas ocultas de cada subred servirán como capa de entrada visible para la capa adyacente de la red. Por lo tanto, convierte a la capa visible más baja en un conjunto de entrenamiento para la capa adyacente de la red. Por lo tanto, cada capa de la red se puede entrenar con avidez e independientemente. Cada capa de la estructura profunda utiliza variables ocultas como variables observadas para entrenar cada capa de la estructura profunda. El algoritmo para entrenar una red de creencias profundas es el siguiente:

Tener en cuenta los vectores de entrada
Use el vector de entrada para entrenar una máquina Boltzmann y obtenga la matriz de peso
Use la matriz de peso para entrenar dos capas inferiores de la red
Utilice la red RBM para generar un nuevo vector de entrada a través de la activación media y el muestreo de las unidades ocultas.
Siga repitiendo el procedimiento hasta llegar a las dos capas superiores de la red.

Lea también: Aprendizaje profundo frente a redes neuronales

Redes neuronales convolucionales (CNN)

Es otra variante del perceptrón multicapa basado en feedforward. Organiza las neuronas individuales de manera que respondan a todas las regiones superpuestas en el área visual. Es uno de los algoritmos de aprendizaje profundo capaz de tomar una imagen de entrada y asignar importancia a los sesgos y pesos que se pueden aprender de varios aspectos/objetos en la imagen.

Puede diferenciar uno de otro. La necesidad de preprocesamiento en CNN es bastante baja en comparación con otros algoritmos de clasificación. CNN posee la capacidad de aprender estas características y filtros.

Las CNN son una de las categorías principales para lo siguiente:

Detecciones de objetos

Clasificaciones de imágenes

Reconocimiento de imágenes

Reconocimiento facial, etc

Estas son algunas de las pocas áreas en las que CNN se puede utilizar ampliamente.

Para la clasificación de imágenes, CNN aceptará una imagen de entrada, la procesará y hará la clasificación en diferentes categorías. Las computadoras visualizan las imágenes de entrada como una matriz de píxeles y es una variable de la resolución de la imagen. Técnicamente, los modelos CNN someterán cada imagen de entrada a través de varias capas convolucionales con filtros para entrenamiento y prueba.

La primera capa se conoce como Convolución, que se asigna para extraer características de una imagen de entrada. La convolución puede preservar las relaciones entre los píxeles, ya que puede aprender las características de la imagen mediante el uso de pequeños cuadrados de datos de entrada. Ejecuta una operación matemática tomando dos entradas: una matriz de imagen y un filtro o kernel.

Cuando se proporciona una convolución de imagen con diferentes filtros, será capaz de realizar operaciones como detección de bordes, nitidez y desenfoque a través de filtros.

En los últimos años, el área de la visión artificial ha experimentado un progreso considerable. Uno de los mayores avances es CNN. Las CNN profundas han evolucionado para convertirse en las aplicaciones de visión por computadora más sofisticadas que se utilizan en el reconocimiento de gestos, autos sin conductor, etiquetado automático de amigos en imágenes publicadas en Facebook, funciones de seguridad facial y reconocimiento automático de matrículas.

Redes neuronales recurrentes

Es un tipo de red neuronal donde la salida del paso anterior se puede alimentar como entrada al paso actual. Las entradas y salidas en una red neuronal convencional son independientes entre sí. Sin embargo, en los casos en que sea necesario predecir las palabras sucesivas de una oración, será necesario recordar las palabras anteriores.

La aparición de RNN promete resolver este problema con la ayuda de una capa oculta. Una de las características clave de RNN es el estado oculto capaz de recordar alguna información en una secuencia.

RNN está equipado con una memoria que puede recordar toda la información sobre los cálculos. Puede usar los mismos parámetros para cada entrada para realizar las mismas tareas en todas las entradas o capas ocultas para producir la salida deseada. Reducirá en gran medida la complejidad de los parámetros, lo que contrasta fuertemente con otras redes neuronales.

Pensamientos finales

El cálculo de gradientes depende no solo del paso actual sino también del paso anterior. Existe una variante denominada red neuronal recurrente bidireccional que utilizan varias aplicaciones. Aquí, la red tiene en cuenta la salida anterior y futura esperada. Mediante la introducción de múltiples capas ocultas, el aprendizaje profundo se puede lograr en redes neuronales recurrentes directas de dos vías.

Si está interesado en obtener más información sobre técnicas de aprendizaje profundo , aprendizaje automático, consulte la certificación PG de IIIT-B y upGrad en aprendizaje automático y aprendizaje profundo, que está diseñada para profesionales que trabajan y ofrece más de 240 horas de capacitación rigurosa, más de 5 estudios de casos y asignaciones, estado de ex alumnos de IIIT-B y asistencia laboral con las mejores empresas.

Liderar la revolución tecnológica impulsada por la IA

DIPLOMA PG EN MACHINE LEARNING E INTELIGENCIA ARTIFICIAL

Aprende más