Tutorial de redes neuronales: guía paso a paso para principiantes

Publicado: 2019-11-20

En el campo del aprendizaje automático, hay muchos conceptos interesantes. Aquí, en este tutorial de redes neuronales, discutiremos uno de los conceptos fundamentales de las redes neuronales. Este artículo lo ayudará a comprender el funcionamiento de estas redes al explicar la teoría detrás de las mismas.

Después de terminar este tutorial de redes neuronales artificiales, descubrirá:

  • ¿Qué es una red neuronal?
  • ¿Cómo funciona una red neuronal?
  • ¿Cuáles son los tipos de redes neuronales?

Tabla de contenido

¿Qué son las Redes Neuronales?

Una red neuronal es un sistema diseñado para actuar como un cerebro humano. Es bastante simple pero frecuente en nuestra vida cotidiana.

Una definición compleja sería que una red neuronal es un modelo computacional que tiene una arquitectura de red. Esta arquitectura está formada por neuronas artificiales. Esta estructura tiene parámetros específicos a través de los cuales uno puede modificarla para realizar ciertas tareas.

Tienen amplias propiedades de aproximación. Esto significa que pueden aproximar una función a cualquier nivel de precisión, independientemente de su dimensión. Las redes neuronales encuentran amplias aplicaciones en áreas donde las computadoras tradicionales no funcionan demasiado bien. Desde Siri hasta Google Maps, las redes neuronales están presentes en todos los lugares donde se utiliza la Inteligencia Artificial.

Son una parte vital de las operaciones de inteligencia artificial. Las redes neuronales se inspiran en el cerebro humano, por lo que su estructura también es similar.

¿Cómo funciona una red neuronal?

Una red neuronal tiene muchas capas. Cada capa realiza una función específica, y cuanto más compleja es la red, más capas hay. Es por eso que una red neuronal también se denomina perceptrón multicapa.

La forma más pura de una red neuronal tiene tres capas:

  1. La capa de entrada
  2. La capa oculta
  3. La capa de salida

Como sugieren los nombres, cada una de estas capas tiene un propósito específico. Estas capas están formadas por nodos. Puede haber varias capas ocultas en una red neuronal según los requisitos. La capa de entrada recoge las señales de entrada y las transfiere a la siguiente capa. Reúne los datos del mundo exterior.

La capa oculta realiza todas las tareas de cálculo de back-end. Una red puede incluso tener cero capas ocultas. Sin embargo, una red neuronal tiene al menos una capa oculta. La capa de salida transmite el resultado final del cálculo de la capa oculta.

Al igual que otras aplicaciones de aprendizaje automático, también tendrá que entrenar una red neuronal con algunos datos de entrenamiento, antes de proporcionarle un problema en particular. Pero antes de profundizar más en cómo una red neuronal resuelve un problema, primero debe conocer el funcionamiento de las capas de perceptrón:

¿Cómo funcionan las capas de perceptrón?

Una red neuronal se compone de muchas capas de perceptrones; por eso tiene el nombre de 'perceptrón multicapa'. Estas capas también se denominan capas ocultas de capas densas. Están formados por muchos neutrones perceptrones. Son la unidad principal que trabaja en conjunto para formar una capa de perceptrón. Estas neuronas reciben información en el conjunto de entradas. Combina estas entradas numéricas con un sesgo y un grupo de pesos, que luego produce una salida única.

Para el cálculo, cada neurona considera pesos y sesgos. Luego, la función de combinación usa el peso y el sesgo para dar una salida (entrada modificada). Funciona a través de la siguiente ecuación:

combinación = sesgo + ponderaciones * entradas

Después de esto, la función de activación produce la salida con la siguiente ecuación:

salida = activación (combinación)

Esta función determina qué tipo de rol realiza la red neuronal. Forman las capas de la red. Las siguientes son las funciones de activación predominantes:

La función lineal

En esta función la salida es solo la combinación de la neurona:

activación = combinación

La función tangente hiperbólica

Es la función de activación más popular entre las redes neuronales. Es una función sigmoidea y se encuentra entre -1 y +1:

activación = tanh(combinación)

La función logística

La función logística es bastante similar a la función tangente hiperbólica porque también es una especie de función sigmoidea. Sin embargo, es diferente porque se encuentra entre 0 y 1:

activación = 1 1 + e -combinación

La función de unidad lineal rectificada

Al igual que la función tangente hiperbólica, también prevalece la función de unidad lineal rectificada. Otro nombre para la función de unidad lineal rectificada es ReLU. ReLU es igual a la combinación cuando es igual o mayor que cero, y es negativa si la combinación es menor que (negativo) cero.

Entonces, ¿cómo funciona exactamente una red neuronal?

Ahora que sabe qué hay detrás de una red neuronal y cómo funciona, podemos centrarnos en el funcionamiento de una red neuronal.

Así es como funciona:

  1. La información se introduce en la capa de entrada que la transfiere a la capa oculta
  2. Las interconexiones entre las dos capas asignan pesos a cada entrada aleatoriamente
  3. Un sesgo agregado a cada entrada después de que los pesos se multipliquen con ellos individualmente
  4. La suma ponderada se transfiere a la función de activación.
  5. La función de activación determina qué nodos debe activar para la extracción de características.
  6. El modelo aplica una función de aplicación a la capa de salida para entregar la salida
  7. Los pesos se ajustan y la salida se propaga hacia atrás para minimizar el error

El modelo utiliza una función de costo para reducir la tasa de error. Tendrás que cambiar los pesos con diferentes modelos de entrenamiento.

  1. El modelo compara la salida con el resultado original.
  2. Repite el proceso para mejorar la precisión.

El modelo ajusta los pesos en cada iteración para mejorar la precisión de la salida.

Únase al curso de inteligencia artificial en línea de las mejores universidades del mundo: maestrías, programas ejecutivos de posgrado y programa de certificado avanzado en ML e IA para acelerar su carrera.

Tipos de redes neuronales

1) Red neuronal recurrente (RNN)

En esta red, la salida de una capa se guarda y se vuelve a transferir a la entrada. De esta manera, los nodos de una capa en particular recuerdan alguna información sobre los pasos anteriores. La combinación de la capa de entrada es el producto de la suma de pesos y características. El proceso de red neuronal recurrente comienza en las capas ocultas.

Aquí, cada nodo recuerda parte de la información de su paso anterior. El modelo conserva cierta información de cada iteración, que puede usar más adelante. El sistema aprende por sí mismo cuando su resultado es erróneo. Luego usa esa información para aumentar la precisión de su predicción en la propagación hacia atrás. La aplicación más popular de RNN es la tecnología de texto a voz.

2) Red neuronal convolucional (CNN)

Esta red consta de una o varias capas convolucionales. La capa convolucional presente en esta red aplica una función convolucional en la entrada antes de transferirla a la siguiente capa. Debido a esto, la red tiene menos parámetros, pero se vuelve más profunda. Las CNN se utilizan ampliamente en el procesamiento del lenguaje natural y el reconocimiento de imágenes.

3) Red neuronal de función de base radial (RBFNN)

Esta red neuronal utiliza una función de base radial. Esta función considera la distancia de un punto al centro. Estas redes constan de dos capas. La capa oculta combina las características con la función de base radial y transfiere la salida a la siguiente capa.

La siguiente capa realiza lo mismo mientras usa la salida de la capa anterior. Las redes neuronales de función de base radial se utilizan en sistemas de potencia.

4) Red neuronal de avance (FNN)

Esta es la forma más pura de una red neuronal artificial. En esta red, los datos se mueven en una dirección, es decir, desde la capa de entrada a la capa de salida. En esta red, la capa de salida recibe la suma de los productos de las entradas y sus pesos. No hay propagación hacia atrás en esta red neuronal. Estas redes pueden tener muchas o ninguna capa oculta. Estos son más fáciles de mantener y encuentran aplicación en el reconocimiento facial.

5) Red neuronal modular

Esta red posee varias redes que funcionan de forma independiente. Todos realizan tareas específicas, pero no interactúan entre sí durante el proceso de cálculo.

De esta manera, una red neuronal modular puede realizar una tarea altamente compleja con una eficiencia mucho mayor. Estas redes son más difíciles de mantener en comparación con redes más simples (como FNN), pero también brindan resultados más rápidos para tareas complejas.

Más información sobre las redes neuronales

Eso es todo en nuestro tutorial de redes neuronales. Debes haber visto la variedad de tareas que pueden realizar estas redes. Se utilizan en casi todas las tecnologías que utilizamos a diario. Si quieres saber más sobre redes neuronales, puedes consultar nuestro catálogo de cursos sobre inteligencia artificial y aprendizaje automático.

Puede consultar nuestro programa Executive PG en aprendizaje automático e IA , que ofrece talleres prácticos, mentor individual de la industria, 12 estudios de casos y asignaciones, estado de exalumno de IIIT-B y más.

¿Cómo funciona una red neuronal?

La capa de entrada recibe los datos y los pasa a la capa oculta. Los pesos se asignan a cada entrada al azar por los vínculos entre las dos capas. Después de que los pesos se multiplican con ellos individualmente, se aplica un sesgo a cada entrada. A la función de activación se le pasa el total ponderado. Para la extracción de funciones, la función de activación decide qué nodos deben activarse. Para entregar la salida, el modelo utiliza una función de aplicación en la capa de salida. Para reducir el error, se modifican los pesos y la salida se propaga hacia atrás.

¿Qué es una red neuronal recurrente?

La salida de una capa se almacena y se envía de vuelta a la entrada en esta red. Como resultado, los nodos de una capa específica retienen información sobre acciones anteriores. El total de pesos y características determina la combinación de la capa de entrada. Las capas ocultas son donde comienza el proceso basado en rnn. Cada nodo aquí recuerda parte de la información de la etapa anterior. El modelo guarda algunos datos de cada iteración para que pueda usarse más adelante. Cuando el resultado del sistema es incorrecto, aprende por sí mismo. Luego usa ese conocimiento para optimizar la precisión de su pronóstico de propagación hacia atrás. La tecnología de texto a voz es la aplicación más común de RNN.

¿Cómo funciona el perceptrón multicapa?

El nombre 'perceptrón multicapa' proviene del hecho de que una red neuronal se compone de múltiples capas de perceptrón. Estas capas también se conocen como capas densas con capas ocultas. Están compuestos por un gran número de neutrones perceptrones. Son los bloques de construcción básicos que componen una capa de perceptrón. La información en la colección de entradas llega a estas neuronas. Estas entradas numéricas se combinan con un sesgo y un grupo de pesos para producir una salida única.