¿Qué es una red neuronal bayesiana? Antecedentes, idea básica y función

Publicado: 2020-12-23

Tabla de contenido

Introducción

Este artículo trata sobre el concepto fundamental de Redes Neuronales Bayesianas. Este concepto particular de las redes neuronales bayesianas entra en juego cuando se introducen datos invisibles en la red neuronal, lo que genera incertidumbre.

La medida de esta incertidumbre en la predicción, que falta en las Neural Network Architectures, es lo que explica Bayesian Neural Nets. Aborda el sobreajuste, pero también ayuda en las funciones adicionales, como la estimación de la incertidumbre y la distribución de probabilidad. También se ha explicado el concepto de Redes Neuronales.

Leer: Tipos de aprendizaje supervisado

Antecedentes de la red neuronal bayesiana

Al comparar uno de los sistemas de inteligencia artificial con mejor rendimiento de los últimos diez años, todas estas máquinas tienen una cosa en común: incorporan una técnica sofisticada llamada aprendizaje profundo.

Abriendo el concepto de aprendizaje profundo, se puede observar que es un nombre que permitió un enfoque relativamente nuevo de la inteligencia artificial, llamado Redes neuronales, que han tenido una tendencia inconsistente durante aproximadamente más de 70 años. Como ejemplo, se observa que el concepto de Neural Nets se basa vagamente en el cerebro humano, que consta de millones de nodos de procesamiento conectados como una malla densa como si fueran cables entrelazados.

Las redes neuronales bayesianas, por lo tanto, tratan convenientemente el problema de las incertidumbres en los datos de entrenamiento que se alimentan de esta manera.

Idea básica de la red neuronal bayesiana

Las redes neuronales, más conocidas popularmente como redes neuronales, son una forma efectiva de aprendizaje automático, en la que la computadora aprende, analiza y realiza las tareas mediante el análisis de los ejemplos de capacitación. Los ejemplos utilizados en su mayoría están etiquetados a mano por adelantado. Por ejemplo, tome un sistema de reconocimiento de objetos.

Se da o alimenta la información relativa a imágenes rotuladas de automóviles, carros, casas, o cualquier objeto. Luego formula una inferencia lógica en el patrón visual insertado como datos que se correlacionarán consistentemente con otras etiquetas específicas.

Los arquitectos que trabajan con redes neuronales han obtenido la victoria al desglosar y aprender mapeos de entrada y salida muy complejos a partir de los datos. Sin embargo, un conocimiento básico del mismo sistema de mapeo de entrada y salida por lo general no satisface la mayoría de las situaciones, especialmente cuando existe la necesidad de integrar la creencia de un modelo particular o en circunstancias donde los datos son limitados.

Las redes neuronales bayesianas son aquellos criterios o parámetros que, en la mayoría de las circunstancias, se expresan como distribución y generalmente se aprenden a través del concepto de inferencia bayesiana, en comparación con un valor determinista. Tienen una capacidad interna para digerir la función compleja no lineal de los datos y luego expresar las incertidumbres, ambas al mismo tiempo. Por lo tanto, también los ha llevado a un papel más importante en la búsqueda de obtener y construir una IA más confiable y competente.

Debe leer: Tipos de modelos de regresión en el aprendizaje automático

¿Qué son las redes neuronales bayesianas?

Por lo tanto, Red Neural Bayesiana se refiere a la extensión de la red estándar con respecto a la inferencia anterior. Bayesian Neural Networks demuestra ser extremadamente efectivo en entornos específicos cuando la incertidumbre es alta y absoluta. Esas circunstancias son, a saber, el sistema de toma de decisiones, o con una configuración de datos relativamente más baja, o cualquier tipo de aprendizaje basado en modelos.

Las Redes Neuronales Profundas (DNN) tienden a formular una inferencia lógica con los datos dados sin tener ninguna experiencia previa con el conjunto de datos. Como resultado, funcionan excepcionalmente bien con datos que no son lineales por naturaleza y, por lo tanto, requieren una gran cantidad de datos con el único propósito de capacitación. Debido a la carga de más información, el problema del sobreajuste de superficies.

El dilema que surge en la situación actual es que las redes neuronales, como se observó anteriormente, funcionan excepcionalmente bien con los datos que se alimentan con el único propósito de entrenar, pero tenderán a tener un rendimiento inferior cuando se introduzcan datos nuevos y extraños en el sistema. Esto lleva a que los Nets estén ciegos a ciertas incertidumbres en los datos de entrenamiento en sí, lo que los lleva a tener un exceso de confianza en sus predicciones, lo que puede ser engañoso. Para acabar con errores como estos, por lo tanto, se utilizan las Redes Neuronales Bayesianas.

¿Cómo funcionan las redes neuronales bayesianas (BNN)?

El objeto principal y la idea detrás de las Redes Neuronales Bayesianas es que cada unidad está asociada con la distribución de probabilidad, que incluye los pesos y los sesgos.

Son las conocidas como variables aleatorias, las cuales estarán brindando un valor completamente diferente en cada momento en que se acceda.

Tomando un ejemplo, si X es una variable y es una variable completamente aleatoria, representa la distribución normal. Cada vez que se accede a X, se da un valor divergente de X. El proceso para obtener un valor divergente de cada vez que se recupera el valor de X, se denomina Muestreo. El valor que se deriva de cada muestra depende de la distribución de probabilidad.

A medida que aumenta el ámbito de la distribución de probabilidad, la incertidumbre es directamente proporcional; como resultado, también sube. Por lo general, en una red neuronal, cada capa tendrá pesos fijos, con los sesgos que generalmente dan cuenta de la salida. Una red bayesiana, por otro lado, tendrá la distribución de probabilidad que se adjuntará a la capa misma.

Se realiza un pase hacia adelante múltiple cada vez, con un nuevo conjunto de pesos y sesgos. Por lo tanto, se utiliza para tratar el tema de la clasificación. La salida se proporciona para cada pase realizado hacia adelante. Los datos cargados como una imagen de entrada es lo que conduce a una mayor incertidumbre. En tal caso, es una imagen que la red no ha encontrado antes para las clases de salida.

Conclusión

Es seguro concluir que las redes neuronales bayesianas son una bendición cuando se trata de integrar y lidiar con incertidumbres. También se han manifestado para mejorar el rendimiento de las predicciones.

Los principales problemas fundamentales que ocurren en el desarrollo de la red neuronal bayesiana o cualquier modelo basado en la probabilidad son los cálculos intratables de la distribución anterior y sus respectivas expectativas. Además, es excepcionalmente lúcido que el problema del sobreajuste es abordado de manera muy sólida por las Redes Bayesianas.

Si está interesado en obtener más información sobre el aprendizaje automático, consulte el Diploma PG en aprendizaje automático e IA de IIIT-B y upGrad, que está diseñado para profesionales que trabajan y ofrece más de 450 horas de capacitación rigurosa, más de 30 estudios de casos y asignaciones, IIIT- B Estado de exalumno, más de 5 proyectos prácticos finales prácticos y asistencia laboral con las mejores empresas.

¿Cómo se crea un modelo gráfico a partir de una red bayesiana?

Al vincular todos los nodos involucrados en cada componente, una red bayesiana puede convertirse en un modelo gráfico no dirigido. Esto requiere la unión de los padres de cada nodo. Un gráfico moral es un gráfico no dirigido que corresponde a una red bayesiana específica. Calcular el gráfico moral es la primera etapa en muchas técnicas computacionales de redes bayesianas.

¿Cuál es la relación entre una red bayesiana y la probabilidad?

Una red bayesiana se crea utilizando un gráfico dirigido acíclico. Una red neuronal bayesiana es un modelo de probabilidad que se factoriza aplicando una única distribución de probabilidad condicional para cada variable del modelo dado. La distribución se basa en los padres del gráfico. Las variables en el gráfico que están separadas siguen siendo independientes, pero la separación gráfica básica del gráfico no dirigido se sustituye por la separación d más difícil, que tiene en cuenta la influencia de explicaciones contrapuestas para los valores observados.

¿Mencione alguna suposición que hagan las redes bayesianas?

Cuando se nos proporciona la clasificación objetivo, una suposición crítica para los clasificadores bayesianos ingenuos es que todos los valores de las variables son condicionalmente independientes. Esta suposición ayuda mucho a simplificar los cálculos de la función objetivo en términos de probabilidad posterior. Sin embargo, para algunas aplicaciones, como documentos de texto y señales de voz, esta suposición puede no ser correcta. Las redes de creencias bayesianas pueden ser una opción útil en este escenario. Emplean un conjunto de probabilidades condicionalmente independientes en lugar de imponer todos los valores posibles a todas las variables.