¿De qué se trata el aprendizaje profundo geométrico?

Publicado: 2020-12-22

Los algoritmos de aprendizaje profundo como las redes neuronales recurrentes (RNN) y las redes neuronales convolucionales (CNN) han realizado un trabajo significativo en la resolución de problemas de varios campos como el reconocimiento de voz, la visión por computadora y mucho más en los últimos años. Aunque los resultados tenían una gran precisión, funcionaba principalmente con datos euclidianos.

Pero cuando se trata de ciencia de redes, física, biología, gráficos por computadora y sistemas de recomendación, tenemos que lidiar con datos no euclidianos, es decir, variedades y gráficos. El aprendizaje profundo geométrico trata estos datos no euclidianos con un sentido de técnicas de aprendizaje profundo como un todo para los datos múltiples o estructurados en gráficos.

Tabla de contenido

¿Qué es el aprendizaje profundo geométrico?

En los últimos años, hemos visto avances significativos en el campo del aprendizaje profundo y el aprendizaje automático. El poder de la computadora está creciendo rápidamente y los datos disponibles se combinan con los algoritmos que se desarrollaron entre 1980 y 1990 para sus nuevas aplicaciones.

Si hay un área que se benefició mucho de este desarrollo sería el aprendizaje de representación. El aprendizaje de representación es una parte del aprendizaje supervisado y también se denomina aprendizaje de características. El aprendizaje de características reemplaza directamente a la ingeniería de características en muchas aplicaciones. Para su información, la ingeniería de funciones es un campo que se ocupa del desarrollo de descriptores y funciones para realizar otras tareas de aprendizaje automático.

Uno de los mejores ejemplos es el uso de redes neuronales convolucionales (CNN) para la detección de objetos, la clasificación de imágenes y lograr una gran precisión, por lo que establece un punto de referencia para los otros algoritmos convencionales. ImageNet realizó una competencia en 2012 y superó sustancialmente a una SOTA basada en la ingeniería de funciones.

Pasemos ahora a comprender el campo que tiene un origen similar y un futuro floreciente, el aprendizaje profundo geométrico.

El término aprendizaje profundo geométrico fue denominado por primera vez por Bronstein et al. en su artículo publicado en 2017, el título del artículo era "Aprendizaje profundo geométrico: ir más allá de los datos euclidianos".

Es un título fuerte que dice que el aprendizaje profundo geométrico es capaz de emplear el aprendizaje profundo incluso en datos no euclidianos. Los datos no euclidianos son un conjunto de datos que no caben en un espacio bidimensional.

Por lo general, una especialización gráfica o una malla que es muy extensa en el campo de los gráficos por computadora para visualizar los datos no euclidianos.

La figura de la izquierda indica la distancia geodésica y la de la derecha es la distancia euclidiana. La malla en la figura de arriba es la cara de una persona. Ahora, a través de la malla, la distancia superficial más corta es la distancia geodésica entre dos puntos de referencia. Mientras que la distancia calculada entre dos puntos de referencia utilizando una línea recta es la distancia euclidiana.

La distancia geodésica es la principal ventaja de representar cualquier malla en una forma no euclidiana, ya que es más importante para las tareas que se realizan en ella. No es que no podamos convertir los datos no euclidianos en datos euclidianos inherentemente, pero lo que sucede es que hay un alto costo en perder el rendimiento y la eficiencia.

Un ejemplo principal e importante de datos no euclidianos sería un gráfico. Un gráfico es una estructura de datos de este tipo que consta de entidades o nodos que están conectados a las relaciones o bordes. Un gráfico se puede utilizar para modelar casi todo y cualquier cosa.

Bueno, no necesita comprender la teoría de grafos, solo necesita leer un poco para poder usar las bibliotecas de software que se requieren en el proceso. Debe tener un conocimiento básico claro como el cristal del aprendizaje geométrico profundo para una excelente introducción al gráfico y su teoría fundamental.

Para que los datos se utilicen para resolver el problema basado en el aprendizaje profundo geométrico, si ya reconoce las instancias alcanzables en función de los datos que necesita desechar, o al contrario; entonces es el mejor de los casos.

Leer: Red neuronal convulatoria

Razonamiento Estadístico

Lo que queremos entender es en qué se diferencia el razonamiento inductivo y el razonamiento deductivo. Cuando se trata de razonamiento deductivo, los términos generales se utilizan para llegar a una conclusión específica o para hacer una afirmación en particular. Combinemos ambas afirmaciones para formar un ejemplo.

“Todas las niñas obtuvieron 10/10 en la prueba” y “Taylor es una niña” eventualmente significa que “Taylor obtuvo 10/10 en la prueba”. El razonamiento inductivo es viceversa; aquí, una idea general o conclusión se extrae de términos particulares. Tomemos un ejemplo para visualizar el razonamiento. Responde esta pregunta:

¿Qué vaca produce solo leche de larga duración (UHT)? Si dices “ninguno”, estás entre el 21% de los jóvenes entrevistados. El 5% de los jóvenes entrevistados marcó “vacas Milka”, el 10% marcó “todas”, el 2% de ellos hizo fila para “vacas hembras” y “vacas negras y blancas”, y el 50% de ellos no tuvo respuesta.

Lea también: Red neuronal recurrente

Hay mucho que analizar a partir de este resultado, pero consideremos el pensamiento de las vacas Milka. Entendamos la conclusión en forma de razonamiento inductivo con el punto de vista del joven. En primer lugar, "la vaca Milka es una raza especial", "la leche UHT es especial", lo que eventualmente conduce a "la leche UHT es producida por una vaca Milka".

¿Qué podemos resumir de esto? El sesgo inductivo o razonamiento inductivo es un conjunto de suposiciones del alumno, que es suficiente para explicar su interferencia inductiva y deductiva. Hay que tener mucho cuidado al diseñar los algoritmos de polarización inductiva. Se puede utilizar la interferencia inductiva para lograr los resultados que son equivalentes a las inferencias deductivas.

Dato interesante: del corpus matemático en informática general, si hay algún tema que se considera un tema difícil es la teoría de grafos en matemáticas discretas.

Sin embargo, la teoría de grafos nos permite realizar algunas tareas emocionantes y proporcionar información sorprendente con el aprendizaje profundo.

Segmentación de gráficos

La segmentación de gráficos es un proceso de clasificación de uno y todos los componentes de un gráfico como nodos (entidades), bordes (relaciones). Piense en los coches autónomos que necesitan que su entorno sea monitoreado después de un intervalo regular y prediga cuál sería el próximo paso de los peatones.

Por lo general, los peatones humanos se representan como enormes cuadros delimitadores en tres dimensiones o como esqueletos de más grados de movimiento. Con una segmentación semántica tridimensional mejor y más rápida, los coches autónomos tendrían cada vez más algoritmos que hacen factible la percepción.

Clasificación de gráficos

En la clasificación de gráficos, el algoritmo obtiene un gráfico o subgráfico como entrada e interpreta una salida de n clases que se especifican con un valor de certeza combinado con la predicción. Es equivalente a la clasificación de imágenes cuya red empleada tiene dos partes principales.

La primera parte importante es el extractor de características que crea una representación óptica de los datos de entrada. Luego, para restringir la regresión de salida a una dimensionalidad particular, se utilizan capas totalmente conectadas. Por otro lado, se requiere una capa softmax para la clasificación multiclase.

Debe leer : Métodos paso a paso para construir su propio sistema de inteligencia artificial hoy

La línea de fondo

Hemos entendido el Aprendizaje Profundo Geométrico en profundidad al ponerlo en el contexto general del Aprendizaje Profundo. Podemos concluir que el aprendizaje profundo geométrico trata con datos irregulares como un todo, y aprendimos sobre gráficos al ilustrar cuán prometedor es su papel en los sesgos de aprendizaje.

Si está interesado en obtener más información sobre técnicas de aprendizaje profundo, aprendizaje automático, consulte el Diploma PG en aprendizaje automático e inteligencia artificial de IIIT-B y upGrad, que está diseñado para profesionales que trabajan y ofrece más de 450 horas de capacitación rigurosa, más de 30 estudios de casos y asignaciones, estado de exalumno de IIIT-B, más de 5 proyectos prácticos finales prácticos y asistencia laboral con las mejores empresas.

Liderar la revolución tecnológica impulsada por la IA

DIPLOMA PG EN MACHINE LEARNING E INTELIGENCIA ARTIFICIAL

Aprende más