O que é Aprendizado Profundo Geométrico?

Publicados: 2020-12-22

Os algoritmos de aprendizado profundo como Redes Neurais Recorrentes (RNN) e Redes Neurais Convolucionais (CNN) fizeram um trabalho significativo na resolução de problemas de vários campos, como reconhecimento de fala, visão computacional e muito mais nos últimos anos. Embora os resultados tenham grande precisão, trabalhou principalmente em dados euclidianos.

Mas quando se trata de Ciência de Redes, Física, Biologia, Computação Gráfica e Sistemas de Recomendação, temos que lidar com dados não euclidianos, ou seja, variedades e gráficos. O Deep Learning Geométrico lida com esses dados não euclidianos com um senso de técnicas de aprendizado profundo como um todo para os dados estruturados em grafos ou manifolds.

Índice

O que é Aprendizado Geométrico Profundo?

Nos últimos anos, vimos avanços significativos no campo de aprendizado profundo e aprendizado de máquina. O poder do computador está crescendo rapidamente, e os dados disponíveis são combinados com os algoritmos que foram desenvolvidos em 1980 – 1990 para suas novas aplicações.

Se há uma área que muito se beneficiou com esse desenvolvimento seria a Aprendizagem de Representação. O aprendizado de representação faz parte do aprendizado supervisionado e também é chamado de aprendizado de recursos. O aprendizado de recursos substitui diretamente a Engenharia de Recursos em muitos aplicativos. Para sua informação, a engenharia de recursos é um campo que lida com o desenvolvimento de descritores e recursos para execução em outras tarefas de aprendizado de máquina.

Um dos melhores exemplos é o uso de Redes Neurais Convolucionais (CNN) para detecção de objetos, classificação de imagens e obtenção de grande precisão, estabelecendo uma referência para os outros algoritmos convencionais. A ImageNet realizou uma competição em 2012 e superou um SOTA substancialmente baseado em Engenharia de Recursos.

Vamos agora entender o campo que tem uma origem semelhante e um futuro florescente, o aprendizado geométrico profundo.

O termo aprendizagem profunda geométrica foi denominado pela primeira vez por Bronstein et al. em seu artigo publicado em 2017, o título do artigo era “Aprendizagem profunda geométrica: indo além dos dados euclidianos”.

É um título forte que diz que o deep learning geométrico é capaz de empregar o deep learning mesmo em dados não euclidianos. Dados não euclidianos são um conjunto de dados que não cabem em um espaço bidimensional.

Normalmente, uma especialização gráfica ou uma malha muito extensa no campo da computação gráfica para visualizar os dados não euclidianos.

A figura à esquerda indica a distância geodésica e à direita a distância euclidiana. A malha na figura acima é o rosto de uma pessoa. Agora, através da malha, a distância de superfície mais curta é a distância geodésica entre dois pontos de referência. Enquanto a distância calculada entre dois pontos de referência usando uma linha reta é a distância euclidiana.

A distância geodésica é a principal vantagem de representar qualquer malha de forma não euclidiana, pois é mais conseqüente para as tarefas executadas nela. Não é que não possamos converter os dados não euclidianos em dados euclidianos inerentemente, mas o que acontece é que há um alto custo em perder o desempenho e a eficiência.

Um exemplo primordial e importante de dados não euclidianos seria um gráfico. Um grafo é uma estrutura de dados que consiste em entidades ou nós que estão conectados aos relacionamentos ou arestas. Um gráfico pode ser usado para modelar quase tudo e qualquer coisa.

Bem, você não precisa entender a Teoria dos Grafos, você só precisa ler um pouco sobre ela para poder usar as bibliotecas de software necessárias no processo. Você deve ter um conhecimento básico claro de aprendizagem geométrica profunda para uma excelente introdução ao gráfico e sua teoria fundamental.

Para que os dados sejam usados para resolver o problema com base em deep learning geométrico, se você já reconhece as instâncias alcançáveis com base nos dados que você precisa descartar, ou vice-versa; então é um cenário de melhor caso.

Leia: Rede neural convulacional

Raciocínio Estatístico

O que queremos entender é o que diferencia o raciocínio indutivo e o raciocínio dedutivo. Quando se trata de raciocínio dedutivo, os termos gerais são usados para chegar a uma conclusão específica ou para fazer uma afirmação específica. Vamos combinar essas duas afirmações para formar um exemplo.

“Todas as meninas pontuaram 10/10 no teste” e “Taylor é uma menina” eventualmente significa que “Taylor marcou 10/10 no teste”. O raciocínio indutivo é vice-versa; aqui, uma ideia geral ou conclusão é extraída de termos particulares. Tomemos um exemplo para visualizar o raciocínio. Responda a esta pergunta:

Qual vaca produz apenas leite longa vida (UHT)? Se você disser “nenhum”, você está entre os 21% dos jovens entrevistados. 5% dos jovens entrevistados marcaram “vacas leiteiras”, 10% marcaram “todas”, 2% deles fizeram fila para “vacas fêmeas” e “vacas pretas e brancas”, e 50% deles não responderam.

Leia também: Rede Neural Recorrente

Há muito a ser analisado a partir deste resultado, mas vamos considerar o pensamento das vacas Milka. Vamos entender a conclusão em forma de raciocínio indutivo com o ponto de vista do jovem. Em primeiro lugar, “vaca leiteira é uma raça especial”, “leite UHT é especial”, o que eventualmente leva a “leite UHT é produzido por uma vaca leiteira”.

O que podemos resumir disso? O viés indutivo ou raciocínio indutivo é um conjunto de suposições do aprendiz, o que é suficiente para explicar sua interferência indutiva e dedutiva. É preciso ter muito cuidado ao projetar os algoritmos de viés indutivo. Pode-se usar a interferência indutiva para alcançar os resultados que são equivalentes às inferências dedutivas.

Fato interessante: Do corpus matemático na maior ciência da computação, se há algum assunto que é famoso por ser considerado um assunto difícil é a Teoria dos Grafos em matemática discreta.

No entanto, a teoria dos grafos nos permite realizar algumas tarefas interessantes e fornecer insights incríveis com aprendizado profundo.

Segmentação de gráfico

A segmentação de grafos é um processo de classificação de um e de todos os componentes de um grafo como nós (entidades), arestas (relacionamentos). Pense em carros autônomos que precisam ter seu ambiente monitorado após um intervalo regular e preveja o que eles fariam pelos pedestres.

Normalmente, os pedestres humanos são representados como enormes caixas delimitadoras em três dimensões ou como mais graus de esqueletos de movimento. Com uma segmentação semântica tridimensional mais rápida e melhor, os carros autônomos teriam cada vez mais algoritmos que viabilizam a percepção.

Classificação do gráfico

Na classificação de grafos, o algoritmo obtém um gráfico ou subgrafo como entrada e interpreta uma saída de n classes que são especificadas com um valor de certeza combinado com a previsão. É equivalente à classificação de imagens cuja rede empregada possui duas partes principais.

A primeira parte importante é o extrator de recursos que cria uma representação óptica dos dados de entrada. Em seguida, para restringir a regressão de saída a uma dimensionalidade específica, são usadas camadas totalmente conectadas. Por outro lado, uma camada softmax é necessária para classificação multiclasse.

Deve ler : Métodos passo a passo para construir seu próprio sistema de IA hoje

A linha de fundo

Entendemos o Deep Learning Geométrico em profundidade, colocando-o no contexto geral do Deep Learning. Podemos concluir que o deep learning geométrico lida com dados irregulares como um todo, e aprendemos sobre gráficos ilustrando o quão promissor é seu papel nos vieses de aprendizado.

Se você estiver interessado em aprender mais sobre técnicas de aprendizado profundo, aprendizado de máquina, confira o Diploma PG do IIIT-B e do upGrad em aprendizado de máquina e IA, projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, status de ex-alunos do IIIT-B, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.

Lidere a revolução tecnológica orientada por IA

DIPLOMA PG EM APRENDIZAGEM DE MÁQUINA E INTELIGÊNCIA ARTIFICIAL

Saber mais