O que são Redes Neurais Bayesianas? Antecedentes, Ideia Básica e Função

Publicados: 2020-12-23

Índice

Introdução

Este artigo trata do conceito fundamental de Redes Neurais Bayesianas. Esse conceito específico de Redes Neurais Bayesianas entra em jogo quando dados não vistos são alimentados na rede neural, criando incerteza.

A medida dessa incerteza na previsão, que está faltando nas Arquiteturas de Redes Neurais, é o que as Redes Neurais Bayesianas explicam. Ele aborda o overfitting, mas também ajuda nos recursos adicionais, como estimativa de incerteza e distribuição de probabilidade. O conceito de Redes Neurais também foi explicado.

Leia: Tipos de Aprendizagem Supervisionada

Antecedentes da Rede Neural Bayesiana

Comparando um dos sistemas de inteligência artificial com melhor desempenho dos últimos dez anos, todas essas máquinas têm uma coisa em comum: incorporam uma técnica sofisticada chamada Deep Learning.

Abrindo o conceito de Deep Learning, pode-se observar que é um nome que permitiu uma abordagem relativamente nova à Inteligência Artificial, chamada de Redes Neurais, que estão em tendência de forma inconsistente há cerca de mais de 70 anos. Como exemplo, observa-se que o conceito de Redes Neurais é vagamente baseado no cérebro humano, que consiste em milhões de nós de processamento conectados como uma malha densa como fios entrelaçados.

As Redes Neurais Bayesianas, portanto, lidam convenientemente com a questão das incertezas nos dados de treinamento que são alimentados.

Idéia Básica da Rede Neural Bayesiana

As Redes Neurais, mais popularmente conhecidas como Redes Neurais, são uma forma eficaz de Aprendizado de Máquina, na qual o computador aprende, analisa e executa as tarefas analisando os exemplos de treinamento. Os exemplos usados ​​são principalmente rotulados à mão com antecedência. Por exemplo, tome um sistema de reconhecimento de objetos.

As informações sobre imagens rotuladas de automóveis, carros, casas ou qualquer objeto são fornecidas ou alimentadas. Em seguida, formula uma inferência lógica no padrão visual inserido como dados que devem ser consistentemente correlacionados com outros rótulos específicos.

Os arquitetos que trabalham com redes neurais foram vitoriosos em quebrar e aprender mapeamentos de entrada e saída muito intrincados dos dados. No entanto, um conhecimento básico do mesmo sistema de mapeamento de entrada e saída geralmente acaba não satisfazendo a maioria das situações, principalmente quando há necessidade de integração de crença de um determinado modelo ou em circunstâncias onde os dados são limitados.

As Redes Neurais Bayesianas são aqueles critérios ou parâmetros que na maioria das circunstâncias são expressos como distribuição e geralmente são aprendidos através do conceito de Inferência Bayesiana, em comparação com um valor determinístico. Eles têm uma capacidade interna de digerir a função complexa e não linear dos dados e, em seguida, expressar as incertezas - ambas ao mesmo tempo. Portanto, também os levou a um papel mais importante na busca de reunir e construir uma IA mais confiável e competente.

Deve ler: tipos de modelos de regressão em aprendizado de máquina

O que são redes neurais bayesianas?

Assim, Rede Neural Bayesiana refere-se à extensão da rede padrão referente à inferência anterior. As Redes Neurais Bayesianas provam ser extremamente eficazes em configurações específicas quando a incerteza é alta e absoluta. Essas circunstâncias são o sistema de tomada de decisão, ou com uma configuração de dados relativamente menor, ou qualquer tipo de aprendizado baseado em modelo.

As Deep Neural Networks (DNN) tendem a formular uma inferência lógica com os dados fornecidos sem ter nenhuma experiência prévia com o conjunto de dados. Como resultado, eles funcionam excepcionalmente bem com dados que não são lineares por natureza e, portanto, exigem uma grande quantidade de dados apenas para fins de treinamento. Devido ao carregamento de mais informações, o problema de superajuste de superfícies.

O dilema que surge na situação atual é que as redes neurais, como observado anteriormente, funcionam excepcionalmente bem com os dados que são alimentados com o único propósito de treinamento, mas tendem a ter um desempenho inferior quando dados novos e estrangeiros são alimentados no sistema. Isso leva os Nets a ficarem cegos para certas incertezas nos próprios dados de treinamento, levando-os a serem excessivamente confiantes em suas previsões, o que pode ser enganoso. Para eliminar erros como esses, as Redes Neurais Bayesianas são, portanto, usadas.

Como funcionam as redes neurais bayesianas (BNN)?

O principal objetivo e ideia por trás das Redes Neurais Bayesianas é que cada unidade está associada à distribuição de probabilidade, que inclui os pesos e os vieses.

Elas são conhecidas como variáveis ​​aleatórias, que fornecerão um valor completamente diferente a cada vez que forem acessadas.

Tomando um exemplo, se X é uma variável e é uma variável completamente aleatória, representa a distribuição normal. Cada vez que X é acessado, um valor divergente de X é dado. O processo para obter um valor divergente de cada vez que o valor de X é recuperado, é chamado de Amostragem. O valor derivado de cada amostra depende da distribuição de probabilidade.

À medida que o âmbito da distribuição de probabilidade aumenta, a incerteza é diretamente proporcional; como resultado, ela também aumenta. Normalmente em uma rede neural, cada camada deve ter pesos fixos, com os vieses que normalmente dão conta da saída. Uma Rede Bayesiana, por outro lado, terá a distribuição de probabilidade que será anexada à própria camada.

Uma passagem múltipla para frente a cada vez é executada, com um novo conjunto de pesos e vieses. É, portanto, usado para lidar com a questão da classificação. A saída é fornecida para cada passagem feita de maneira direta. Os dados carregados como uma imagem de entrada é o que leva ao aumento da incerteza. Nesse caso, é uma imagem que a rede não encontrou antes para as classes de saída.

Conclusão

É seguro concluir que as Redes Neurais Bayesianas são uma bênção quando se trata de integrar e lidar com incertezas. Eles também se manifestaram para melhorar os desempenhos de previsão.

Os principais problemas fundamentais que ocorrem no desenvolvimento da Rede Neural Bayesiana ou qualquer modelo baseado em probabilidade são os cálculos intratáveis ​​da distribuição anterior e suas respectivas expectativas. Além disso, é excepcionalmente lúcido que o problema do overfitting é tratado de forma muito robusta pelas Redes Bayesianas.

Se você estiver interessado em aprender mais sobre aprendizado de máquina, confira o PG Diploma in Machine Learning & AI do IIIT-B e upGrad, projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, IIIT- B Status de ex-aluno, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.

Como você faz um modelo gráfico de uma rede Bayesiana?

Ao ligar todos os nós envolvidos em cada componente, uma rede Bayesiana pode ser transformada em um modelo gráfico não direcionado. Isso requer a junção dos pais de cada nó. Um grafo moral é um grafo não direcionado que corresponde a uma rede Bayesiana específica. O cálculo do grafo moral é o primeiro estágio em muitas técnicas computacionais de redes bayesianas.

Qual é a relação entre uma rede Bayesiana e a probabilidade?

Uma rede Bayesiana é criada usando um grafo direcionado acíclico. Uma rede neural Bayesiana é um modelo de probabilidade que é fatorado aplicando uma única distribuição de probabilidade condicional para cada variável para o modelo dado. A distribuição é baseada nos pais no gráfico. As variáveis ​​no gráfico que são separadas ainda são independentes, mas a separação básica do gráfico não direcionado é substituída pela mais difícil separação d, que leva em consideração a influência de explicações concorrentes para os valores observados.

Mencione alguma suposição que as redes Bayesianas fazem?

Quando recebemos a classificação alvo, uma suposição crítica para classificadores Bayesianos ingênuos é que todos os valores das variáveis ​​são condicionalmente independentes. Essa suposição ajuda muito a simplificar os cálculos da função objetivo em termos de probabilidade posterior. No entanto, para algumas aplicações, como documentos de texto e sinais de fala, essa suposição pode não estar correta. As redes de crenças bayesianas podem ser uma escolha útil neste cenário. Eles empregam um conjunto de probabilidades condicionalmente independentes em vez de impor todos os valores possíveis a todas as variáveis.