Redes Bayesianas: Introdução, Exemplos e Aplicações Práticas

Publicados: 2020-02-23

Todos aqueles que já trabalharam com dados ou estatísticas sabem de uma coisa com certeza: correlação não significa necessariamente ou implica causalidade. Agora, embora isso possa parecer bastante óbvio, pode ser chocante saber que a maioria dos erros nos dados ocorre devido à confusão entre os dois termos. Isso ocorre principalmente porque, embora seja conveniente definir correlação, é quase impossível definir ou quantificar a causalidade.

De fato, Judea Pearl, autor de Causality: Models, Reasoning, and Inference , afirma no livro que os humanos concentram seus esforços matemáticos em inferências probabilísticas e estatísticas, deixando as considerações causais “à mercê da intuição e do bom senso”. Ele diz que este é um fator importante que ainda estamos muito atrasados em termos de progresso científico.

É quando as Redes Bayesianas facilitam para nós. Eles nos ajudam a distinguir correlação de causalidade, permitindo-nos ver várias causas independentes de uma só vez. Tudo isso é feito com precisão, pois os algoritmos de aprendizado de máquina não funcionam na subjetividade ou na intuição; eles trabalham com dados.

Vejamos um exemplo para entender como as Redes Bayesianas operam.

Índice

Exemplo de Redes Bayesianas

Por causa deste exemplo, vamos supor que o mundo seja atingido por uma doença extremamente rara, mas fatal; diga que há uma chance de 1 em 1000 de você estar infectado pela doença.

Agora, para descobrir se alguém está sofrendo da doença, os médicos desenvolvem um teste. O problema é que é apenas 99% preciso.

Como você vai saber com certeza se você tem a doença ou não? Fazer outro teste afetará os resultados?

Vamos ver o que acontece quando você conduz…

Teste 1

Como a doença afeta apenas 1 em 1000, a probabilidade de você ser infectado é:

Infetado	0,001
Livre	0,999

Doença CPT (Tabela de Probabilidade Condicional)

Claramente, assim como 1 em 1.000 tem chance de sofrer da doença, 999 em 1.000 estão livres dela.

Da mesma forma, criaremos uma tabela para calcular a probabilidade do teste. Como mencionado anteriormente, se o teste for apenas 99% preciso. Isso significa que há apenas 99% de chance de que o resultado seja verdadeiro. Semelhante é o caso com resultados negativos.

Presença de vírus	Infetado	Livre
Teste 1 (positivo)	0,99	0,01
Teste 1 (Negativo)	0,01	0,99

Teste1 CPT (Tabela de Probabilidade Condicional)

Agora, vamos traçar um gráfico para ver como a presença da doença é afetada pelos resultados do teste.

Preencher essas células com os resultados do teste me dará o seguinte resultado.

Origem da imagem

Como você pode ver, se o teste for positivo, há apenas 9% de chance de você estar sofrendo da doença.

Agora, como chegamos a esse número?

Teorema de Bayes!

Origem da imagem

Em nosso exemplo,

P(H|E) = P(H) x P(E|H) / P(E)

P(H|E) = P(H) x P(E|H) / {P(E|H) x P(H) + P(E|Hc) x P(Ec)}
P(H|E) = (0,99 x 0,001) / (0,001 x 0,99 + 0,999 x 0,01) = 0,9 = 9%

O que isso nos diz?

Mesmo quando o teste é positivo, devido à raridade da doença, há apenas 9% de chance de ter a doença.

Então, o que acontece quando você faz outro teste para ter certeza e também dá positivo.

Leia: Ideias de projetos de aprendizado de máquina para iniciantes

Teste 2

Novamente, o segundo teste também terá apenas 99% de precisão.

Presença de vírus	Infetado	Livre
Teste 2 (positivo)	0,99	0,01
Teste 2 (Negativo)	0,01	0,99

A Rede Bayesiana agora seria:

Origem da imagem

Os resultados reverteram!

Isso significa que se você obtiver dois resultados positivos em dois testes, as chances de ser infectado pelo vírus aumentam de 9% para 91%. Mas, novamente, não diz 100%!

Agora, e se você obtiver um resultado positivo e um negativo do teste?

Origem da imagem

Como você pode ver, há 100% de chance de você não ter a doença caso um dos dois testes seja negativo.

Teste 3

Fica ainda melhor quando você realiza três testes e todos eles se confirmam.

Origem da imagem

Claramente, agora, há 100% de chance de você estar infectado.

Agora vamos ver o que acontece quando um dos testes é negativo, mas os outros dois são positivos.

Origem da imagem

Novamente, os resultados são 91% positivos para a presença de um vírus.

Redes Bayesianas e Modelagem de Dados

No exemplo acima, pode-se ver que as Redes Bayesianas desempenham um papel significativo quando se trata de modelar dados para entregar resultados precisos.

De fato, refinar a rede incluindo mais fatores que possam afetar o resultado também nos permite visualizar e simular diferentes cenários usando Redes Bayesianas.

As Redes Bayesianas também são uma ótima ferramenta para quantificar a injustiça nos dados e selecionar técnicas para diminuir essa injustiça.

Nesses casos, é melhor usar técnicas específicas de caminho para identificar fatores sensíveis que afetam os resultados finais.

As 5 principais aplicações práticas das redes bayesianas

As Redes Bayesianas estão sendo amplamente utilizadas no campo da ciência de dados para obter resultados precisos com dados incertos.

Aplicações de Redes Bayesianas

1. Filtro de Spam

Você deve estar mentindo se disser que nunca se perguntou como o Gmail filtra e-mails de spam (e-mails indesejados e não solicitados. Ele usa o filtro de spam bayesiano, que é o filtro mais robusto.

2. Código Turbo

Redes Bayesianas são usadas para criar códigos turbo que são códigos de correção de erros avançados de alto desempenho. Estes são usados em redes móveis 3G e 4G.

3. Processamento de Imagem

As Redes Bayesianas usam operações matemáticas para converter imagens em formato digital. Também permite o aprimoramento da imagem.

4. Biomonitoramento

Quantificar a concentração de produtos químicos não poderia ser mais fácil do que com a Bayesian Networks. Neste, a quantidade de sangue e tecido em humanos é medida usando indicadores.

5. Rede Reguladora de Genes (GNR)

Um GNR contém vários segmentos de DNA de uma célula que interagem com outros conteúdos celulares por meio de proteínas e produtos de expressão de RNA. As previsões de seu comportamento podem ser analisadas usando Redes Bayesianas.

Conclusão

Nesta postagem de blog on-line, você aprendeu como as Redes Bayesianas nos ajudam a obter resultados precisos dos dados disponíveis. Mesmo a pequena variação nos dados pode afetar significativamente o resultado final. As Redes Bayesianas nos ajudam a analisar dados usando causalidade em vez de apenas correlação.

Eles provaram ser revolucionários no campo da ciência de dados. Claramente, seguir uma carreira nessa ciência pode ajudá-lo a conseguir o emprego dos seus sonhos. Então, matricule-se em um de nossos cursos de ciência de dados e aprenda com os especialistas! Também oferecemos suporte de carreira gratuito de conselheiros de carreira de alto nível e experientes. Baixe o folder para saber mais sobre o curso.

Se você quiser saber mais sobre carreiras em Machine Learning e Inteligência Artificial, confira IIT Madras e a Certificação Avançada do upGrad em Machine Learning e Cloud.

Quais são os componentes de uma rede Bayesiana?

As Redes Bayesianas têm sua origem no Teorema de Bayes, que recebeu o nome de Thomas Bayes, o famoso matemático britânico. Este teorema é essencialmente uma fórmula matemática usada para determinar a probabilidade condicional. As Redes Bayesianas no campo da inteligência artificial são derivadas da Estatística Bayesiana, que tem o Teorema de Bayes como sua camada fundamental. Uma Rede Bayesiana consiste em dois módulos – probabilidade condicional no módulo quantitativo e grafo acíclico direcionado em seu módulo qualitativo. Em IA e aprendizado de máquina, as Redes Bayesianas são ferramentas usadas para raciocínio e modelagem com base em crenças incertas.

Quanta probabilidade e estatísticas você precisa saber para aprendizado de máquina?

Uma parte considerável da IA e seus diferentes subcampos são baseados em probabilidade e estatística. Quando se trata de aprendizado de máquina, você precisa considerá-lo mais como um campo interdisciplinar, que emprega probabilidade, estatística e vários algoritmos. Estatística e probabilidade são campos relacionados da matemática usados para analisar a ocorrência relativa de eventos. Essa combinação de estatísticas, probabilidade e algoritmos é usada para criar aplicativos inteligentes que aprendem com os dados e também oferecem insights valiosos. Portanto, um entendimento básico de estatística e probabilidade é obrigatório se você quiser aprender o aprendizado de máquina. Você deve estar familiarizado com conceitos fundamentais como probabilidade empírica e teórica, probabilidade conjunta, probabilidade condicional, Teorema de Bayes, estatística descritiva, estatística descritiva univariada e bivariada, correlação, etc.

Quais são as vantagens de usar Redes Bayesianas em IA?

Redes Bayesianas são uma técnica muito popular para criar modelos para domínios complexos e incertos. Usando Redes Bayesianas, você pode desenvolver uma estrutura matematicamente lógica e robusta para paisagens incertas, como ecossistemas e gestão ambiental. A vantagem mais significativa de usar essa técnica é que você pode incorporar facilmente dados de fontes heterogêneas e níveis de precisão variados em um modelo matematicamente coerente. Isso ajuda a combinar conhecimento especializado com dados sobre variáveis que não possuem dados.