Bayesiano vs. Frequentistas: Qual escolher para o seu próximo problema?
Publicados: 2020-12-23Se você já estudou estatística, é provável que tenha lido sobre o grande debate – Bayesiano vs. Frequentistas. Cada um deles é meramente uma abordagem para resolver um problema estatístico relacionado a probabilidades. Agora, os estatísticos Bayesianos culpam os Frequentistas por seus métodos e vice-versa. Não há fim para este debate. Ambos tem suas vantagens e desvantagens.
Neste artigo, examinaremos as duas abordagens e descobriremos qual delas é boa para você no seu próximo problema estatístico.
Índice
Bayesianos vs. Frequentistas— Em termos de definição de probabilidade
Definição 1: Probabilidade como Grau de Crença por Frank Ramsey (Abordagem Bayesiana)
A probabilidade de um evento é medida pelo grau subjetivo de crença. Também é chamado de 'Probabilidade Lógica'. Isso significa que sua definição de probabilidade pode variar da de outra pessoa, se ela tiver mais evidências do que você. Isso é completamente bom e a outra pessoa pode pensar o que quiser.
Definição 2: Probabilidade como uma Frequência de Longo Prazo por Ronald Fisher (Abordagem Frequentista)
A probabilidade de um evento é igual à frequência de longo prazo desse evento quando ele é repetido várias vezes. Existe uma resposta universal e, ao contrário da definição 1, as opiniões sobre a probabilidade de um evento não podem variar de pessoa para pessoa, mesmo que tenham mais/menos evidências.

Exemplo:
Suponha que eu tenha uma moeda normal não viciada com cara de um lado e coroa do outro. Agora eu jogo a moeda. Eu tenho os resultados. Mas você, como espectador, não sabe se a moeda está cara ou coroa.
Então eu quero que você responda – “ Qual é a probabilidade de que a moeda que joguei seja cara ?”
Haverá dois tipos diferentes de respostas com base nas duas definições diferentes de probabilidade .
Bayesianos
Bayesianos responderão que há 50% de chance de que a moeda esteja em heads-up. Você, como um Bayesiano, me dirá: “ A resposta é 50% de heads-up para mim. Mas sim, você sabe o resultado do lançamento. Então, você tem 100% de probabilidade de que a moeda seja cara ou coroa. Mas, quer saber, eu não me importo. Porque, de acordo com os recursos disponíveis para mim, a resposta é 50% para mim. ”
Frequentistas
Os frequentadores responderão à pergunta “ Há 100% de chance ou 0% de chance de que a moeda esteja em heads-up. Uma vez que a moeda foi lançada, não adianta atribuir uma probabilidade a esse valor fixo e constante. O resultado do lançamento é final e não há nenhuma alteração a ele. Não haverá variação de resposta entre ninguém.
Leia: Tipos de Aprendizagem Supervisionada
Bayesiano vs. Frequentistas— Em Termos de Uso de Probabilidades Prévias
Vejamos outro exemplo.
Vamos levar o exemplo acima um passo adiante. Vou jogar a moeda muitas vezes, suponha que 14 vezes. Você anotou os resultados dos últimos 14 lançamentos de moedas. Agora, pela 15ª vez, lanço a moeda novamente. Agora, você é perguntado: “ Qual é a probabilidade de que esta moeda lançada seja cara ”.
Bayesianos
Se você for Bayesiano, o que você usará é um termo conhecido como prior . Vejamos a fórmula de Bayes para probabilidade condicional:

onde A e B são alguns eventos e P(A | B) é definido como Probabilidade do evento A dado evento B ter acontecido.
Agora, o termo P(A) é definido como anterior, que é definido como a probabilidade de que o evento A seja verdadeiro antes que os dados sejam considerados.
Voltando ao exemplo, como um Bayesiano, você utilizará o termo anterior, ou seja, você tomará uma decisão com base nos resultados anteriores de lançamentos de moedas.
Suponha que de 14 lançamentos de moedas, eu tenha 9 vezes no heads-up. Você pode dizer que “Bem, eu tenho maiores chances de obter uma cabeça”. Não apenas você diz isso, mas seu cálculo também apoiará seu argumento. Portanto, sua decisão foi alterada devido aos resultados 'anteriores'. A capacidade de uma pessoa para tomar decisões depende do seu grau de crença na escolha anterior. A atribuição de probabilidades prévias tem sido um dos fatores-chave nos resultados de Bayesian.
Deve ler: tipos de modelos de regressão em aprendizado de máquina
Frequentistas
Se você é um Frequentista, você vai discordar completamente do que os Bayesianos dizem. Você não tem nenhum interesse no anterior, pois o anterior geralmente é um valor adivinhado. Em vez disso, sua ideia é baseada na estimativa de máxima verossimilhança. O que você fará é coletar dados de amostra de uma população. Agora estime o valor médio que é mais uniforme com a média dos dados. Este valor é o ponto de máxima verossimilhança (estimativa) do parâmetro incerto.
Agora, os Frequentistas podem supor que a média da amostra seria igual à média da população, o que pode estar errado e de fato está errado na maioria das vezes. Então, eles introduziram termos como p-valores e intervalos de confiança.
O valor P é uma maneira simples de medir a probabilidade de encontrar resultados observados ou extremos quando a hipótese nula é verdadeira. Você rejeita a hipótese nula quando o valor p está abaixo do nível de significância de 0,05. Agora, valores-p e intervalos de confiança são importantes o suficiente para dedicar um artigo separado para eles.
Então agora, como primeiro passo, você coleta a amostra da população. Você repete o procedimento um grande número de vezes. Agora, sua verdadeira média deve estar dentro dos intervalos de confiança que você escolher, tendo uma certa probabilidade. Isso é o que você precisa fazer para obter o resultado da minha pergunta de lançamento de moedas.

Você pode estar pensando que os frequentadores são muito complexos. Bem, eles estão em um sentido. Eles tendem a encontrar a resposta universal perfeita que pode ser aceita por qualquer pessoa, apesar de várias condições. E ao fazer isso, os Frequentistas envolvem cálculos sérios e complexidade que os iniciantes podem não entender.
Conclusão
Bayesiano vs. Frequentista — qual é o caminho?
O debate Bayesiano vs. Frequentista continuará. Mas depende de você, com base nos recursos disponíveis, qual abordagem usar. Ambas as abordagens têm seu grande número de aplicações. O grande Matemático Laplace calculou a massa de Saturno usando inferência Bayesiana que poderia ter sido muito mais difícil com o modo Frequentista.
Por outro lado, o modo de pensar frequentista tem ajudado pesquisadores recentes a resolver problemas de forma eficiente, especialmente no campo da ciência médica, que não poderia ter sido feito com inferência bayesiana.
Se você estiver interessado em aprender mais sobre aprendizado de máquina, confira o PG Diploma in Machine Learning & AI do IIIT-B e upGrad, projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, IIIT- B Status de ex-aluno, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.