Bayesiano vs Frequentisti: quale scegliere per il tuo prossimo problema?

Pubblicato: 2020-12-23

Se ti sei mai interessato alle statistiche, è probabile che tu abbia letto del grande dibattito: bayesiano contro frequentisti. Ognuno di questi è semplicemente un approccio per risolvere un problema statistico relativo alle probabilità. Ora, gli statistici bayesiani incolpano i frequentisti per i loro metodi e viceversa. Non c'è fine a questo dibattito. Entrambi hanno i loro vantaggi e svantaggi.

In questo articolo, esamineremo entrambi gli approcci e scopriremo quale tra i due è adatto a te per il tuo prossimo problema statistico.

Sommario

Bayesiani vs Frequentisti - In termini di definizione di probabilità

Definizione 1: Probabilità come grado di credenza di Frank Ramsey (Approccio bayesiano)

La probabilità di un evento è misurata dal grado soggettivo di convinzione. Viene anche chiamata 'Probabilità Logica'. Ciò significa che la tua definizione di probabilità potrebbe variare da quella di qualcun altro, se lui/lei ha più prove di te. Questo va benissimo e l'altra persona può pensare quello che vuole.

Definizione 2: Probabilità come frequenza a lungo termine di Ronald Fisher (Approccio dei frequentisti)

La probabilità di un evento è uguale alla frequenza a lungo termine di quell'evento quando si ripete più volte. C'è una risposta universale e, a differenza della definizione 1, le opinioni su una probabilità di un evento non possono variare da persona a persona anche se hanno più/meno prove.

Esempio:

Supponiamo che io abbia una moneta normale imparziale con testa su un lato e croce sull'altro. Ora lancio la moneta. Ho i risultati. Ma tu come spettatore non sai se la moneta è testa a testa o croce a testa.

Quindi voglio che tu risponda: " Qual è la probabilità che la moneta che ho lanciato sia testa a testa ?"

Ci saranno due diversi tipi di risposte basate sulle due diverse definizioni di probabilità .

bayesiani

I bayesiani risponderanno che c'è una probabilità del 50% che la moneta sia heads-up. Tu come bayesiano mi dirai: " La risposta è il 50% di testa a testa per me. Ma sì, conosci l'esito del lancio. Quindi, hai una probabilità del 100% che la moneta sia testa o croce. Ma, sai una cosa, non mi interessa. Perché, secondo le risorse a mia disposizione, la risposta è per me del 50%. "

Frequentisti

I frequentisti risponderanno alla domanda " C'è il 100% di possibilità o lo 0% di possibilità che la moneta sia heads-up. Dal momento che la moneta è stata sbarcata, non serve attribuire una probabilità a questo valore fisso e costante. L'esito del lancio è definitivo e non vi è alcuna alterazione. Non ci saranno variazioni di risposta tra nessuno.

Leggi: Tipi di apprendimento supervisionato

Bayesiano vs. Frequentisti: in termini di utilizzo delle probabilità precedenti

Esaminiamo un altro esempio.

Faremo un ulteriore passo avanti nell'esempio precedente. Lancerò la moneta molte volte, supponiamo 14 volte. Hai annotato i risultati degli ultimi 14 lanci di monete. Ora, per la quindicesima volta, lancio di nuovo la moneta. Ora ti viene chiesto: " Qual è la probabilità che questa moneta lanciata sia testa a testa ".

bayesiani

Se sei bayesiano, quello che utilizzerai è un termine noto come prior . Esaminiamo la formula di Bayes per la probabilità condizionata:

dove A e B sono alcuni eventi e P(A | B) è definito come Probabilità dell'evento A dato che l'evento B si è verificato.

Ora, il termine P(A) è definito come a priori che è definito come la probabilità che l'evento A sia vero prima che i dati vengano considerati.

Tornando all'esempio, come bayesiano utilizzerai il termine prior, ovvero prenderai una decisione in base ai risultati passati dei lanci di monete.

Supponiamo che su 14 lanci di monete, io abbia avuto un heads-up 9 volte. Potresti dire "Beh, ho maggiori possibilità di ottenere una testa". Non solo lo dici, ma anche il tuo calcolo supporterà la tua argomentazione. Quindi la tua decisione è stata modificata a causa dei risultati "precedenti". La propria capacità di prendere decisioni dipende dal proprio grado di fiducia nel priore scelto. L'assegnazione di probabilità a priori è stato uno dei fattori chiave nei risultati bayesiani.

Da leggere: Tipi di modelli di regressione nell'apprendimento automatico

Frequentisti

Se sei un frequentista, non sarai completamente d'accordo con qualsiasi cosa dicano i bayesiani. Non hai alcun interesse per il precedente poiché il precedente è spesso un valore indovinato. Piuttosto la tua idea si basa sulla stima di massima verosimiglianza. Quello che farai è raccogliere dati campione da una popolazione. Ora stima il valore medio che è per lo più uniforme con la media dei dati. Questo valore è il punto di massima verosimiglianza (stima) del parametro incerto.

Ora, i frequentisti potrebbero presumere che la media campionaria sia uguale alla media della popolazione, il che potrebbe essere sbagliato ed è effettivamente sbagliato il più delle volte. Quindi hanno introdotto termini come p-value e intervalli di confidenza.

Il valore P è un modo semplice per misurare la probabilità di trovare risultati osservati o estremi quando l'ipotesi nulla è vera. Rifiuti l'ipotesi nulla quando il valore p è inferiore al livello di significatività di 0,05. Ora, i valori p e gli intervalli di confidenza sono abbastanza importanti da dedicare loro un articolo separato.

Quindi ora, come primo passo, raccogli il campione dalla popolazione. Ripeti la procedura un gran numero di volte. Ora, la tua vera media dovrebbe rientrare negli intervalli di confidenza che scegli, con una certa probabilità. Questo è ciò che devi fare per ottenere il risultato per la mia domanda sul lancio di monete.

Potresti pensare che i frequentisti siano troppo complessi. Ebbene, in un certo senso lo sono. Tendono a trovare la risposta universale perfetta che può essere accettata da chiunque, nonostante le varie condizioni. E così facendo, i frequentisti implicano calcoli seri e complessità che i principianti potrebbero non capire.

Conclusione

Bayesiano vs Frequentista: qual è la strada?

Il dibattito bayesiano e frequentista andrà avanti. Ma sta a te, in base alle risorse disponibili, quale approccio utilizzare. Entrambi gli approcci hanno il loro enorme numero di applicazioni. Il grande matematico Laplace calcolò la massa di Saturno usando l'inferenza bayesiana che avrebbe potuto essere molto più difficile con il metodo frequentista.

D'altra parte, il modo di pensare frequentista ha aiutato i ricercatori recenti a risolvere efficacemente problemi, specialmente nel campo della scienza medica, che non avrebbero potuto essere fatti con l'inferenza bayesiana.

Se sei interessato a saperne di più sull'apprendimento automatico, dai un'occhiata al Diploma PG di IIIT-B e upGrad in Machine Learning e AI, progettato per i professionisti che lavorano e offre oltre 450 ore di formazione rigorosa, oltre 30 casi di studio e incarichi, IIIT- B Status di Alumni, oltre 5 progetti pratici pratici e assistenza sul lavoro con le migliori aziende.

Guida la rivoluzione tecnologica guidata dall'intelligenza artificiale

DIPLOMA PG IN MACHINE LEARNING E INTELLIGENZA ARTIFICIALE
Per saperne di più