Bayesian vs. Frecventists: pe care să alegi pentru următoarea ta problemă?
Publicat: 2020-12-23Dacă ați fost vreodată pasionat de statistici, sunt șanse să fi citit despre marea dezbatere – Bayesian vs. Frequentiști. Fiecare dintre acestea este doar o abordare pentru rezolvarea unei probleme statistice legate de probabilități. Acum, statisticienii bayesieni dau vina pe frecvenți pentru metodele lor și invers. Această dezbatere nu are sfârșit. Ambele au avantajele și dezavantajele lor.
În acest articol, vom analiza ambele abordări și vom afla care dintre cele două este bună pentru dvs. pentru următoarea problemă statistică.
Cuprins
Bayesieni vs. Frecvențiști — În termeni de definiție a probabilității
Definiția 1: Probabilitatea ca grad de credință de Frank Ramsey (abordarea bayesiană)
Probabilitatea unui eveniment este măsurată prin gradul subiectiv de credință. Se mai numește și „probabilitatea logică”. Aceasta înseamnă că definiția dvs. de probabilitate poate diferi de cea a altcuiva, dacă acesta/ea are mai multe dovezi decât tine. Acest lucru este complet în regulă și cealaltă persoană poate gândi orice vrea.
Definiția 2: Probabilitatea ca frecvență pe termen lung de Ronald Fisher (abordarea frecvențiștilor)
Probabilitatea unui eveniment este egală cu frecvența pe termen lung a acelui eveniment atunci când acesta se repetă de mai multe ori și din nou. Există un răspuns universal și, spre deosebire de definiția 1, opiniile cu privire la probabilitatea unui eveniment nu pot varia de la persoană la persoană, chiar dacă au mai multe/mai puține dovezi.

Exemplu:
Să presupunem că am o monedă normală imparțială, având capete pe o parte și cozi pe cealaltă. Acum arunc moneda. Am rezultatele. Dar, tu, ca spectator, nu știi dacă moneda este heads-up sau tail-up.
Așa că vreau să răspunzi: „ Care este probabilitatea ca moneda pe care am aruncat-o să fie heads-up ?”
Vor exista două tipuri diferite de răspunsuri bazate pe cele două definiții diferite ale probabilității .
Bayesienii
Bayesienii vor răspunde că există o șansă de 50% ca moneda să fie heads-up. Tu, ca bayesian, îmi vei spune: „ Răspunsul este 50% avertisment pentru mine. Dar da, știi rezultatul aruncării. Deci, aveți o probabilitate de 100% ca moneda să fie fie cap, fie coadă. Dar, știi ce, nu-mi pasă. Pentru că, conform resurselor disponibile, răspunsul este de 50% pentru mine. ”
Frecvențiști
Frecvențiștii vor răspunde la întrebarea „ Există fie 100% șanse, fie 0% șanse ca moneda să fie heads-up. Din moment ce moneda a fost aruncată, nu are rost să atașăm o probabilitate acestei valori fixe și constante. Rezultatul aruncării este definitiv și nu există nicio modificare a acestuia. Nu va exista nicio variație de răspuns între nimeni.
Citiți: Tipuri de învățare supravegheată
Bayesian vs. Frecventists — În ceea ce privește utilizarea probabilităților anterioare
Să privim un alt exemplu.
Vom duce exemplul de mai sus cu un pas mai departe. Voi arunca moneda de multe ori, să presupunem de 14 ori. Ați notat rezultatele ultimelor 14 aruncări de monede. Acum, pentru a 15-a oară, arunc din nou moneda. Acum, ești întrebat: „ Care este probabilitatea ca această monedă aruncată să fie cu capul sus ”.
Bayesienii
Dacă sunteți bayesian, ceea ce veți folosi este un termen cunoscut ca anterior . Să ne uităm la formula lui Bayes pentru probabilitatea condiționată:

unde A și B sunt unele evenimente și P(A | B) este definită ca Probabilitatea unui eveniment B dat.
Acum, termenul P(A) este definit ca anterior, care este definit ca probabilitatea ca evenimentul A să fie adevărat înainte ca datele să fie luate în considerare.
Revenind la exemplu, ca Bayesian, veți folosi termenul anterior, adică veți lua o decizie bazată pe rezultatele anterioare ale aruncărilor de monede.
Să presupunem că din 14 aruncări de monede am primit heads-up de 9 ori. Ai putea spune că „Ei bine, am șanse mai mari de a obține un cap”. Nu numai că spui asta, dar și calculul tău îți va susține argumentul. Deci decizia ta a fost modificată din cauza rezultatelor „anterioare”. Capacitatea cuiva de a lua decizii depinde de gradul de credință în antecedentul ales. Atribuirea probabilităților anterioare a fost unul dintre factorii cheie în rezultatele lui Bayesian.
Trebuie citit: Tipuri de modele de regresie în învățarea automată
Frecvențiști
Dacă sunteți frecventist, veți fi complet în dezacord cu orice spun bayesienii. Nu aveți niciun interes pentru antecedente, deoarece prioritatea este adesea o valoare ghicită. Mai degrabă, ideea dvs. se bazează pe estimarea probabilității maxime. Ceea ce veți face este să colectați date eșantion de la o populație. Acum estimați valoarea medie care este în mare parte uniformă cu media datelor. Această valoare este punctul de probabilitate maximă (estimarea) a parametrului incert.
Acum, frecvențiștii ar putea presupune că media eșantionului ar fi egală cu media populației, ceea ce ar putea fi greșit și este într-adevăr greșit de cele mai multe ori. Deci au introdus termeni precum valorile p și intervalele de încredere.
Valoarea P este o modalitate simplă de a măsura probabilitatea de a găsi rezultate observate sau extreme atunci când ipoteza nulă este adevărată. Respingeți ipoteza nulă atunci când valoarea p este sub nivelul de semnificație de 0,05. Acum, valorile p și intervalele de încredere sunt suficient de importante pentru a le dedica un articol separat.
Deci acum, ca prim pas, colectați eșantionul din populație. Repetați procedura de mai multe ori. Acum, adevărata dvs. medie ar trebui să fie în intervalele de încredere pe care le alegeți, având o anumită probabilitate. Acesta este ceea ce trebuie să faceți pentru a obține rezultatul întrebării mele de aruncare a monedelor.

S-ar putea să vă gândiți că frecvențiștii sunt mult prea complexi. Ei bine, sunt într-un fel. Ei tind să găsească răspunsul universal perfect care poate fi acceptat de oricine, în ciuda diferitelor condiții. Și făcând acest lucru, frecvențiștii implică calcule serioase și complexitate pe care începătorii ar putea să nu le înțeleagă.
Concluzie
Bayesian vs. Frecventist – care este calea?
Dezbaterea Bayesian vs Frecventist va continua. Dar depinde de tine, pe baza resurselor disponibile, care abordare să folosești. Ambele abordări au numărul lor uriaș de aplicații. Marele matematician Laplace a calculat masa lui Saturn folosind inferența bayesiană, care ar fi putut fi mult mai dură cu metoda Frecventistă.
Pe de altă parte, modul de gândire frecventist a ajutat cercetătorii recenti în rezolvarea eficientă a problemelor în special în domeniul științei medicale care nu s-ar fi putut face cu inferența bayesiană.
Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Diploma PG de la IIIT-B și upGrad în Învățare automată și AI, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT- B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.