Tipuri de distribuție a probabilității [explicat cu exemple]

Publicat: 2020-12-24

Oricine este interesat de știința datelor trebuie să știe despre distribuția probabilității. Conceptele de știință a datelor, cum ar fi statisticile inferențiale pentru rețele bayesiene, sunt dezvoltate pe lângă conceptele de bază ale probabilității. Deci, pentru a intra în lumea statisticii, probabilitatea de învățare este o necesitate.

Cuprins

Ce este Statistica?

Statistica este analiza cifrelor matematice folosind diferite metode.

Ne oferă o viziune mai holistică asupra diferitelor numere. Statisticile pentru știința datelor sunt foarte esențiale. Știința datelor se referă la cifre, iar statisticile o fac mai simplă și cuprinzătoare.

Ce este probabilitatea?

Probabilitatea este un concept intuitiv. Îl folosim fără să știm în viața noastră de zi cu zi. Probabilitatea este măsura probabilității de a avea loc un eveniment. De exemplu, dacă există o șansă de 60% să plouă mâine, atunci probabilitatea este de 60%.

Ce este distribuția probabilității?

O distribuție de probabilitate este reprezentată sub forma unui tabel sau a unei ecuații. Tabelul sau ecuația corespunde fiecărui rezultat al unui experiment statistic cu probabilitatea de apariție.

Distribuțiile de probabilitate pot fi calculate chiar și pentru evenimente simple, cum ar fi aruncarea unei monede.

Următorul tabel arată distribuția probabilității fiecărui rezultat al aruncării unei monede pentru fiecare rezultat cu probabilitatea sa.

Numărul de capete Probabilitate
0 0,25
1 0,50
2 0,25

Ele pot fi, de asemenea, pentru evenimente complexe, cum ar fi probabilitatea ca un anumit vaccin să trateze cu succes COVID-19.

Cerințe preliminare ale distribuției probabilităților

Pentru a ști despre distribuțiile de probabilitate, trebuie să știi despre variabile și variabile aleatoare.

  • O variabilă este un simbol (A, B, x, y etc.). Ia oricare dintre setul de valori specificat.
  • Într-un experiment statistic, o variabilă aleatoare este valoarea unei variabile.

De obicei, o literă majusculă denotă o variabilă aleatorie, iar o literă mică denotă una dintre valorile acesteia.

De exemplu,

  • X reprezintă variabila aleatoare X.
  • P(X) denotă probabilitatea lui X.
  • P(X = x) este probabilitatea ca variabila aleatoare X să fie egală cu o anumită valoare, notată cu x.

De exemplu, P(X = 1) este probabilitatea ca variabila aleatoare X să fie egală cu 1.

Checkout: Abilități de știință a datelor

Tipuri de distribuții de probabilitate

Statisticienii împart distribuțiile de probabilitate în următoarele tipuri:

  • Distribuții de probabilitate discrete
  • Distribuții continue de probabilitate

Distribuții de probabilitate discrete

Funcțiile de probabilitate discrete sunt funcțiile de probabilitate de masă. Acesta presupune un număr discret de valori.

De exemplu, atunci când aruncați o monedă, atunci numărarea evenimentelor sunt funcții discrete, deoarece nu există valori intermediare. Ai doar cap sau cozi la aruncarea unei monede. În mod similar, atunci când numărați numărul de cărți împrumutate pe oră la o bibliotecă, puteți număra 31 sau 32 de cărți și nimic între ele.

Tipuri de distribuții de probabilitate discrete

  • Distribuții binomiale – O distribuție Bernoulli are doar două rezultate, 1 și 0. Prin urmare, variabila aleatoare X ia valoarea 1 cu probabilitatea de succes ca p, iar valoarea 0 cu probabilitatea de eșec ca q sau 1-p.

Astfel, dacă arunci o monedă, apariția capului denotă succes, iar o coadă denotă eșec.

Funcția de probabilitate este px(1-p)1-x unde x € (0, 1)

  • Distribuții normale – Distribuțiile normale sunt pentru cele mai de bază situații. Are urmatoarele caracteristici:
  1. Media, mediana și modul coincid.
  2. Curba de distribuție este în formă de clopot.
  3. Curba de distribuție este simetrică de-a lungul x = μ.
  4. Aria de sub curbă este 1.
  • Distribuția Poisson s – Numărarea numărului de cărți dintr-o bibliotecă se încadrează în distribuția probabilității.

Distribuțiile Poisson au următoarele ipoteze:

  • Un eveniment de succes nu influențează rezultatul unui alt eveniment de succes.
  • Probabilitatea de succes pe o durată scurtă este egală cu probabilitatea de succes pe o durată mai lungă.
  • Probabilitatea de succes într-o durată se apropie de zero pe măsură ce durata devine mai mică.

Citiți și: Data Science vs Data Analytics

Distribuții continue de probabilitate

Este cunoscută și sub denumirea de funcții de densitate de probabilitate. Există o distribuție continuă dacă variabila presupune că are un număr infinit de valori între oricare două valori. Variabilele continue sunt măsurate pe scale, cum ar fi înălțimea, greutatea și temperatura.

În comparație cu distribuțiile de probabilitate discrete în care fiecare valoare este un rezultat diferit de zero, distribuțiile continue au o probabilitate zero pentru anumite funcții. De exemplu, probabilitatea este zero atunci când se măsoară o temperatură care este exact de 40 de grade.

Învață cursul de învățare automată de la cele mai bune universități din lume. Câștigă programe de master, Executive PGP sau Advanced Certificate pentru a-ți accelera cariera.

Tipuri de distribuții continue de probabilitate

  • Distribuții uniforme – Când aruncați un zar, rezultatele sunt de la 1 la 6. Probabilitățile acestor rezultate sunt egale și aceasta este o distribuție uniformă.

Să presupunem că variabila aleatoare X presupune k valori diferite. De asemenea, P(X=xk) este constantă.

P(X=xk) = 1/k

  • Distribuții de probabilitate cumulativă – Când probabilitatea ca valoarea unei variabile aleatoare X să fie într-un interval specificat, probabilitatea cumulativă intră în imagine.

Să presupunem că arunci o monedă, atunci care este probabilitatea ca rezultatul să fie unul sau mai puține capete. Aceasta este o probabilitate cumulativă.

Numar de capete: x Probabilitate P(X=x) Probabilitate cumulativă: P(X ≤ x)
0 0,25 0,25
1 0,50 0,75
2 0,25 1.00

Gânduri finale

  • Distribuția probabilității arată rezultatele așteptate ale valorilor posibile pentru un anumit proces de generare a datelor.
  • Distribuțiile de probabilitate sunt de diferite tipuri, având caracteristici diferite. Caracteristicile sunt definite în principal de medie și deviația standard.
  • Investitorii se bazează foarte mult pe distribuțiile de probabilitate pentru a prognoza randamentele activelor, cum ar fi acțiunile, în timp și pentru a-și anticipa riscul.

Dacă aveți pasiune și doriți să aflați mai multe despre inteligența artificială, puteți urma Diploma PG de la IIIT-B și upGrad în Învățare automată și Învățare profundă, care oferă peste 400 de ore de învățare, sesiuni practice, asistență la locul de muncă și multe altele.

Care sunt proprietățile unei distribuții de probabilitate?

Există trei proprietăți pe care trebuie să le aibă o distribuție de probabilitate pentru a fi numite distribuție de probabilitate. În primul rând, ar trebui să fie comutativă. Aceasta înseamnă doar că atunci când adunați oricare doi termeni din distribuție, ar trebui să obțineți același total, indiferent de termenul pe care îl adăugați primul. În al doilea rând, ar trebui să fie complet monoton, ceea ce înseamnă că fiecare termen trebuie să fie mai mare sau egal cu termenul anterior. Și în al treilea rând, distribuția ar trebui să fie continuă, ceea ce înseamnă doar că nu puteți avea decalaje între probabilitatea pentru diferite numere.

Cum sunt utilizate distribuțiile de probabilitate în luarea deciziilor?

În luarea deciziilor, distribuțiile de probabilitate sunt utilizate într-un spectru larg de aplicații în care rezultatul unui proces este incert. În cazinou, distribuțiile de probabilitate sunt folosite pentru a determina șansele unui anumit rezultat. În domeniul medical, distribuțiile de probabilitate sunt utilizate pentru a determina probabilitatea unei anumite boli. În afaceri, distribuțiile de probabilitate sunt folosite pentru a determina posibilitatea unui anumit rezultat al unei acțiuni. Aplicațiile acestor distribuții de probabilitate sunt nelimitate.

Ce este o distribuție de probabilitate?

O distribuție de probabilitate este o funcție matematică care dă probabilitatea ca o variabilă aleatorie să fie o anumită valoare. Conceptul de variabilă aleatorie este esențial pentru teoria probabilității. Distribuția de probabilitate a unei variabile aleatoare discrete ia forma unei liste de probabilități ale valorilor sale posibile individuale. În general, o distribuție de probabilitate este o funcție matematică care descrie probabilitatea de apariție a unei anumite valori (sau interval) pentru o variabilă aleatoare într-un spațiu dat.