Distribuzione di probabilità: Spiegazione dei tipi di distribuzione
Pubblicato: 2020-12-16Sommario
Introduzione alla Probabilità e alla Distribuzione di Probabilità
Per comprendere la distribuzione di probabilità, cerchiamo innanzitutto di capire cos'è la probabilità. La probabilità è la misura della probabilità che un evento si verifichi in un esperimento. In parole povere, ci dice quanto è probabile che l'evento si verifichi. Il valore della probabilità che un evento si verifichi varia da 0 (essendo il meno probabile) a 1 (essendo il più probabile).
La distribuzione di probabilità è una funzione che fornisce le probabilità di diversi risultati per la sperimentazione. Mostra i possibili valori che una variabile casuale può assumere e la frequenza con cui si verificano questi valori.
Nella distribuzione di probabilità, la somma di tutte queste probabilità si aggrega sempre a 1. Nel dominio della scienza dei dati, uno degli usi della distribuzione di probabilità è per il calcolo degli intervalli di confidenza e per il calcolo delle regioni critiche nei test di ipotesi.
Distribuzioni continue e discrete
Il tipo di distribuzione di probabilità da utilizzare dipende dal fatto che la variabile contenga valori discreti o valori continui. Una distribuzione discreta può assumere solo un insieme limitato di valori mentre le distribuzioni continue possono assumere qualsiasi valore all'interno dell'intervallo specificato.
Le distribuzioni continue sono rappresentate in termini di densità di probabilità in quanto possono esserci valori infiniti in un determinato intervallo e la probabilità di ciascun valore sarà zero. Nel caso di distribuzione discreta, possiamo ottenere una probabilità per ogni valore poiché il numero di valori è limitato.
Tipi di distribuzioni – Distribuzione discreta
Distribuzione binomiale
È un tipo di distribuzione in cui il numero di risultati in una singola prova è solo due. Ogni prova è indipendente da un'altra prova; cioè, l'esito di ogni prova non ha un impatto sull'esito di altre prove. Le prove che vengono condotte in questo esperimento sono identiche tra loro.

Pertanto, la probabilità di successo e di fallimento sarebbe la stessa per ogni prova. Ad esempio, se la probabilità di successo di una prova è 0,8 (il che significa che la probabilità di fallimento sarebbe 0,2), sarà la stessa anche per il resto delle prove .
Distribuzione multi nominale
Questa è la versione generalizzata della distribuzione binomiale in cui il numero di risultati può essere maggiore di due. Le altre proprietà di questa distribuzione sono simili a quella della distribuzione binomiale. Ad esempio, considera che quando viene lanciato un dado giusto, la probabilità di ogni risultato sarà la stessa per tutte le prove poiché queste prove sono indipendenti l'una dall'altra.
La distribuzione di Bernoulli
Questa è un'altra variante della distribuzione binomiale. È un caso speciale di distribuzione binomiale in cui il numero di prove condotte in un esperimento è 1 (n = 1). Poiché esiste un solo tentativo, può essere definito utilizzando un solo parametro (p) che è generalmente la probabilità di successo.
Leggi: Distribuzione binomiale in Python
Distribuzione binomiale negativa
Le seguenti condizioni in una distribuzione binomiale negativa differiscono dalla distribuzione binomiale: –
- Il numero di prove condotte in un esperimento non è fisso.
- La variabile casuale indica il numero di prove necessarie per ottenere il numero desiderato di successi.
Per la distribuzione binomiale, la variabile casuale è il numero di successi richiesti, cioè ci concentriamo solo sul numero di successi, non importa quante tracce falliscono. Ma nel caso del binomio negativo, si concentra su quante prove saranno necessarie per raggiungere il numero di successi, cioè viene preso in considerazione anche il numero di fallimenti (negativi), motivo per cui viene chiamata distribuzione binomiale negativa.
Il processo prosegue solo fino al raggiungimento del numero di successi desiderato. Ciò fa sì che il numero di prove per un esperimento sia arbitrario. Si chiama anche Distribuzione Pascal.
Distribuzione di Poisson
La distribuzione di Poisson fornisce la probabilità che un numero discreto di eventi si verifichi in un determinato periodo di tempo, a condizione che si conosca il numero medio di eventi che si sono verificati durante lo stesso periodo. Questi eventi si verificano indipendentemente e non hanno alcun effetto su altri eventi. Per implementare questa distribuzione, si presuppone che il tasso di occorrenza rimanga costante nel periodo di tempo.

Distribuzione uniforme discreta
Nella distribuzione uniforme, le probabilità di tutti i risultati sono uguali. Ad esempio, considera che quando viene lanciato un dado equilibrato, la probabilità di un risultato compreso tra 1 e 6 sarà uguale. La funzione di massa di probabilità di questa distribuzione è 1/n dove n è il numero totale di valori discreti.
Tipi di distribuzioni – Distribuzione continua
Distribuzione uniforme continua
L'uniformità nella distribuzione può essere applicata anche a valori continui. Indica che la distribuzione di probabilità è uniforme nell'intervallo specificato. Viene anche chiamata distribuzione rettangolare a causa della forma che assume quando viene tracciata su un grafico.
Distribuzione normale
Una distribuzione normale (nota anche come curva a campana) è un tipo di distribuzione continua che è simmetrica da entrambe le estremità della media. Indica generalmente che la metà dei campioni si trova sul lato sinistro della media, mentre l'altra metà si trova sul lato destro. Per una distribuzione normale, media, moda e mediana sono uguali.
I dati normalmente distribuiti seguono generalmente la regola empirica. La regola empirica mostra la diffusione dei dati in termini di deviazione standard e media come segue: –
- 68% di probabilità che la variabile casuale rientri in 1 deviazione standard dalla media.
- 95% di probabilità che la variabile casuale rientri entro 2 deviazioni standard dalla media.
- 99,7% di probabilità che la variabile casuale rientri entro 3 deviazioni standard dalla media.
T – Distribuzione
È simile a una distribuzione normale, ma ha una probabilità maggiore verso i valori estremi dei dati. Ciò rende più probabile l'assunzione di valori più lontani dalla media. Quando viene tracciata su un grafico, la curva sembra più corta e più grassa della normale curva di distribuzione.
È preferibile quando il numero di campioni è di dimensioni inferiori. Con l'aumento della dimensione dei campioni, la curva di distribuzione t inizia ad apparire come una normale curva di distribuzione. Poiché le formule per la distribuzione normale e la distribuzione t sono molto complesse e richiedono molto tempo da calcolare, calcoliamo invece rispettivamente i valori di Z-score e T-score .
Leggi anche: 13 idee e argomenti interessanti per progetti sulla struttura dei dati per principianti
Chi – Distribuzione al quadrato
La distribuzione chi-quadrato è la distribuzione della somma del quadrato delle variabili casuali ricavate da una distribuzione normale. I gradi di libertà utilizzati in questa distribuzione sono uguali al numero di variabili prese dalla distribuzione normale. La media di una distribuzione chi-quadrato è uguale al numero di gradi di libertà.

Questa distribuzione è ampiamente utilizzata nel calcolo degli intervalli di confidenza e nella verifica di ipotesi. È un caso specifico di distribuzione gamma . Viene anche utilizzato nel test del chi quadrato che è il test di bontà dell'adattamento per la distribuzione osservata che aiuta a indicare se i dati del campione sono una buona rappresentazione dell'intera popolazione.
Conclusione
Questo articolo ha fornito una panoramica di alcuni esempi di tipi discreti e continui di distribuzioni. Queste diverse distribuzioni vengono utilizzate per scopi diversi e ognuna ha le proprie ipotesi.
Impara il corso ML dalle migliori università del mondo. Guadagna master, Executive PGP o programmi di certificazione avanzati per accelerare la tua carriera.
Sebbene in situazioni di vita reale, le ipotesi di queste distribuzioni potrebbero non essere soddisfatte, ma queste distribuzioni aiutano a prendere decisioni importanti per l'organizzazione.
Se sei interessato a saperne di più sull'apprendimento automatico, dai un'occhiata al Diploma PG di IIIT-B e upGrad in Machine Learning e AI, progettato per i professionisti che lavorano e offre oltre 450 ore di formazione rigorosa, oltre 30 casi di studio e incarichi, IIIT- B Status di Alumni, oltre 5 progetti pratici pratici e assistenza sul lavoro con le migliori aziende.
Cosa distingue la distribuzione binomiale dalla distribuzione normale?
In una distribuzione binomiale, non ci sono punti dati tra due punti dati dati. Ciò è in netto contrasto con una distribuzione normale, che presenta punti dati discreti. Una distribuzione normale non è discreta a differenza della distribuzione binomiale. Una distribuzione binomiale ha un numero finito di occorrenze, mentre una distribuzione normale ha un numero infinito di occorrenze. Anche allora, se la dimensione del campione è sufficientemente grande, la forma della distribuzione binomiale assomiglierà a quella della distribuzione normale.
Cosa distingue la distribuzione binomiale dalla distribuzione di Bernoulli?
L'esito di una singola prova di un evento è trattato dalla distribuzione di Bernoulli, ma l'esito di più prove di un singolo evento è trattato dalla distribuzione binomiale. Quando il risultato di un evento è richiesto una sola volta, viene applicata la distribuzione di Bernoulli, ma viene utilizzata la distribuzione binomiale quando il risultato è richiesto più volte.
Quando c'è incertezza, come possiamo usare la distribuzione di probabilità?
Uno spazio di probabilità è una rappresentazione della nostra incertezza su un esperimento che include uno spazio campionario di possibili risultati e una misura di probabilità che stima la probabilità di ciascun evento. Nell'analisi dell'incertezza, la distribuzione rettangolare è la distribuzione di probabilità più utilizzata. Tutti i risultati hanno la stessa probabilità di verificarsi in una distribuzione rettangolare. Dovrai dividere i tuoi valori per la radice quadrata di 3 per convertire i tuoi contributori di incertezza in equivalenti di deviazione standard.