Tipi di distribuzione di probabilità [spiegato con esempi]

Pubblicato: 2020-12-24

Chiunque sia interessato alla scienza dei dati deve conoscere la distribuzione di probabilità. I concetti di Data Science come la statistica inferenziale per le reti bayesiane sono sviluppati sulla base dei concetti di base della probabilità. Quindi per entrare nel mondo della statistica, la probabilità di apprendimento è d'obbligo.

Sommario

Che cos'è la statistica?

La statistica sta analizzando figure matematiche utilizzando metodi diversi.

Ci offre una visione più olistica di numeri diversi. La statistica per la scienza dei dati è molto cruciale. La scienza dei dati si basa sulle cifre e le statistiche lo rendono più semplice e completo.

Che cos'è la probabilità?

La probabilità è un concetto intuitivo. Lo usiamo inconsapevolmente nella nostra vita quotidiana. La probabilità è la misura della probabilità che si verifichi un evento. Ad esempio, se c'è una probabilità del 60% di pioggia domani, la probabilità è del 60%.

Che cos'è la distribuzione di probabilità?

Una distribuzione di probabilità è rappresentata sotto forma di una tabella o di un'equazione. La tabella o l'equazione corrisponde a ogni risultato di un esperimento statistico con la sua probabilità di accadimento.

Le distribuzioni di probabilità possono essere calcolate anche per eventi semplici, come il lancio di una moneta.

La tabella seguente mostra la distribuzione di probabilità di ogni risultato del lancio di una moneta ogni risultato con la sua probabilità.

Numero di teste Probabilità
0 0,25
1 0,50
2 0,25

Possono anche essere per eventi complessi, come la probabilità che un determinato vaccino tratti con successo il COVID-19.

Prerequisiti della distribuzione di probabilità

Per conoscere le distribuzioni di probabilità, devi conoscere le variabili e le variabili casuali.

  • Una variabile è un simbolo (A, B, x, y, ecc.). Prende uno qualsiasi degli insiemi di valori specificati.
  • In un esperimento statistico, una variabile casuale è il valore di una variabile.

Di solito, una lettera maiuscola denota una variabile casuale e una lettera minuscola denota uno dei suoi valori.

Per esempio,

  • X indica la variabile casuale X.
  • P(X) indica la probabilità di X.
  • P(X = x) è la probabilità che la variabile casuale X sia uguale a un valore particolare, indicato con x.

Ad esempio, P(X = 1) è la probabilità che la variabile casuale X sia uguale a 1.

Checkout: Competenze di scienza dei dati

Tipi di distribuzioni di probabilità

Gli statistici dividono le distribuzioni di probabilità nei seguenti tipi:

  • Distribuzioni di probabilità discrete
  • Distribuzioni di probabilità continue

Distribuzioni di probabilità discrete

Le funzioni di probabilità discrete sono la probabilità delle funzioni di massa. Presuppone un numero discreto di valori.

Ad esempio, quando si lancia una moneta, i conteggi degli eventi sono funzioni discrete perché non ci sono valori intermedi. Hai solo testa o croce in un lancio di monete. Allo stesso modo, quando si conteggia il numero di libri presi in prestito all'ora in una biblioteca, puoi contare 31 o 32 libri e niente in mezzo.

Tipi di distribuzioni di probabilità discrete

  • Distribuzioni binomiali - Una distribuzione di Bernoulli ha solo due risultati, 1 e 0. Pertanto, la variabile casuale X assume il valore 1 con la probabilità di successo come p e il valore 0 con la probabilità di fallimento come q o 1-p.

Pertanto, se si lancia una moneta, la presenza di testa denota successo e una coda denota fallimento.

La funzione di probabilità è px(1-p)1-x dove x € (0, 1)

  • Distribuzioni normali : le distribuzioni normali sono per le situazioni più elementari. Ha le seguenti caratteristiche:
  1. Media, mediana e moda coincidono.
  2. La curva di distribuzione è a campana.
  3. La curva di distribuzione è simmetrica lungo x = μ.
  4. L'area sotto la curva è 1.
  • Distribuzione di Poisson s – Il conteggio del numero di libri in una biblioteca rientra nella distribuzione di probabilità.

Le distribuzioni di Poisson hanno le seguenti ipotesi:

  • Un evento di successo non influenza l'esito di un altro evento di successo.
  • La probabilità di successo per un breve periodo è uguale alla probabilità di successo per un periodo più lungo.
  • La probabilità di successo in una durata si avvicina allo zero man mano che la durata diminuisce.

Leggi anche: Data Science vs Data Analytics

Distribuzioni di probabilità continue

È anche noto come funzioni di densità di probabilità. Esiste una distribuzione continua se la variabile presume di avere un numero infinito di valori tra due valori qualsiasi. Le variabili continue sono misurate su scale, come altezza, peso e temperatura.

Se confrontate con distribuzioni di probabilità discrete in cui ogni valore è un risultato diverso da zero, le distribuzioni continue hanno una probabilità zero per funzioni specifiche. Ad esempio, la probabilità è zero quando si misura una temperatura che è esattamente 40 gradi.

Impara il corso di Machine Learning dalle migliori università del mondo. Guadagna master, Executive PGP o programmi di certificazione avanzati per accelerare la tua carriera.

Tipi di distribuzioni di probabilità continue

  • Distribuzioni uniformi : quando si tira un dado, i risultati vanno da 1 a 6. Le probabilità di questi risultati sono uguali e questa è una distribuzione uniforme.

Supponiamo che la variabile casuale X assuma k valori diversi. Inoltre, P(X=xk) è costante.

Il P(X=xk) = 1/k

  • Distribuzioni di probabilità cumulative : quando la probabilità che il valore di una variabile casuale X rientri in un intervallo specificato, entra in gioco la probabilità cumulativa.

Supponiamo di lanciare una moneta, quindi qual è la probabilità che il risultato sia una o meno testa. Questa è una probabilità cumulativa.

Numero di teste: x Probabilità P(X=x) Probabilità cumulativa: P(X ≤ x)
0 0,25 0,25
1 0,50 0,75
2 0,25 1.00

Pensieri finali

  • La distribuzione di probabilità mostra i risultati attesi dei possibili valori per un determinato processo di generazione dei dati.
  • Le distribuzioni di probabilità sono di tipo diverso con caratteristiche diverse. Le caratteristiche sono principalmente definite dalla media e dalla deviazione standard.
  • Gli investitori fanno molto affidamento sulle distribuzioni di probabilità per prevedere i rendimenti di attività come le azioni nel tempo e per prevedere il loro rischio.

Se hai la passione e vuoi saperne di più sull'intelligenza artificiale, puoi prendere il diploma PG di IIIT-B e upGrad in Machine Learning e Deep Learning che offre oltre 400 ore di apprendimento, sessioni pratiche, assistenza sul lavoro e molto altro.

Quali sono le proprietà di una distribuzione di probabilità?

Ci sono tre proprietà che una distribuzione di probabilità deve avere per essere chiamata distribuzione di probabilità. In primo luogo, dovrebbe essere commutativo. Ciò significa solo che quando si sommano due termini qualsiasi dalla distribuzione, si dovrebbe ottenere lo stesso totale indipendentemente dal termine aggiunto per primo. In secondo luogo, dovrebbe essere completamente monotono, il che significa che ogni termine deve essere maggiore o uguale al termine precedente. E terzo, la distribuzione dovrebbe essere continua, il che significa semplicemente che non puoi avere intervalli tra la probabilità per numeri diversi.

Come vengono utilizzate le distribuzioni di probabilità nel processo decisionale?

Nel processo decisionale, le distribuzioni di probabilità sono utilizzate in un ampio spettro di applicazioni in cui l'esito di un processo è incerto. Nel casinò, le distribuzioni di probabilità vengono utilizzate per determinare le probabilità di un particolare risultato. In campo medico, le distribuzioni di probabilità vengono utilizzate per determinare la probabilità di una particolare malattia. Negli affari, le distribuzioni di probabilità vengono utilizzate per determinare la possibilità di un particolare risultato per un'azione. Le applicazioni di queste distribuzioni di probabilità sono illimitate.

Che cos'è una distribuzione di probabilità?

Una distribuzione di probabilità è una funzione matematica che fornisce la probabilità che una variabile casuale sia un valore particolare. Il concetto di variabile casuale è centrale nella teoria della probabilità. La distribuzione di probabilità di una variabile casuale discreta assume la forma di un elenco di probabilità dei suoi singoli valori possibili. In generale, una distribuzione di probabilità è una funzione matematica che descrive la probabilità di occorrenza di un particolare valore (o intervallo) per una variabile casuale in un dato spazio.