statistics

La distribuzione binomiale negativa (o distribuzione di Pascal)

La distribuzione binomiale negativa descrive il numero di prove necessarie per ottenere un certo numero di successi in una serie di prove indipendenti. Ad esempio, potrebbe essere utilizzata per calcolare la probabilità di ottenere tre teste lanciando una moneta 5 volte, supponendo che la moneta sia bilanciata e quindi che a ogni lancio la probabilità di ottenere una testa sia del 50%.

La distribuzione binomiale negativa è utile in molti campi, tra cui la statistica, l’economia, la biologia e la fisica. E anche nella “nostra” SEO.

Definiamo la distribuzione binomiale negativa (o di Pascal)

La distribuzione binomiale negativa è una distribuzione di probabilità discreta che descrive il numero di prove necessarie per ottenere un certo numero di successi in una serie di prove indipendenti.

Si dice che una prova ha successo con probabilità p, e si vuole ottenere un totale di r successi. La distribuzione binomiale negativa fornisce la probabilità di ottenere r successi nelle prime n prove.

I parametri utilizzati nella distribuzione binomiale negativa sono:

  • la probabilità di successo p, che indica la probabilità di ottenere un successo in una singola prova.
  • il numero di successi desiderati r, che indica il numero totale di successi che si vogliono ottenere.
  • il numero di prove necessarie n, che indica il numero di prove che devono essere effettuate per ottenere r successi.

La distribuzione binomiale negativa è spesso indicata con la seguente notazione:

\( X \sim NB(r,p) \\ \)

dove X indica il numero di prove necessarie per ottenere r successi, e il simbolo “~” significa “distribuito come”.

Esempi di utilizzo della distribuzione binomiale negativa

La distribuzione binomiale negativa può essere applicata in diverse situazioni, ad esempio:

  • Nel marketing, per calcolare il numero di tentativi necessari per ottenere un certo numero di vendite o conversioni.
  • In biologia, per calcolare il numero di tentativi necessari per ottenere un certo numero di successi in una serie di esperimenti (ad esempio, il numero di tentativi necessari per isolare un determinato ceppo batterico).
  • In ingegneria, per calcolare il numero di ripetizioni necessarie per testare la resistenza di un materiale o di una struttura.

Per calcolare la probabilità di ottenere r successi nelle prime n prove, possiamo utilizzare la seguente formula:

\( P(X = n) = {n-1 \choose r-1} p^r (1-p)^{n-r} \\ \)

dove X indica il numero di prove necessarie per ottenere r successi, p indica la probabilità di successo in una singola prova, e C indica il coefficiente binomiale.

Ad esempio, supponiamo di voler calcolare la probabilità di ottenere 3 teste lanciando una moneta equilibrata (probabilità di successo p=0.5). Se supponiamo che siano necessari 5 lanci per ottenere 3 teste, possiamo utilizzare la distribuzione binomiale negativa per calcolare la probabilità di successo:

\( P(X = 5) = {4 \choose 2} \cdot 0.5^3 \cdot 0.5^2 = 0.3125 \\ \)

Ciò significa che la probabilità di ottenere 3 teste in 5 lanci è del 31.25%.

Differenze tra la distribuzione geometrica e quella di Pascal

La distribuzione binomiale negativa e la distribuzione geometrica sono entrambe distribuzioni di probabilità discrete utilizzate per modellare il numero di prove necessarie per ottenere un certo numero di successi. Tuttavia, le due distribuzioni differiscono nella definizione del successo e nell’obiettivo della modellizzazione.

La distribuzione geometrica viene utilizzata per modellare il numero di prove necessarie per ottenere il primo successo in una sequenza di prove indipendenti identicamente distribuite. Ad esempio, la probabilità di ottenere il primo successo in una moneta equilibrata può essere modellata con una distribuzione geometrica, dove la probabilità di successo è p=0.5 e il numero di prove necessarie può assumere i valori 1, 2, 3, ….

Scritta in termini più precisi:

La differenza principale tra la distribuzione geometrica e quella di Pascal è che la distribuzione geometrica rappresenta il numero totale di tentativi necessari per ottenere un successo, mentre la distribuzione di Pascal rappresenta il numero di fallimenti prima del k-esimo successo in una successione di esperimenti bernoulliani indipendenti e identicamente distribuiti.

In altre parole, la distribuzione geometrica descrive il tempo necessario per ottenere il primo successo, mentre la distribuzione di Pascal descrive il tempo necessario per ottenere un certo numero fisso di successi. Inoltre, la distribuzione geometrica ha solo un parametro (la probabilità di successo), mentre la distribuzione di Pascal ha due parametri (il numero desiderato di successi e la probabilità di successo)

Le formule per la distribuzione binomiale negativa e la distribuzione geometrica sono simili, ma con alcune differenze nei parametri e nell’obiettivo della modellizzazione.

Ad esempio, consideriamo il caso di una moneta equilibrata con p=0.5. La probabilità di ottenere il primo successo in 3 prove può essere calcolata con una distribuzione geometrica:

\( P(X = 3) = (1-0.5)^2 \cdot 0.5 = 0.125 \\ \)

dove X indica il numero di prove necessarie per ottenere il primo successo.

D’altra parte, la probabilità di ottenere 3 successi in 5 prove può essere calcolata con una distribuzione binomiale negativa:

\( P(X = 5) = {4 \choose 2} \cdot 0.5^3 \cdot 0.5^2 = 0.3125 \\ \)

dove X indica il numero di prove necessarie per ottenere 3 successi.

Link a risorse autorevoli per approfondire l’argomento

paolo

Recent Posts

Guida ai Test Statistici per analisi A/B

I test statistici sono strumenti fondamentali per l’analisi dei dati e la presa di decisioni informate. Scegliere…

8 mesi ago

Come usare gli Alberi Decisionali per classificare i dati

Gli Alberi Decisionali sono un tipo di algoritmo di apprendimento automatico che utilizza una struttura…

10 mesi ago

L’algoritmo di Discesa del Gradiente spiegato semplice

Immaginiamo di voler trovare il percorso più veloce per raggiungere una destinazione in auto. Si…

1 anno ago

La Discesa del Gradiente: un nuovo studio mette in discussione un assunto base sull’ottimizzazione

Nel 1847, il matematico francese Augustin-Louis Cauchy stava lavorando su calcoli astronomici, quando ideò un…

1 anno ago

Il Metodo Montecarlo spiegato in modo semplice e applicato a casi reali

La simulazione Monte Carlo è un metodo utilizzato per quantificare il rischio associato a un…

2 anni ago

La distribuzione ipergeometrica

Abbiamo visto che la distribuzione binomiale si basa sull’ipotesi di una popolazione infinita N, condizione che si…

2 anni ago