statistics

La distribuzione geometrica

Dopo aver visto in altri post la più famosa distribuzione discreta, la Binomiale, nonchè la distribuzione di Poisson e la distribuzione Beta, è giunto il momento di gettare uno sguardo alla distribuzione geometrica.

Quanti tentativi servono per avere un primo risultato positivo?

Si usa quando si fanno tentativi indipendenti, ciascuno dei quali può avere come esito il successo o il fallimento, e si è interessati a conoscere quanti tentativi occorrono per avere un primo risultato positivo.

In simboli:

\( X \sim Geo(p) \\ \\ \)
  • \(X\) è il numero di tentativi necessari per avere un primo risultato positivo.
  • \(r\) è il numero dei tentativi.
  • \(P\) è la probabilità di successo nel tentativo.
  • diciamo poi, come è ovvio, che: q=1-p
Qui viene il bello. Abbiamo infatti: \(\\ P(X=r) = p \times q ^ {r-1} \\ \)

P indica quindi la probabilità che il primo successo avvenga al tentativo numero r.
Continuiamo nel ragionamento:

\(P(X > r) = q ^ {r}\)

il che ci consente di calcolare la probabilità che servano più di r tentativi per avere il primo successo, nonchè:

\(P(X \leq r) = 1 – q ^ {r} \\ \)

che ci aiuta a trovare qual è la probabilità che servano r tentativi o meno per avere il primo successo. Il valore atteso è:

\(E(X) = \frac{1}{P} \\ \)

La varianza è:

\(Var(X) = \frac{q}{P^{2}}\)

E’ giunto il momento degli esempi…

Sappiamo che la probabilità che un pattinatore completi un percorso senza incidenti è 0,4. Quindi:

\( X \sim Geo(0,4) \\ \)

X è il numero di tentativi che il nostro pattinatore deve fare per riuscire a completare un percorso senza alcun incidente.

Siamo pronti ad applicare le nostre nuove conoscenze. 

Calcoliamo il numero di tentativi che mi aspetto di fare prima di avere un successo:

\( E(X) = \frac{1}{P}\\\) dunque \(\frac{1}{0,4} = 2,5 \)

La varianza nel numero dei tentativi è presto calcolata:

\( Var(X) \frac{q}{p^{2}} \\ \) cioè \(\frac{0,6}{0,4^{2}} = \frac{0,6}{0,16} = 3,75 \\ \)

La probabilità di aver successo al secondo tentativo, dopo aver fallito il primo…

\( P(X=2) = P \times q = 0,4 \times 0,6 = 0,24 \\\) vale a dire 24%

La probabilità di aver successo in 4 tentativi o meno? Facile!

\(P(X \leq 4) = 1-q^{4} = 1 – 0,6^{4} = 1 – 0,1296 \\ \) Cioè 0,8704

Vale a dire 87%

La probabilità di aver bisogno di più di 4 tentativi? Calcolarla è uno scherzo:

\( P(X > 4) = q^{4} = 0,6^{4}\\ \)

Cioè 0,1296, ossia circa il 13%


Usiamo R o la TI 83

Ora che abbiamo un po’ di formule ben presenti, possiamo lasciare campo alla nostra pigrizia e tirare fuori la TI-83.

Per calcolare la probabilità di aver successo al secondo tentativo, dopo aver fallito il primo mi basterà calcolare:

geometpdf(0.4,2) 

e poi ovviamente x 100 se voglio avere il valore percentuale…

Per trovare la probabilità di aver successo in 4 tentativi o meno:

geometcdf(0,4,4)

e poi ovviamente x 100 se voglio avere il valore percentuale…

Per calcolare la probabilità di aver bisogno di più di 4 tentativi:

1-geometcdf(0.4,4)

e poi ovviamente x 100 se voglio avere il valore percentuale…

lo stesso risultato in R

Con P(X=2) e P=0,4

dgeom(1,0.4)

dove 1 è il numero dei fallimenti prima del successo…

P(X<=4) e P=0,4

pgeom(3,0.4)

Tutto molto semplice, molto rapido, molto divertente!

paolo

View Comments

  • gerardo graniero says:

    ottima stesura
    ottimo articolo

Recent Posts

Guida ai Test Statistici per analisi A/B

I test statistici sono strumenti fondamentali per l’analisi dei dati e la presa di decisioni informate. Scegliere…

8 mesi ago

Come usare gli Alberi Decisionali per classificare i dati

Gli Alberi Decisionali sono un tipo di algoritmo di apprendimento automatico che utilizza una struttura…

10 mesi ago

L’algoritmo di Discesa del Gradiente spiegato semplice

Immaginiamo di voler trovare il percorso più veloce per raggiungere una destinazione in auto. Si…

1 anno ago

La Discesa del Gradiente: un nuovo studio mette in discussione un assunto base sull’ottimizzazione

Nel 1847, il matematico francese Augustin-Louis Cauchy stava lavorando su calcoli astronomici, quando ideò un…

1 anno ago

Il Metodo Montecarlo spiegato in modo semplice e applicato a casi reali

La simulazione Monte Carlo è un metodo utilizzato per quantificare il rischio associato a un…

2 anni ago

La distribuzione ipergeometrica

Abbiamo visto che la distribuzione binomiale si basa sull’ipotesi di una popolazione infinita N, condizione che si…

2 anni ago