La probabilità e la combinatoria sono due concetti fondamentali nella matematica e nella statistica, che ci aiutano a comprendere e a interpretare molti fenomeni della vita quotidiana. In questo post introduttivo”sfioriamo” insieme i concetti principali vedendo come possano essere applicati in diversi contesti.
La probabilità è una misura matematica che ci indica la possibilità che un evento si verifichi. In altre parole, la probabilità ci dice quanti casi favorevoli ci sono rispetto a tutti i casi possibili.
La probabilità si basa su due concetti fondamentali: lo spazio campionario e l’evento.
Lo spazio campionario è l’insieme di tutti i possibili risultati di un esperimento casuale.
Ad esempio, se lanciamo una moneta, lo spazio campionario è {testa, croce}. Se lanciamo due dadi, lo spazio campionario è {(1,1), (1,2), …, (6,6)}.
Un evento è un sottoinsieme dello spazio campionario che ci interessa.
Per esempio, se lanciamo una moneta e ci interessa sapere se uscirà testa o croce, l’evento è {testa} o {croce}. Se lanciamo due dadi e vogliamo sapere se la somma dei numeri è pari o dispari, l’evento è {(2,2), (2,4), …, (6,6)} o {(1,2), (1 ,4), …, (5 ,6)}.
La probabilità di un evento si calcola dividendo il numero dei casi favorevoli al verificarsi dell’evento per il numero dei casi possibili nello spazio campionario.
Per esempio:
se abbiamo un dado a sei facce e vogliamo sapere la probabilità di ottenere un 4 tirando il dado, abbiamo 1 caso favorevole (la faccia con il numero 4) rispetto a 6 casi possibili (le sei facce del dado).
Quindi, la probabilità di ottenere un 4 è di 1/6.
Altri possibili e semplici esempi:
La probabilità si esprime in numeri compresi tra 0 e 1, dove 0 indica l’impossibilità dell’evento e 1 indica la certezza dell’evento.
Un valore di probabilità vicino a 0 indica una bassa possibilità che l’evento si verifichi, mentre un valore di probabilità vicino a 1 indica una alta possibilità che l’evento si verifichi.
Il principio di additività delle probabilità per eventi incompatibili afferma che la probabilità dell’unione di due o più eventi incompatibili è uguale alla somma delle loro probabilità.
Gli eventi incompatibili sono eventi che non possono verificarsi contemporaneamente, ovvero se uno si verifica, l’altro non può verificarsi.
Ad esempio, nel lancio di un dado, gli eventi “uscita del numero 3” e “uscita del numero 5” sono incompatibili. In questo caso, la probabilità dell’unione degli eventi (cioè l’uscita del numero 3 o del numero 5) è pari alla somma delle loro probabilità (1/6 + 1/6 = 1/3).
Il principio di moltiplicazione delle probabilità afferma che la probabilità dell’intersezione di due eventi è uguale al prodotto delle loro probabilità individuali, se gli eventi sono indipendenti.
In altre parole, se A e B sono due eventi indipendenti in un esperimento di probabilità, allora la probabilità che entrambi si verifichino contemporaneamente è data dal prodotto delle loro singole probabilità:
P(A ∩ B) = P(A) x P(B).
Per calcolare la probabilità di eventi più complessi o combinati tra loro si usano le regole della combinatoria, che studia le modalità con cui si possono formare gruppi di oggetti secondo determinati criteri.
Due concetti importanti della combinatoria sono le permutazioni e le combinazioni.
Le permutazioni sono i modi in cui si possono ordinare n oggetti distinti in n posizioni diverse. Per esempio:
Vediamo un po’ di altri esempi:
La risposta è: n!
Ricordo ancora che “!” indica il fattoriale, cioè il prodotto di tutti i numeri interi positivi da 1 a n.
Soluzione: 4! (4 fattoriale) = 24 modi diversi
5! = 5 x 4 x 3 x 2 x 1 = 120
Ci sono 120 permutazioni possibili di 5 lettere.
n! / (n – r)!
dove “n” rappresenta il numero di oggetti totali (in questo caso, le 5 lettere), e “r” rappresenta il numero di oggetti che desideriamo scegliere e disporre in un ordine specifico (in questo caso, 3 lettere).
Quindi, sostituendo i valori, otteniamo:
5! / (5 – 3)! = 5! / 2! = (5 x 4 x 3 x 2 x 1) / (2 x 1) = 60
Quindi, ci sono 60 permutazioni possibili di 5 lettere prese a gruppi di 3.
È importante notare che, quando si sceglie un gruppo di oggetti da un insieme più grande, l’ordine in cui gli oggetti vengono scelti conta. Se invece non ci interessasse l’ordine, dovremmo utilizzare la formula delle combinazioni.
Le combinazioni sono i modi in cui si possono scegliere k oggetti tra n oggetti distinti senza tener conto dell’ordine. Per esempio,
Vediamo qualche altro esempio:
Per calcolare il numero di combinazioni possibili per un insieme di 10 persone prese a gruppi di 3, possiamo utilizzare la formula delle combinazioni:
n! / (k! * (n – k)!)
dove “n” rappresenta il numero di oggetti totali (in questo caso, le 10 persone) e “k” rappresenta il numero di oggetti che vogliamo scegliere senza preoccuparci dell’ordine (in questo caso, 3 persone).
Quindi, sostituendo i valori, otteniamo:
10! / (3! * (10 – 3)!) = (10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1) / ((3 x 2 x 1) * (7 x 6 x 5 x 4 x 3 x 2 x 1)) = 120
Questo esempio è preso dall’ Esame di stato, tema di matematica n 1 (PNI, a. s. 2000-2001- Corso di ordinamento. Liceo scientifico)
La probabilità di scegliere tre allievi tutti maschi può essere calcolata come il rapporto tra il numero di modi in cui possiamo scegliere tre maschi (se vogliamo scegliere tre allievi tutti maschi, dobbiamo infatti considerare tutti i possibili gruppi di 3 allievi maschi che possono essere formati scegliendoli tra i 12 ragazzi maschi) e il numero totale di modi in cui possiamo scegliere tre studenti tra tutti i sedici.
Il numero di modi in cui possiamo scegliere tre maschi dalla classe di 12 ragazzi è dato dalla combinazione di 3 elementi scelti tra i 12 ragazzi maschi. Possiamo calcolare questo numero utilizzando la formula della combinazione:
C(12, 3) = 12! / (3! * (12-3)!) = 220
Il numero totale di modi in cui possiamo scegliere tre allievi dalla classe di 16 studenti è dato dalla combinazione di 3 elementi scelti tra i 16 allievi.
C(16, 3) = 16! / (3! * (16-3)!) = 560
Quindi, la probabilità di scegliere tre allievi tutti maschi è data da:
P(tre maschi) = C(12, 3) / C(16, 3) = 220 / 560 = 11 / 28
In un post specificamente dedicato alle distribuzioni di probabilità ho esaminato in dettaglio le proprietà della distribuzione binomiale. Rimando ovviamente al post per tutti i dettagli.
In questa sede, vorrei però introdurre brevemente in maniera diretta e pratica la binomiale, al solo scopo di rispondere a quesiti del tipo:
Vediamo il primo quesito. Voglio sapere la probabilità che in 10 lanci di una moneta esca 5 volte o meno testa.
Procedendo per logica, dovrei calcolare la somma delle probabilità binomiali per k = 0, 1, 2, 3, 4 e 5. Cioè:
P(X <= 5) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5)
Usando la formula della probabilità binomiale e sostituendo n = 10 e p = 1/2, si ottiene:
P(X <= 5) = C(10 ,0) x (1/2)^0 x (1/2)^10 + C(10 ,1) x (1/2)^1 x (1/2)^9 + … + C(10 ,5) x (1/2)^5 x (1/2)^5
Semplificando i calcoli e usando una calcolatrice si ottiene:
P(X <= 5) = <0.001 + <0.01 + <0.04 + <0.12 + <0.21 + <0.25 P(X <= 5) = 0.63
Quindi la probabilità che in 10 lanci di una moneta esca testa al massimo cinque volte è circa il 63%.
Esiste un metodo più semplice per arrivare al risultato corretto?
Possiamo introdurre la funzione di ripartizione della distribuzione binomiale.
La funzione di ripartizione è una funzione che calcola la probabilità che la variabile aleatoria X sia minore o uguale a un certo valore k. Si indica con F(k) e si definisce come:
F(k) = P(X <= k) = somma delle probabilità binomiali per i = 0, 1, …, k
Questa funzione può essere calcolata con una formula approssimata o con una tabella precompilata. Per esempio, usando una tabella online come questa:
https://www.statisticshowto.com/tables/binomial-distribution-table/
dove si può trovare il valore di F(5) per n = 10 e p = 1/2.
Basta cercare nella riga corrispondente a n = 10 e nella colonna corrispondente a p = 0.5 e leggere il valore in corrispondenza di k = 5. Il valore è 0.623.
Ovviamente, è molto più comodo usare R oppure Python, specialmente per numeri più elevati.
In R, basta usare la funzione pbinom che calcola la probabilità cumulativa di ottenere un certo numero di successi in un certo numero di prove. Per esempio:
# Probabilità di ottenere 5 o meno teste in 10 lanci pbinom(5, size = 10, prob = 0.5) # Risultato: 0.6230469
Per usare Python, basterà sfruttare la libreria scipy.stats e la classe binom che rappresenta una variabile casuale binomiale. Per esempio:
# Importare la libreria from scipy.stats import binom # Probabilità di ottenere 5 o meno teste in 10 lanci binom.cdf(5, n = 10, p = 0.5) # Risultato: 0.623046875
Veniamo al secondo quesito.
Vogliamo calcolare la probabilità che in 20 domande a risposta multipla si risponda correttamente a 15 domande o più. Se assumiamo che ogni domanda abbia 4 opzioni e solo una sia corretta, allora la probabilità di successo è p = 0.25. Quindi si deve calcolare:
P(X >= 15) = P(X = 15) + P(X = 16) + P(X = 17) + P(X = 18) + P(X = 19) + P(X = 20)
La formula della probabilità binomiale è:
\( P(X = x) = {n \choose x} p^x (1-p)^{n-x} \\ \)Usando la formula della probabilità binomiale, otteniamo:
\( P(X \geq 15) \approx 0.0002 \)Quindi la probabilità è molto, molto bassa…meglio studiare!
Veniamo al terzo quesito.
Voglio trovare la probabilità che in 100 estrazioni da un’urna contenente 10 palline bianche e 90 nere se ne estraggano meno di 20 bianche. Se assumiamo che le estrazioni siano con reinserimento, allora la probabilità di successo (estrarre una pallina bianca) è p = 0.1. Quindi devo calcolare:
$$ P(X < 20) = P(X \leq 19) = \sum_{x=0}^{19} {100 \choose x} (0.1)^x (0.9)^{100-x} $$ e ottengo: $$ P(X < 20) \approx 0.9988 $$Quindi in questo caso la probabilità è molto alta.
I test statistici sono strumenti fondamentali per l’analisi dei dati e la presa di decisioni informate. Scegliere…
Gli Alberi Decisionali sono un tipo di algoritmo di apprendimento automatico che utilizza una struttura…
Immaginiamo di voler trovare il percorso più veloce per raggiungere una destinazione in auto. Si…
Nel 1847, il matematico francese Augustin-Louis Cauchy stava lavorando su calcoli astronomici, quando ideò un…
La simulazione Monte Carlo è un metodo utilizzato per quantificare il rischio associato a un…
Abbiamo visto che la distribuzione binomiale si basa sull’ipotesi di una popolazione infinita N, condizione che si…