Il test del chi quadrato: bontà di adattamento e test di indipendenza.

Nei post precedenti abbiamo visto diversi tipi di test che possiamo utilizzare per analizzare i dati in nostro possesso e verificare delle ipotesi.

Il test chi quadrato fu proposto da Karl Pearson nel 1900, e trova ampia applicazione per stimare quanto efficacemente la distribuzione di una variabile categorica rappresenti una distribuzione attesa (e allora parliamo di “Test della bontà di adattamento” o “Goodness of fit test”) oppure per stimare quando due variabili categoriche sono indipendenti l’una dall’altra (e allora parliamo di “Test di indipendenza”).

Tale è l’importanza e la diffusione di questo test, da essere indicato dalla rivista Scientific American tra le 20 scoperte scientifiche più importanti del XX secolo.

Leggi tutto “Il test del chi quadrato: bontà di adattamento e test di indipendenza.”

Come generare la chiave ssh per accedere via shell a un servizio di hosting

In pochi semplici passi la procedura per poter abilitare l’autenticazione tramite chiavi ssh ad un comune servizio hosting.

Leggi tutto “Come generare la chiave ssh per accedere via shell a un servizio di hosting”

Il t test per due campioni. Come testare una ipotesi per campioni dipendenti o indipendenti

In un precedente post abbiamo parlato del test delle ipotesi per quanto riguarda una singola misura: la media del campione.

Ci sono però numerose situazioni nelle quali si rende necessario fare dell’analisi statistica che riguarda due campioni. Si pensi, a mo’ d’esempio, al caso in cui si voglia studiare la differenza tra uomini e donne rispetto ai risultati di un dato esame.

Leggi tutto “Il t test per due campioni. Come testare una ipotesi per campioni dipendenti o indipendenti”

La magia del testo nella console: figlet, boxes, lolcat, toilet.

Il mondo degli amministratori di sistema, degli sviluppatori “vecchia-scuola” o più semplicemente degli utenti curiosi vive l’ambiente testuale della console come una vera e propria palestra di libertà. Libertà da mouse e icone, puntatori e widget. Espressività, velocità, senso di controllo.

Chi ha detto, tuttavia, che il testo debba essere noioso? Che non ci possa e debba essere un piacere funzionale e/o estetico nell’usare in maniera creativa ciò che la console mette a disposizione?

Gli strumenti che possono essere utilizzati con piacere sono numerosi. Ne segnalerò quattro, i miei preferiti.

Leggi tutto “La magia del testo nella console: figlet, boxes, lolcat, toilet.”

La distribuzione t e il test delle ipotesi

In un precedente post ho presentato in modo (spero) molto semplice il concetto di test delle ipotesi, un metodo statistico ampiamente utilizzato per determinare la validità di una determinata affermazione basata su un campione di dati.

Negli esempi che ho proposto, tuttavia, ero a conoscenza del valore della deviazione standard, il sigma, della popolazione.
Nella pratica si tratta di un caso abbastanza raro, che mi consente di usare la distribuzione normale, calcolando lo Z-score.

Se invece non conosco il valore del sigma della popolazione, oppure se sto lavorando con piccoli campioni devo ricorrere a un tipo di distribuzione differente, chiamata distribuzione t o distribuzione di Student.

Detta più semplicemente e più chiaramente:

La distribuzione t di Student è una distribuzione di probabilità utilizzata per valutare l’importanza statistica dei risultati in caso di campioni di dimensioni piccole e incertezza sulla varianza.

Leggi tutto “La distribuzione t e il test delle ipotesi”