L’analisi dei dati, condotta con strumenti come Google Analytics, è un terreno ogni giorno più affascinante, ma che nasconde a ogni passo un’insidia. Il rischio più grande, a mio avviso, è quello di non accorgersi neppure di star commettendo degli errori. Certi dettagli sfuggenti, infatti, sono in realtà piena sostanza e possono portare a trarre conclusioni fuorvianti a partire dai dati. Eppure, quando i nostri rapporti si popolano di dati ci sentiamo sicuri e fiduciosi: tutto va bene…oppure no?
Questo post nasce dalla pratica quotidiana, che è poi un continuo sbattere la testa contro gli spigoli di questo mestiere difficile e bellissimo. Nasce dapprima dalla lettura di un articolo come sempre illuminante di Avinash Kaushik (trovate il link in fondo al post), poi si sviluppa nell’incontro con i quesiti degli esami di certificazione Analytics.
Il problema si incontra generalmente quando andiamo a creare dei report personalizzati in Google Analytics.
Lo riassumo in questi termini: i dati che il nostro strumento di analisi raccoglie hanno un ambito di appartenenza (“scope” per dirla nella maniera concisa dell’inglese).
Il modello dei dati in analytics presenta tre ambiti:
Punto decisivo è che dimensioni e metriche, nei miei report, devono essere allineati.
La dimensione relativa agli hits deve “guidare” le metriche a livello di hit.
Dimensioni a livello di sessione devono essere calibrate con metriche a livello di sessione.
“Miscelare” una dimensione di tipo sessione con metriche di tipo interazione, ad esempio, è come misurare una temperatura con un metro da sarta. Possono apparire dei numeri nelle colonne del mio report, ma non significano assolutamente nulla.
Fin qui il problema, che spero sia chiaro. Per capire meglio come agire correttamente, tuttavia, è bene vedere un po’ più in dettaglio di cosa parliamo quando parliamo di interazioni (hits).
Se vado a una certa URL e “atterro” sulla homepage del sito, ogni interazione che ho con il sito rappresenta un hit.
Il caso più comune è quello della pageview: una pageview è un hit.
Posso poi far accadere un evento, come ad esempio riprodurre un video, oppure aggiungere qualcosa al carrello. Tutte queste azioni sono hits.
L’insieme degli hits di una visita al sito è una sessione.
Forte di queste semplici idee-base, posso vedere alcuni esempi di dimensione e metriche “allineate” a livello di hits.
Mettiamo di partire da una dimensione a livello di hit, come “Pagina”. Con quali metriche posso allora lavorare utilmente nel mio report?
A questo punto la risposta è scontata: con quelle a livello di hit! Ad esempio: “Tempo sulla pagina” (ma serve a qualcosa?), “Valore della pagina” (questa sì che serve a qualcosa!), “Frequenza di rimbalzo”…
Se scelgo come dimensione una “classica” dimensione a livello di sessione, quale ad esempio “Sorgente/mezzo”, oppure “Città” o magari “Campagna”, ecco che le mie metriche devono avere lo stesso scope. Quindi lavorerò, ad esempio, con “Visite”, “Pagine/sessione”, “% Nuove sessioni”, “Durata sessione media”, “Valore obiettivo per sessione”, “Transazioni”, “Tasso di conversione all’obiettivo”…
Per gli approfondimenti del caso, rimando all’articolo già citato di Avinash Kaushik, e alla guida alle metriche e dimensioni nella sezione delle API di Google.
I test statistici sono strumenti fondamentali per l’analisi dei dati e la presa di decisioni informate. Scegliere…
Gli Alberi Decisionali sono un tipo di algoritmo di apprendimento automatico che utilizza una struttura…
Immaginiamo di voler trovare il percorso più veloce per raggiungere una destinazione in auto. Si…
Nel 1847, il matematico francese Augustin-Louis Cauchy stava lavorando su calcoli astronomici, quando ideò un…
La simulazione Monte Carlo è un metodo utilizzato per quantificare il rischio associato a un…
Abbiamo visto che la distribuzione binomiale si basa sull’ipotesi di una popolazione infinita N, condizione che si…