A cosa servono e perché sono importanti su BigQuery lo user_pseudo_id e lo user_id?
Quando un utente visita il tuo sito web, Google Analytics 4 genera un user_pseudo_id
che viene utilizzato per riconoscere l’utente in tutte le sue future visite e interazioni. Questo permette di analizzare il comportamento dell’utente nel tempo, di segmentare gli utenti in base alle loro azioni e di calcolare metriche importanti come la retention, il percorso utente e il valore del tempo di vita del cliente (CLTV).
Tuttavia, ci sono alcune circostanze in cui l’user_pseudo_id
può cambiare per lo stesso utente fisico, come:
- Cancellazione dei cookie: Se l’utente cancella i cookie dal suo browser, una nuova visita sarà tracciata come se fosse un nuovo utente, generando un nuovo
user_pseudo_id
. - Cambio dispositivo o browser: Se l’utente accede al sito da un dispositivo o browser differente senza essere identificato attraverso un meccanismo di login che permette a GA4 di riconoscere l’utente attraverso diversi dispositivi, GA4 assegnerà un nuovo
user_pseudo_id
. - Identificazione esplicita dell’utente: Se implementi funzionalità che permettono di identificare esplicitamente l’utente (ad esempio, attraverso il login), puoi collegare diverse sessioni e
user_pseudo_id
allo stesso utente identificato, offrendo una visione più completa e integrata del comportamento dell’utente attraverso vari dispositivi e sessioni.
In generale, però, all’interno di una stessa sessione di navigazione e per le visite successive dallo stesso dispositivo e browser, l’user_pseudo_id
rimane lo stesso, consentendo di tracciare le attività dell’utente in modo coeso. Questo ID pseudonimo funge da identificatore univoco per ogni utente e consente di tracciare e aggregare le attività dell’utente nel tempo all’interno del tuo account GA4.
Qual è la differenza tra user_pseudo_id
e user_id
?
La distinzione tra user_pseudo_id
e user_id
è fondamentale per capire come tracciare e analizzare il comportamento degli utenti.
Lo user_id
è un identificatore che deve essere esplicitamente gestito nel tuo sistema di tracciamento quando un utente effettua l’accesso al tuo sito o app. Tipicamente, rappresenta un ID univoco dal tuo sistema di gestione degli utenti o database, come un ID di login o un’email criptata.
Permette di tracciare in modo univoco le attività degli utenti attraverso dispositivi e sessioni diverse, a patto che l’utente effettui l’accesso. Questo è particolarmente utile per unire sessioni e comportamenti di un utente su diversi dispositivi, offrendo una visione più completa del percorso dell’utente e del suo engagement.
Mentre user_pseudo_id
è ottimo per analisi aggregate e anonime del comportamento degli utenti, user_id
offre la possibilità di condurre analisi più dettagliate e personalizzate, soprattutto per utenti loggati, permettendo di ottimizzare l’esperienza utente e le strategie di marketing basate su comportamenti specifici e cross-device.
ATTENZIONE! Non attivare su GA4 la “Raccolta di dati personali forniti dall’utente”
Potrebbe essere troppo tardi per alcuni, data la forte incitazione di Google all’attivazione della funzione di “raccolta di dati personali forniti dagli utenti”.
Se hai in atto una raccolta di User_ID tramite Google Analytics 4 e vuoi esportarlo in BigQuery per l’analisi dei valori di user_id, dovresti evitare di accettare l’accordo relativo alla “raccolta di dati personali forniti dagli utenti” all’interno dell’area amministrativa di Google Analytics 4:
amministrazione > Impostazione di proprietà > Raccolta e Modifica dati > Raccolta dati
La sottoscrizione di tale accordo comporterà la disattivazione della funzionalità di esportazione degli user_id verso BigQuery, rendendo questa modifica definitiva e non reversibile, dato che implica una variazione permanente delle impostazioni della proprietà.
È strana la mancanza di un avviso all’interno dell’interfaccia amministrativa di GA4, che dovrebbe informare gli utenti prima che venga presa una decisione irrevocabile.
Data Scientist
Sono un Data Scientist con esperienza nell’applicazione di tecniche avanzate di Machine Learning per l’analisi di complessi set di dati nel campo del marketing digitale. Specializzato nell’uso di Python, sviluppo modelli predittivi e di analisi dei dati che permettono di identificare e risolvere criticità nei progetti.