Come riscrivere le sorgenti di traffico e i mezzi su BigQuery
Spesso, le imperfezioni nei report, come sorgenti o mezzi mal identificati, possono offuscare la visione chiara delle performance delle attività online. Difatti capita di vedere nei report realizzati con Bigquery delle sorgenti o mezzi con nomi “errati” (spesso dovuti ad una errata impostazione degli UTM.), “non desiderati”, o semplicemente corretti con la necessità di rinominarli a nostro piacimento per renderli riconoscibili o raggrupparli.
Di seguito una breve disamina su come sovrascrivere sorgenti e mezzi con i nomi desiderati.
Sovrascrivere le sorgenti
Per sovrascrivere le sorgenti, si utilizza una struttura condizionale CASE in SQL, dove si specifica la condizione sotto la quale una sorgente errata deve essere sostituita con il nome corretto. Questo processo garantisce che tutte le voci errate vengano corrette direttamente a livello di query, prima che i dati vengano visualizzati nel report.
CASE
WHEN traffic_source.source = ‘nome errato' THEN ‘nome corretto'
ELSE traffic_source.source
END AS source
Sovrascrivere i mezzi
Analogamente, la sovrascrittura dei mezzi si attua mediante una logica simile, dove si possono correggere non solo i nomi errati, ma anche uniformare le sorgenti e i mezzi per riflettere in modo più accurato la loro natura. Ad esempio, trasformare sorgenti “google” e mezzi “ads” in un unico mezzo “cpc”.
CASE
WHEN traffic_source.medium = ‘nome errato' THEN ‘nome corretto'
WHEN traffic_source.source = 'google' AND traffic_source.medium = 'ads' THEN 'cpc'
ELSE traffic_source.medium
END AS medium
Aggregazione delle sorgenti
Una applicazione pratica di questo processo di normalizzazione si vede nell’aggregazione del traffico proveniente da Facebook, che può essere categorizzato in modi diversi, come “m.Facebook”, “l.Facebook”, e “lm.Facebook”.
Prima di procedere, è bene dare una spiegazione generale su queste sigle che spesso si incontrano nei report di GA4 e BigQuery:
m.Facebook: Questa sigla in genere si riferisce a “Mobile Facebook”, indicando che il traffico proviene dall’applicazione mobile di Facebook. Molte piattaforme, inclusa Google Analytics, possono distinguere tra traffico mobile e desktop, quindi “M.Facebook” potrebbe essere usato per identificare gli utenti che accedono al tuo sito tramite l’app di Facebook su dispositivi mobili.
l.Facebook: “L” in “l.Facebook” potrebbe indicare “Link” o “Linked”. Questo potrebbe riferirsi al traffico che arriva tramite link condivisi su Facebook. Ad esempio, se qualcuno condivide un link al tuo sito su Facebook e un utente clicca su quel link, questa visita potrebbe essere categorizzata sotto “l.Facebook”.
lm.Facebook: Questa sigla è meno comune e la sua interpretazione potrebbe variare. “LM” potrebbe essere una combinazione delle due precedenti, ad esempio, “Link Mobile”. Ciò significherebbe traffico proveniente da link su Facebook che sono stati aperti tramite un dispositivo mobile.
La normalizzazione in questo contesto significa riassegnare tutte queste varianti sotto un’unica etichetta “facebook“, migliorando la chiarezza del report:
CASE
WHEN traffic_source.source like ‘%facebook%’ THEN ‘facebook’
ELSE traffic_source.source
END AS source
La normalizzazione delle sorgenti e dei mezzi rappresenta un passaggio facoltativo ma consigliato in fase di analisi dei dati. Questo processo non solo migliora l’accuratezza dei report analitici ma facilita anche una comprensione più chiara e diretta.
Data Scientist
Sono un Data Scientist con esperienza nell’applicazione di tecniche avanzate di Machine Learning per l’analisi di complessi set di dati nel campo del marketing digitale. Specializzato nell’uso di Python, sviluppo modelli predittivi e di analisi dei dati che permettono di identificare e risolvere criticità nei progetti.