Integrazione con Google Analytics 4
Questa pagina descrive le configurazioni richieste per importare i dati da Google Analytics 4 (GA4) come origine dati del workload di marketing di Cortex Framework Data Foundation.
GA4 è l'ultima versione di Google Analytics. Fornisce una visione olistica del comportamento degli utenti, concentrandosi sul monitoraggio basato sugli eventi e sul machine learning per offrire approfondimenti più approfonditi. Cortex Framework ti consente di estrarre i dati da GA4 e integrarli in BigQuery per ulteriori analisi e report. Puoi ottenere informazioni di valore e migliorare i risultati aziendali.
Il seguente diagramma descrive come i dati di GA4 sono disponibili tramite il workload di marketing di Cortex Framework Data Foundation:

File di configurazione
Il config.json
file configura le impostazioni richieste per connettersi alle origini dati per il trasferimento
dei dati da vari workload. Questo file contiene i seguenti parametri per GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
La seguente tabella descrive il valore di ogni parametro di marketing:
| Parametro | Significato | Valore predefinito | Descrizione |
marketing.deployGA4
|
Esegui il deployment di GA4 | true
|
Esegui il deployment per l'origine dati GA4. |
marketing.GA4.datasets.cdc
|
Set di dati BigQuery Export per GA4 | [{"property_id": 0, "name": ""}]
|
Array di set di dati BigQuery
Export di Google Analytics 4. Ogni elemento specifica Property ID come
INT, nonché il nome del set di dati BigQuery Export corrispondente.
|
marketing.GA4.datasets.reporting
|
Set di dati di reporting per GA4 | REPORTING_GA4
|
Set di dati di reporting per GA4. |
Modello dati
Questa sezione descrive il modello dati di GA4 utilizzando il diagramma entità-relazione (ERD).
Visualizzazioni di base
Questi sono gli oggetti blu nell'ERD e sono visualizzazioni delle tabelle CDC con trasformazioni minime per decomprimere strutture di dati complesse. Consulta gli script in
src/marketing/src/GA4/src/reporting/ddls.
Viste report
Questi sono gli oggetti verdi nell'ERD e sono visualizzazioni di report che contengono metriche aggregate. Consulta gli script in
src/marketing/src/GA4/src/reporting/ddls.
Configurare l'integrazione per GA4
Cortex Framework Data Foundation si integra con GA4 creando un livello di reporting sopra i set di dati BigQuery Export di GA4 (trattati come set di dati CDC nell' architettura di Cortex Framework). Questa operazione viene eseguita creando visualizzazioni di runtime sopra le tabelle CDC o eseguendo DAG di Managed Service for Apache Airflow per i dati materializzati nelle tabelle BigQuery a seconda della configurazione delle impostazioni di reporting.
Configurare BigQuery Export di GA4
Cortex Framework utilizza la funzionalità BigQuery Export di GA4 per caricare i dati dal sistema di origine in BigQuery. Segui le istruzioni per configurare BigQuery Export o ogni proprietà GA4 in questo articolo del Centro assistenza di GA4: GA4 - Configurare BigQuery Export.
Problemi noti, limitazioni e altre considerazioni
Tieni presente quanto segue quando configuri BigQuery Export di GA4:
- Backfill: BigQuery Export di GA4 inizia dal giorno in cui viene configurato e non è previsto il backfill.
- Differenza tra l'interfaccia utente di GA4 e i numeri riportati di Cortex Framework: diversi fattori, tra cui, a titolo esemplificativo, il campionamento, il ritardo nella raccolta dei dati, e i report con cardinalità elevata, possono causare una piccola discrepanza tra l'interfaccia utente di Google Analytics e Cortex Framework. Si tratta di una limitazione nota e intrinseca di Google Analytics. Per ulteriori informazioni, consulta l'articolo su come colmare il divario tra l'interfaccia utente di Google Analytics e BigQuery Export .
- Limitazioni del volume di esportazione degli eventi: a seconda della tua edizione di Google Analytics, potresti riscontrare un diverso grado di limitazione del volume di esportazione in BigQuery al giorno. Per ulteriori informazioni, consulta l'articolo GA4 - Configurare BigQuery Export.
- Fuso orario: in BigQuery Export,
event_dateè impostato nel fuso orario dei report della proprietà mentreevent_timestampè il timestamp UTC in microsecondi. Di conseguenza, se viene utilizzatoevent_timestamp, assicurati di apportare le modifiche per il fuso orario dei report corretto quando confronti i numeri dell'interfaccia utente. - Esportazioni di eventi giornalieri rispetto a quelli in streaming (in tempo reale): per le esportazioni di eventi,
Cortex Framework supporta solo le tabelle
events_YYYYMMDDcreate dall' esportazione giornaliera completa. Per ulteriori informazioni, consulta l'articolo GA4 - BigQuery Export. - Accordo sul livello del servizio (SLA) di GA4 360 per BigQuery Export:
sebbene Cortex Framework non supporti le tabelle
events_fresh_create dalle esportazioni giornaliere aggiornate come tabelle di origine separate, puoi seguire i commenti di personalizzazione##CORTEX-CUSTOMERnella visualizzazione di reportEventsper sostituire le tabelle di origine con queste, in modo da sfruttare l'SLA fornito da questa funzionalità. Tutte le visualizzazioni di report continueranno a funzionare dopo questa sostituzione.
Aggiornamento e ritardo dei dati
In generale, l'aggiornamento dei dati per le origini dati di Cortex Framework è limitato da ciò che consente la connessione upstream, nonché dalla frequenza di esecuzione del DAG. Modifica la frequenza di esecuzione del DAG in modo che sia in linea con la frequenza upstream, i vincoli delle risorse e le esigenze aziendali.
Con Google Analytics 4, i dati di BigQuery Export potrebbero essere ritardati fino a un giorno a seconda del fuso orario, a meno che tu non stia utilizzando l'esportazione giornaliera aggiornata.
Configurazioni
Questa sezione descrive le configurazioni per il processo di dati.
Connessioni di Managed Service for Apache Airflow
Crea le seguenti connessioni in Managed Airflow. Per maggiori dettagli, consulta la documentazione Gestire le connessioni Airflow.
| Nome connessione | Scopo |
dv360_cdc_bq
|
Per il trasferimento dal set di dati non elaborati al set di dati CDC. |
dv360_reporting_bq
|
Per il trasferimento dal set di dati CDC al set di dati di reporting trasferimento. |
Impostazioni report
Puoi configurare e controllare il modo in cui Cortex Framework genera i dati per il livello di reporting finale di GA4 utilizzando il file delle impostazioni di reporting src/GA4/config/reporting_settings.yaml. Questo file controlla la modalità di generazione degli oggetti BigQuery del livello di reporting (tabelle, visualizzazioni,funzioni o stored procedure).
Per ulteriori informazioni, consulta l'articolo Personalizzare il file delle impostazioni di reporting.
Passaggi successivi
- Per ulteriori informazioni su altre origini dati e altri workload, consulta l'articolo Origini dati e workload.
- Per ulteriori informazioni sui passaggi per il deployment negli ambienti di produzione, vedi Prerequisiti per il deployment di Cortex Framework Data Foundation.
