Intégration à Google Analytics 4
Cette page décrit les configurations requises pour importer des données depuis Google Analytics 4 (GA4) en tant que source de données de la charge de travail marketing de la fondation de données Cortex Framework.
GA4 est la dernière version de Google Analytics. Elle offre une vue globale du comportement des utilisateurs, en se concentrant sur le suivi basé sur les événements et le machine learning pour fournir des insights plus approfondis. Cortex Framework vous permet d'extraire des données de GA4 et de les intégrer à BigQuery pour une analyse et des rapports plus approfondis. Vous pouvez obtenir des insights précieux et améliorer vos résultats commerciaux.
Le schéma suivant décrit comment les données GA4 sont disponibles via la charge de travail marketing de la couche Data Foundation de Cortex Framework :

Fichier de configuration
Le fichier config.json configure les paramètres requis pour se connecter aux sources de données afin de transférer les données de différentes charges de travail. Ce fichier contient les paramètres suivants pour GA4 :
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
Le tableau suivant décrit la valeur de chaque paramètre marketing :
| Paramètre | Signification | Valeur par défaut | Description |
marketing.deployGA4
|
Déployer GA4 | true
|
Exécutez le déploiement pour la source de données GA4. |
marketing.GA4.datasets.cdc
|
Ensembles de données BigQuery Export pour GA4 | [{"property_id": 0, "name": ""}]
|
Tableau des ensembles de données Google Analytics 4 BigQuery Export. Chaque élément spécifie Property ID comme INT, ainsi que le nom de l'ensemble de données BigQuery Export correspondant.
|
marketing.GA4.datasets.reporting
|
Ensemble de données de reporting pour GA4 | REPORTING_GA4
|
Ensemble de données de reporting pour GA4. |
Modèle de données
Cette section décrit le modèle de données GA4 à l'aide du diagramme entité-relation (ERD).
Vues de base
Il s'agit des objets bleus du diagramme entité-relation. Ce sont des vues sur les tables CDC avec des transformations minimales pour décompresser les structures de données complexes. Consultez les scripts dans src/marketing/src/GA4/src/reporting/ddls.
Vues de rapports
Il s'agit des objets verts du diagramme entité-relation. Ce sont des vues de reporting qui contiennent des métriques agrégées. Consultez les scripts dans src/marketing/src/GA4/src/reporting/ddls.
Configurer l'intégration pour GA4
La fondation de données Cortex Framework s'intègre à GA4 en créant une couche de reporting au-dessus des ensembles de données BigQuery Export de GA4 (traités comme des ensembles de données CDC dans l'architecture Cortex Framework). Pour ce faire, il crée des vues d'exécution au-dessus des tables CDC ou exécute des DAG Managed Service for Apache Airflow pour les données matérialisées dans les tables BigQuery, en fonction de la configuration des paramètres de création de rapports.
Configurer GA4 BigQuery Export
Cortex Framework utilise la fonctionnalité BigQuery Export de GA4 pour charger les données du système source dans BigQuery. Suivez les instructions pour configurer BigQuery Export ou chaque propriété GA4 dans cet article de l'aide GA4 : GA4 – Configurer BigQuery Export.
Problèmes connus, limites et autres considérations
Tenez compte des points suivants lorsque vous configurez GA4 BigQuery Export :
- Remplissage des données : GA4 BigQuery Export commence à exporter les données le jour où il est configuré. Il n'y a pas de remplissage des données.
- Différence entre les chiffres de l'interface utilisateur GA4 et de Cortex Framework Cortex : Plusieurs facteurs, y compris, mais sans s'y limiter, l'échantillonnage, le délai de collecte des données et les rapports à cardinalité élevée, peuvent entraîner des écarts mineurs entre l'interface utilisateur Google Analytics et le Cortex Framework. Il s'agit d'une limitation connue et inhérente à Google Analytics. Pour en savoir plus, consultez Combler l'écart entre l'interface utilisateur Google Analytics et BigQuery Export .
- Restrictions sur le volume d'exportation d'événements : selon votre édition Google Analytics, vous pouvez être soumis à des restrictions de volume d'exportation BigQuery par jour plus ou moins importantes. Pour en savoir plus, consultez GA4 : configurer BigQuery Export.
- Fuseau horaire : dans BigQuery Export,
event_dateest défini sur le fuseau horaire des rapports de la propriété, tandis queevent_timestampcorrespond au code temporel UTC en microsecondes. Par conséquent, sievent_timestampest utilisé, veillez à l'ajuster au bon fuseau horaire pour les rapports lorsque vous le comparez aux chiffres de l'UI. - Exportations quotidiennes et en flux continu (en temps réel) des événements : pour les exportations d'événements, Cortex Framework n'accepte que les tables
events_YYYYMMDDcréées par l'exportation quotidienne complète. Pour en savoir plus, consultez GA4 – BigQuery Export. - Contrat de niveau de service GA4 360 pour BigQuery Export :
Bien que le framework Cortex ne soit pas compatible avec les tables
events_fresh_créées par les exportations quotidiennes à jour en tant que tables sources distinctes, vous pouvez suivre les commentaires de personnalisation##CORTEX-CUSTOMERdans la vue de rapportEventspour remplacer les tables sources par celles-ci, afin de profiter du contrat de niveau de service fourni par cette fonctionnalité. Toutes les vues de rapports continueront de fonctionner après cette substitution.
Fraîcheur et délai des données
En règle générale, la fraîcheur des données pour les sources de données Cortex Framework est limitée par ce que permet la connexion en amont, ainsi que par la fréquence d'exécution de votre DAG. Ajustez la fréquence d'exécution de votre DAG pour l'adapter à la fréquence en amont, aux contraintes de ressources et aux besoins de votre entreprise.
Avec Google Analytics 4, les données BigQuery Export peuvent être retardées d'un jour maximum selon votre fuseau horaire, sauf si vous utilisez l'exportation quotidienne des données récentes.
Configurations
Cette section décrit les configurations du processus de données.
Connexions Managed Service pour Apache Airflow
Créez les connexions suivantes dans Managed Airflow. Pour en savoir plus, consultez la documentation sur la gestion des connexions Airflow.
| Nom de la connexion | Purpose |
dv360_cdc_bq
|
Pour le transfert d'ensemble de données brutes > ensemble de données CDC. |
dv360_reporting_bq
|
Pour le transfert de l'ensemble de données CDC vers l'ensemble de données de reporting. |
Paramètres de création de rapports
Vous pouvez configurer et contrôler la façon dont Cortex Framework génère des données pour la couche de reporting finale GA4 à l'aide du fichier de paramètres de reporting src/GA4/config/reporting_settings.yaml. Ce fichier contrôle la façon dont les objets BigQuery de la couche de reporting (tables, vues,fonctions ou procédures stockées) sont générés.
Pour en savoir plus, consultez Personnaliser le fichier de paramètres de création de rapports.
Étape suivante
- Pour en savoir plus sur les autres sources de données et charges de travail, consultez Sources de données et charges de travail.
- Pour en savoir plus sur les étapes de déploiement dans les environnements de production, consultez Conditions préalables au déploiement de la Data Foundation de Cortex Framework.
