Intégration à Google Analytics 4
Cette page décrit les configurations requises pour importer des données de Google Analytics 4 (GA4) en tant que source de données de la charge de travail marketing de Cortex Framework Data Foundation.
GA4 est la dernière version de Google Analytics. Elle offre une vue globale du comportement des utilisateurs, en se concentrant sur le suivi basé sur les événements et le machine learning pour fournir des insights plus approfondis. Cortex Framework vous permet d'extraire des données de GA4 et de les intégrer à BigQuery pour une analyse et des rapports plus approfondis. Vous pouvez ainsi obtenir des insights précieux et améliorer vos résultats commerciaux.
Le schéma suivant décrit comment les données GA4 sont disponibles via la charge de travail marketing de Cortex Framework Data Foundation :

Fichier de configuration
Le config.json
fichier configure les paramètres requis pour se connecter aux sources de données afin de transférer
des données à partir de différentes charges de travail. Ce fichier contient les paramètres suivants pour GA4 :
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
Le tableau suivant décrit la valeur de chaque paramètre marketing :
| Paramètre | Signification | Valeur par défaut | Description |
marketing.deployGA4
|
Déployer GA4 | true
|
Exécutez le déploiement pour la source de données GA4. |
marketing.GA4.datasets.cdc
|
Ensembles de données BigQuery Export pour GA4 | [{"property_id": 0, "name": ""}]
|
Tableau d'ensembles de données Google Analytics 4 BigQuery
Export. Chaque élément spécifie Property ID comme
INT, ainsi que le nom de l'ensemble de données BigQuery Export correspondant.
|
marketing.GA4.datasets.reporting
|
Ensemble de données de création de rapports pour GA4 | REPORTING_GA4
|
Ensemble de données de création de rapports pour GA4. |
Modèle de données
Cette section décrit le modèle de données GA4 à l'aide du diagramme entité-association.
Vues de base
Il s'agit des objets bleus du diagramme entité-association. Ce sont des vues sur les tables CDC avec des transformations minimales pour décompresser des structures de données complexes. Consultez les scripts dans
src/marketing/src/GA4/src/reporting/ddls.
Vues de rapports
Il s'agit des objets verts du diagramme entité-association. Ce sont des vues de rapports qui contiennent des métriques agrégées. Consultez les scripts dans
src/marketing/src/GA4/src/reporting/ddls.
Configurer l'intégration pour GA4
Cortex Framework Data Foundation s'intègre à GA4 en créant une couche de création de rapports au-dessus des ensembles de données BigQuery Export de GA4 (traités comme des ensembles de données CDC dans l'architecture Cortex Framework). Pour ce faire, créez des vues d'exécution au-dessus des tables CDC ou exécutez Managed Service pour Apache Airflow DAG pour les données matérialisées dans les tables BigQuery, en fonction de la configuration des paramètres de création de rapports.
Configurer BigQuery Export pour GA4
Cortex Framework utilise la fonctionnalité BigQuery Export de GA4 pour charger les données du système source dans BigQuery. Suivez les instructions pour configurer BigQuery Export ou chaque propriété GA4 dans cet article d'aide GA4 : GA4 - Configurer BigQuery Export.
Problèmes connus, limites et autres considérations
Tenez compte des points suivants lorsque vous configurez BigQuery Export pour GA4 :
- Remplissage : BigQuery Export pour GA4 démarre le jour où il est configuré et aucun remplissage n'est effectué.
- Différence entre l'interface utilisateur GA4 et les chiffres signalés par Cortex Framework: Plusieurs facteurs, y compris, mais sans s'y limiter, l'échantillonnage, le délai de collecte des données, et les rapports à cardinalité élevée, peuvent entraîner un léger écart entre l'interface utilisateur Google Analytics et Cortex Framework. Il s'agit d'une limite connue et inhérente à Google Analytics. Pour en savoir plus, consultez Combler l'écart entre l'interface utilisateur Google Analytics et BigQuery Export .
- Restrictions sur le volume d'exportation d'événements : selon votre édition Google Analytics, vous pouvez être confronté à différents niveaux de restriction du volume d'exportation BigQuery par jour. Pour en savoir plus, consultez GA4 - Configurer BigQuery Export.
- Fuseau horaire : dans BigQuery Export,
event_dateest défini dans le fuseau horaire de création de rapports de la propriété , tandis queevent_timestampest l'horodatage UTC en microsecondes. Par conséquent, sievent_timestampest utilisé, veillez à l'ajuster au fuseau horaire de création de rapports approprié lorsque vous le comparez aux chiffres de l'interface utilisateur. - Exportations d'événements quotidiennes et en flux continu (en temps réel) : pour les exportations Événement ,
Cortex Framework n'est compatible qu'avec les tables
events_YYYYMMDDcréées par l'exportation quotidienne complète. Pour en savoir plus, consultez GA4 - BigQuery Export. - Contrat de niveau de service (SLA) GA4 360 pour BigQuery Export:
bien que Cortex Framework ne soit pas compatible avec les tables
events_fresh_créées par les exportations Mise à jour quotidienne en tant que tables sources distinctes, vous pouvez suivre les commentaires de personnalisation##CORTEX-CUSTOMERdans la vue de rapportsEventspour remplacer les tables sources par celles-ci, afin de profiter du contrat de niveau de service fourni par cette fonctionnalité. Toutes les vues de rapports continueront de fonctionner après cette substitution.
Fraîcheur et délai des données
En règle générale, la fraîcheur des données pour les sources de données Cortex Framework est limitée par ce que la connexion en amont autorise, ainsi que par la fréquence d'exécution de votre DAG. Ajustez la fréquence d'exécution de votre DAG pour l'aligner sur la fréquence en amont, les contraintes de ressources et vos besoins commerciaux.
Avec Google Analytics 4, les données d'exportation BigQuery peuvent être retardées jusqu'à un jour en fonction de votre fuseau horaire, sauf si vous utilisez l'exportation Mise à jour quotidienne.
Configurations
Cette section décrit les configurations du processus de données.
Connexions Managed Service pour Apache Airflow
Créez les connexions suivantes dans Managed Airflow. Pour en savoir plus, consultez la documentation Gérer les connexions Airflow.
| Nom de la connexion | Purpose |
dv360_cdc_bq
|
Pour le transfert de l'ensemble de données brutes vers l'ensemble de données CDC. |
dv360_reporting_bq
|
Pour le transfert de l'ensemble de données CDC vers l'ensemble de données de création de rapports transfert. |
Paramètres de création de rapports
Vous pouvez configurer et contrôler la façon dont Cortex Framework génère des données pour la couche finale de création de rapports GA4 à l'aide du fichier de paramètres de création de rapports src/GA4/config/reporting_settings.yaml. Ce fichier contrôle la façon dont les objets BigQuery de la couche de création de rapports (tables, vues,fonctions ou procédures stockées) sont générés.
Pour en savoir plus, consultez Personnaliser le fichier de paramètres de création de rapports.
Étape suivante
- Pour en savoir plus sur les autres sources de données et charges de travail, consultez Sources de données et charges de travail.
- Pour en savoir plus sur les étapes de déploiement dans les environnements de production, consultez Prérequis pour le déploiement de Cortex Framework Data Foundation.
