Intégration à Google Analytics 4

Cette page décrit les configurations requises pour importer des données de Google Analytics 4 (GA4) en tant que source de données de la charge de travail marketing de Cortex Framework Data Foundation.

GA4 est la dernière version de Google Analytics. Elle offre une vue globale du comportement des utilisateurs, en se concentrant sur le suivi basé sur les événements et le machine learning pour fournir des insights plus approfondis. Cortex Framework vous permet d'extraire des données de GA4 et de les intégrer à BigQuery pour une analyse et des rapports plus approfondis. Vous pouvez ainsi obtenir des insights précieux et améliorer vos résultats commerciaux.

Le schéma suivant décrit comment les données GA4 sont disponibles via la charge de travail marketing de Cortex Framework Data Foundation :

Source de données GA4

Figure 1. Source de données GA4.

Fichier de configuration

Le config.json fichier configure les paramètres requis pour se connecter aux sources de données afin de transférer des données à partir de différentes charges de travail. Ce fichier contient les paramètres suivants pour GA4 :

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

Le tableau suivant décrit la valeur de chaque paramètre marketing :

Paramètre Signification Valeur par défaut Description
marketing.deployGA4 Déployer GA4 true Exécutez le déploiement pour la source de données GA4.
marketing.GA4.datasets.cdc Ensembles de données BigQuery Export pour GA4 [{"property_id": 0, "name": ""}] Tableau d'ensembles de données Google Analytics 4 BigQuery Export. Chaque élément spécifie Property ID comme INT, ainsi que le nom de l'ensemble de données BigQuery Export correspondant.
marketing.GA4.datasets.reporting Ensemble de données de création de rapports pour GA4 REPORTING_GA4 Ensemble de données de création de rapports pour GA4.

Modèle de données

Cette section décrit le modèle de données GA4 à l'aide du diagramme entité-association.

Diagramme entité-relation pour GA4

Figure 2. GA4 : diagramme entité-association.

Vues de base

Il s'agit des objets bleus du diagramme entité-association. Ce sont des vues sur les tables CDC avec des transformations minimales pour décompresser des structures de données complexes. Consultez les scripts dans src/marketing/src/GA4/src/reporting/ddls.

Vues de rapports

Il s'agit des objets verts du diagramme entité-association. Ce sont des vues de rapports qui contiennent des métriques agrégées. Consultez les scripts dans src/marketing/src/GA4/src/reporting/ddls.

Configurer l'intégration pour GA4

Cortex Framework Data Foundation s'intègre à GA4 en créant une couche de création de rapports au-dessus des ensembles de données BigQuery Export de GA4 (traités comme des ensembles de données CDC dans l'architecture Cortex Framework). Pour ce faire, créez des vues d'exécution au-dessus des tables CDC ou exécutez Managed Service pour Apache Airflow DAG pour les données matérialisées dans les tables BigQuery, en fonction de la configuration des paramètres de création de rapports.

Configurer BigQuery Export pour GA4

Cortex Framework utilise la fonctionnalité BigQuery Export de GA4 pour charger les données du système source dans BigQuery. Suivez les instructions pour configurer BigQuery Export ou chaque propriété GA4 dans cet article d'aide GA4 : GA4 - Configurer BigQuery Export.

Problèmes connus, limites et autres considérations

Tenez compte des points suivants lorsque vous configurez BigQuery Export pour GA4 :

  • Remplissage : BigQuery Export pour GA4 démarre le jour où il est configuré et aucun remplissage n'est effectué.
  • Différence entre l'interface utilisateur GA4 et les chiffres signalés par Cortex Framework: Plusieurs facteurs, y compris, mais sans s'y limiter, l'échantillonnage, le délai de collecte des données, et les rapports à cardinalité élevée, peuvent entraîner un léger écart entre l'interface utilisateur Google Analytics et Cortex Framework. Il s'agit d'une limite connue et inhérente à Google Analytics. Pour en savoir plus, consultez Combler l'écart entre l'interface utilisateur Google Analytics et BigQuery Export .
  • Restrictions sur le volume d'exportation d'événements : selon votre édition Google Analytics, vous pouvez être confronté à différents niveaux de restriction du volume d'exportation BigQuery par jour. Pour en savoir plus, consultez GA4 - Configurer BigQuery Export.
  • Fuseau horaire : dans BigQuery Export, event_date est défini dans le fuseau horaire de création de rapports de la propriété , tandis que event_timestamp est l'horodatage UTC en microsecondes. Par conséquent, si event_timestamp est utilisé, veillez à l'ajuster au fuseau horaire de création de rapports approprié lorsque vous le comparez aux chiffres de l'interface utilisateur.
  • Exportations d'événements quotidiennes et en flux continu (en temps réel) : pour les exportations Événement , Cortex Framework n'est compatible qu'avec les tables events_YYYYMMDD créées par l'exportation quotidienne complète. Pour en savoir plus, consultez GA4 - BigQuery Export.
  • Contrat de niveau de service (SLA) GA4 360 pour BigQuery Export: bien que Cortex Framework ne soit pas compatible avec les tables events_fresh_créées par les exportations Mise à jour quotidienne en tant que tables sources distinctes, vous pouvez suivre les commentaires de personnalisation ##CORTEX-CUSTOMER dans la vue de rapports Eventspour remplacer les tables sources par celles-ci, afin de profiter du contrat de niveau de service fourni par cette fonctionnalité. Toutes les vues de rapports continueront de fonctionner après cette substitution.

Fraîcheur et délai des données

En règle générale, la fraîcheur des données pour les sources de données Cortex Framework est limitée par ce que la connexion en amont autorise, ainsi que par la fréquence d'exécution de votre DAG. Ajustez la fréquence d'exécution de votre DAG pour l'aligner sur la fréquence en amont, les contraintes de ressources et vos besoins commerciaux.

Avec Google Analytics 4, les données d'exportation BigQuery peuvent être retardées jusqu'à un jour en fonction de votre fuseau horaire, sauf si vous utilisez l'exportation Mise à jour quotidienne.

Configurations

Cette section décrit les configurations du processus de données.

Connexions Managed Service pour Apache Airflow

Créez les connexions suivantes dans Managed Airflow. Pour en savoir plus, consultez la documentation Gérer les connexions Airflow.

Nom de la connexion Purpose
dv360_cdc_bq Pour le transfert de l'ensemble de données brutes vers l'ensemble de données CDC.
dv360_reporting_bq Pour le transfert de l'ensemble de données CDC vers l'ensemble de données de création de rapports transfert.

Paramètres de création de rapports

Vous pouvez configurer et contrôler la façon dont Cortex Framework génère des données pour la couche finale de création de rapports GA4 à l'aide du fichier de paramètres de création de rapports src/GA4/config/reporting_settings.yaml. Ce fichier contrôle la façon dont les objets BigQuery de la couche de création de rapports (tables, vues,fonctions ou procédures stockées) sont générés.

Pour en savoir plus, consultez Personnaliser le fichier de paramètres de création de rapports.

Étape suivante