Integración con Google Analytics 4

En esta página, se describen las configuraciones necesarias para incorporar datos de Google Analytics 4 (GA4) como fuente de datos de la carga de trabajo de marketing de la base de datos de Cortex Framework.

GA4 es la versión más reciente de Google Analytics. Proporciona una visión integral del comportamiento del usuario, enfocándose en el seguimiento basado en eventos y el aprendizaje automático para ofrecer estadísticas más detalladas. Cortex Framework te permite extraer datos de GA4 y, luego, integrarlos en BigQuery para generar informes y realizar análisis más detallados. Puedes obtener estadísticas valiosas y generar mejores resultados comerciales.

En el siguiente diagrama, se describe cómo los datos de GA4 están disponibles a través de la carga de trabajo de marketing de la base de datos de Cortex Framework:

Fuente de datos de GA4

Figura 1. Es la fuente de datos de GA4.

Archivo de configuración

El archivo config.json configura los parámetros necesarios para conectarse a las fuentes de datos y transferir datos de diversas cargas de trabajo. Este archivo contiene los siguientes parámetros para GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

En la siguiente tabla, se describe el valor de cada parámetro de marketing:

Parámetro Significado Valor predeterminado Descripción
marketing.deployGA4 Implementa GA4 true Ejecuta la implementación para la fuente de datos de GA4.
marketing.GA4.datasets.cdc Conjuntos de datos de BigQuery Export para GA4 [{"property_id": 0, "name": ""}] Es un array de conjuntos de datos de exportación de BigQuery de Google Analytics 4. Cada elemento especifica Property ID como INT, así como el nombre del conjunto de datos de la exportación de BigQuery correspondiente.
marketing.GA4.datasets.reporting Conjunto de datos de informes para GA4 REPORTING_GA4 Es el conjunto de datos de informes para GA4.

Modelo de datos

En esta sección, se describe el modelo de datos de GA4 con el diagrama de relación entre entidades (ERD).

Diagrama de relación entre entidades para GA4

Figura 2: GA4: Diagrama de relación entre entidades.

Vistas base

Estos son los objetos azules en el DER y son vistas de las tablas de CDC con transformaciones mínimas para desempaquetar estructuras de datos complejas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls.

Vistas de informes

Estos son los objetos verdes en el DER y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls.

Cómo configurar la integración para GA4

La base de datos de Cortex Framework se integra con GA4 creando una capa de informes sobre los conjuntos de datos de BigQuery Export de GA4 (tratados como conjuntos de datos de CDC en la arquitectura de Cortex Framework). Esto se logra creando vistas de tiempo de ejecución sobre las tablas de CDC o ejecutando DAGs de Managed Service para Apache Airflow para los datos materializados en las tablas de BigQuery, según la configuración de los parámetros de informes.

Configura la exportación de BigQuery de GA4

Cortex Framework usa la función BigQuery Export de GA4 para cargar datos del sistema fuente en BigQuery. Sigue las instrucciones para configurar BigQuery Export o cada propiedad de GA4 en este artículo de ayuda de GA4: GA4: Configura BigQuery Export.

Problemas conocidos, limitaciones y otras consideraciones

Ten en cuenta lo siguiente cuando configures BigQuery Export de GA4:

  • Carga retroactiva: La exportación a BigQuery de GA4 comienza el día en que se configura y no hay carga retroactiva.
  • Diferencia entre la IU de GA4 y las cifras informadas del Cortex Framework: Varios factores, incluidos, sin limitaciones, el muestreo, la demora en la recopilación de datos y los informes de alta cardinalidad, pueden causar una pequeña discrepancia entre la IU de Google Analytics y el Cortex Framework. Esta es una limitación conocida e inherente de Google Analytics. Para obtener más información, consulta Cómo cerrar la brecha entre la IU de Google Analytics y BigQuery Export .
  • Restricciones de volumen de exportación de eventos: Según tu edición de Google Analytics, es posible que enfrentes diferentes grados de restricción de volumen de exportación de BigQuery por día. Para obtener más información, consulta GA4: Configura BigQuery Export.
  • Zona horaria: En BigQuery Export, event_date se establece en la zona horaria de los informes de la propiedad, mientras que event_timestamp es la marca de tiempo en microsegundos UTC. Por lo tanto, si se usa event_timestamp, asegúrate de realizar los ajustes necesarios para la zona horaria correcta de los informes cuando compares los números con los de la IU.
  • Exportaciones de eventos diarias y de transmisión (en tiempo real): Para las exportaciones de Event, el Cortex Framework solo admite las tablas events_YYYYMMDD creadas por la exportación diaria completa. Para obtener más información, consulta GA4: BigQuery Export.
  • Acuerdo de Nivel de Servicio (ANS) de GA4 360 para BigQuery Export: Si bien Cortex Framework no admite las tablas de events_fresh_ creadas por las exportaciones con actualización diaria como tablas de origen independientes, puedes seguir los comentarios de personalización de ##CORTEX-CUSTOMER en la vista de informes de Events para reemplazar las tablas de origen por estas y aprovechar el ANS que proporciona esta función. Todas las vistas de Informes seguirán funcionando después de este reemplazo.

Actualidad y demora de los datos

Como regla general, la actualización de los datos de las fuentes de datos de Cortex Framework está limitada por lo que permite la conexión upstream, así como por la frecuencia de ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para que se alinee con la frecuencia de los procesos ascendentes, las restricciones de recursos y las necesidades de tu empresa.

Con Google Analytics 4, los datos de la exportación de BigQuery pueden demorarse hasta un día según tu zona horaria, a menos que uses la exportación con actualización diaria.

Parámetros de configuración

En esta sección, se describen las configuraciones del proceso de datos.

Conexiones de Managed Service para Apache Airflow

Crea las siguientes conexiones en Managed Airflow. Para obtener más detalles, consulta la documentación sobre cómo administrar conexiones de Airflow.

Nombre de la conexión Purpose
dv360_cdc_bq Para la transferencia de conjuntos de datos sin procesar > conjuntos de datos de CDC.
dv360_reporting_bq Para la transferencia de datos del conjunto de datos de CDC al conjunto de datos de informes.

Configuración de informes

Puedes configurar y controlar cómo Cortex Framework genera datos para la capa de informes final de GA4 con el archivo de configuración de informes src/GA4/config/reporting_settings.yaml. Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).

Para obtener más información, consulta Cómo personalizar el archivo de configuración de informes.

Próximos pasos