Integração com o Google Analytics 4

Esta página descreve as configurações necessárias para trazer dados do Google Analytics 4 (GA4) como uma fonte de dados da carga de trabalho de marketing da base de dados do Cortex Framework.

O GA4 é a versão mais recente do Google Analytics. Ele oferece uma visão holística do comportamento do usuário, com foco no rastreamento baseado em eventos e no aprendizado de máquina para oferecer insights mais detalhados. O Cortex Framework permite extrair dados do GA4 e integrá-los ao BigQuery para análise e relatórios mais detalhados. Você pode gerar insights valiosos e melhorar os resultados de negócios.

O diagrama a seguir descreve como os dados do GA4 estão disponíveis na carga de trabalho de marketing da base de dados do Cortex Framework:

Fonte de dados do GA4

Figura 1. Fonte de dados do GA4.

Arquivo de configuração

O config.json arquivo configura as definições necessárias para se conectar a fontes de dados para transferir dados de várias cargas de trabalho. Esse arquivo contém os seguintes parâmetros para o GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

A tabela a seguir descreve o valor de cada parâmetro de marketing:

Parâmetro Significado Valor padrão Descrição
marketing.deployGA4 Implantar o GA4 true Executar a implantação da fonte de dados do GA4.
marketing.GA4.datasets.cdc Conjuntos de dados do BigQuery Export para o GA4 [{"property_id": 0, "name": ""}] Matriz de conjuntos de dados do BigQuery Export do Google Analytics 4. Cada elemento especifica Property ID como INT, bem como o nome do conjunto de dados do BigQuery Export correspondente.
marketing.GA4.datasets.reporting Conjunto de dados de relatórios para o GA4 REPORTING_GA4 Conjunto de dados de relatórios para o GA4.

Modelo de dados

Esta seção descreve o modelo de dados do GA4 usando o diagrama de relacionamento de entidades (ERD, na sigla em inglês).

Diagrama de relacionamento de entidade para o GA4

Figura 2. GA4: diagrama de relacionamento de entidades.

Visualizações básicas

Esses são os objetos azuis no ERD e são visualizações em tabelas de CDC com transformações mínimas para descompactar estruturas de dados complexas. Consulte scripts em src/marketing/src/GA4/src/reporting/ddls.

Visualizações de relatórios

Esses são os objetos verdes no ERD e são visualizações de relatórios que contêm métricas agregadas. Consulte scripts em src/marketing/src/GA4/src/reporting/ddls.

Configurar a integração do GA4

A base de dados do Cortex Framework se integra ao GA4 criando uma camada de relatórios sobre os conjuntos de dados do BigQuery Export do GA4 (tratados como conjuntos de dados de CDC na arquitetura do Cortex Framework). Isso é feito criando visualizações de execução nas tabelas de CDC ou executando DAGs do Serviço Gerenciado para Apache Airflow para dados materializados em tabelas do BigQuery dependendo da configuração das definições de relatórios.

Configurar o BigQuery Export do GA4

O Cortex Framework usa o recurso BigQuery Export do GA4 para carregar dados do sistema de origem no BigQuery. Siga as instruções para configurar o BigQuery Export ou cada propriedade do GA4 neste artigo da Ajuda do GA4: GA4: configurar o BigQuery Export.

Problemas, limitações e outras considerações conhecidas

Considere o seguinte ao configurar o BigQuery Export do GA4:

  • Preenchimento retroativo: o BigQuery Export do GA4 começa no dia em que é configurado, e não há preenchimento retroativo.
  • Diferença entre UI do GA4 e os números informados do Cortex Framework: vários fatores, incluindo, entre outros, amostragem, atraso na coleta de dados, e relatórios de alta cardinalidade, podem causar uma pequena discrepância entre a interface do Google Analytics e o Cortex Framework. Essa é uma limitação conhecida e inerente do Google Analytics. Para mais informações, consulte Reduzir a lacuna entre a interface do Google Analytics e o BigQuery Export .
  • Restrições de volume de exportação de eventos: dependendo da sua edição do Google Analytics, você pode enfrentar um grau variável de restrição de volume de exportação do BigQuery por dia. Para mais informações, consulte GA4: configurar o BigQuery Export.
  • Fuso horário: no BigQuery Export, event_date é definido no fuso horário do relatório da propriedade , enquanto event_timestamp é o carimbo de data/hora UTC em microssegundos. Como resultado, se event_timestamp for usado, ajuste para o fuso horário correto do relatório ao comparar com os números da UI.
  • Exportações de eventos diárias x de streaming (em tempo real): para exportações de eventos, o Cortex Framework só oferece suporte às tabelas events_YYYYMMDD criadas pela exportação diária completa. Para mais informações, consulte GA4: BigQuery Export.
  • Contrato de nível de serviço (SLA) do GA4 360 para o BigQuery Export: embora o Cortex Framework não ofereça suporte às tabelas events_fresh_criadas por exportações diárias como tabelas de origem separadas, você pode seguir os comentários de personalização ##CORTEX-CUSTOMER na vista de relatórios Eventspara substituir as tabelas de origem por elas e aproveitar o SLA fornecido por esse recurso. Todas as visualizações de relatórios continuarão funcionando após essa substituição.

Atualização e atraso de dados

Como regra geral, a atualização de dados para fontes de dados do Cortex Framework é limitada pelo que a conexão upstream permite, bem como pela frequência de execução do DAG. Ajuste a frequência de execução do DAG para se alinhar à frequência upstream, às restrições de recursos e às necessidades de negócios.

Com o Google Analytics 4, a exportação do BigQuery pode ser atrasada em até um dia, dependendo do fuso horário, a menos que você esteja usando a exportação diária.

Configurações

Esta seção descreve as configurações do processo de dados.

Serviço Gerenciado para Apache Airflow: conexões

Crie as seguintes conexões no Airflow gerenciado. Confira mais detalhes na documentação Gerenciar conexões do Airflow.

Nome da conexão Purpose
dv360_cdc_bq Para transferência de conjunto de dados bruto > conjunto de dados de CDC.
dv360_reporting_bq Para transferência de conjunto de dados de CDC > conjunto de dados de relatórios.

Configurações de relatório

É possível configurar e controlar como o Cortex Framework gera dados para a camada de relatórios final do GA4 usando o arquivo de configurações de relatórios src/GA4/config/reporting_settings.yaml. Esse arquivo controla como os objetos do BigQuery da camada de relatórios (tabelas, visualizações,funções ou procedimentos armazenados) são gerados.

Para mais informações, consulte Como personalizar o arquivo de configurações de relatórios.

A seguir