Integração com o Google Analytics 4
Esta página descreve as configurações necessárias para trazer dados do Google Analytics 4 (GA4) como uma fonte de dados da carga de trabalho de marketing da base de dados do Cortex Framework.
O GA4 é a versão mais recente do Google Analytics. Ele oferece uma visão holística do comportamento do usuário, com foco no rastreamento baseado em eventos e no aprendizado de máquina para oferecer insights mais detalhados. O Cortex Framework permite extrair dados do GA4 e integrá-los ao BigQuery para análise e relatórios mais detalhados. Você pode gerar insights valiosos e melhorar os resultados de negócios.
O diagrama a seguir descreve como os dados do GA4 estão disponíveis na carga de trabalho de marketing da base de dados do Cortex Framework:

Arquivo de configuração
O config.json
arquivo configura as definições necessárias para se conectar a fontes de dados para transferir
dados de várias cargas de trabalho. Esse arquivo contém os seguintes parâmetros para o GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
A tabela a seguir descreve o valor de cada parâmetro de marketing:
| Parâmetro | Significado | Valor padrão | Descrição |
marketing.deployGA4
|
Implantar o GA4 | true
|
Executar a implantação da fonte de dados do GA4. |
marketing.GA4.datasets.cdc
|
Conjuntos de dados do BigQuery Export para o GA4 | [{"property_id": 0, "name": ""}]
|
Matriz de conjuntos de dados do BigQuery
Export do Google Analytics 4. Cada elemento especifica Property ID como
INT, bem como o nome do conjunto de dados do BigQuery Export correspondente.
|
marketing.GA4.datasets.reporting
|
Conjunto de dados de relatórios para o GA4 | REPORTING_GA4
|
Conjunto de dados de relatórios para o GA4. |
Modelo de dados
Esta seção descreve o modelo de dados do GA4 usando o diagrama de relacionamento de entidades (ERD, na sigla em inglês).
Visualizações básicas
Esses são os objetos azuis no ERD e são visualizações em tabelas de CDC com transformações mínimas para descompactar estruturas de dados complexas. Consulte scripts em
src/marketing/src/GA4/src/reporting/ddls.
Visualizações de relatórios
Esses são os objetos verdes no ERD e são visualizações de relatórios que contêm métricas agregadas. Consulte scripts em
src/marketing/src/GA4/src/reporting/ddls.
Configurar a integração do GA4
A base de dados do Cortex Framework se integra ao GA4 criando uma camada de relatórios sobre os conjuntos de dados do BigQuery Export do GA4 (tratados como conjuntos de dados de CDC na arquitetura do Cortex Framework). Isso é feito criando visualizações de execução nas tabelas de CDC ou executando DAGs do Serviço Gerenciado para Apache Airflow para dados materializados em tabelas do BigQuery dependendo da configuração das definições de relatórios.
Configurar o BigQuery Export do GA4
O Cortex Framework usa o recurso BigQuery Export do GA4 para carregar dados do sistema de origem no BigQuery. Siga as instruções para configurar o BigQuery Export ou cada propriedade do GA4 neste artigo da Ajuda do GA4: GA4: configurar o BigQuery Export.
Problemas, limitações e outras considerações conhecidas
Considere o seguinte ao configurar o BigQuery Export do GA4:
- Preenchimento retroativo: o BigQuery Export do GA4 começa no dia em que é configurado, e não há preenchimento retroativo.
- Diferença entre UI do GA4 e os números informados do Cortex Framework: vários fatores, incluindo, entre outros, amostragem, atraso na coleta de dados, e relatórios de alta cardinalidade, podem causar uma pequena discrepância entre a interface do Google Analytics e o Cortex Framework. Essa é uma limitação conhecida e inerente do Google Analytics. Para mais informações, consulte Reduzir a lacuna entre a interface do Google Analytics e o BigQuery Export .
- Restrições de volume de exportação de eventos: dependendo da sua edição do Google Analytics, você pode enfrentar um grau variável de restrição de volume de exportação do BigQuery por dia. Para mais informações, consulte GA4: configurar o BigQuery Export.
- Fuso horário: no BigQuery Export,
event_dateé definido no fuso horário do relatório da propriedade , enquantoevent_timestampé o carimbo de data/hora UTC em microssegundos. Como resultado, seevent_timestampfor usado, ajuste para o fuso horário correto do relatório ao comparar com os números da UI. - Exportações de eventos diárias x de streaming (em tempo real): para exportações de eventos,
o Cortex Framework só oferece suporte às tabelas
events_YYYYMMDDcriadas pela exportação diária completa. Para mais informações, consulte GA4: BigQuery Export. - Contrato de nível de serviço (SLA) do GA4 360 para o BigQuery Export:
embora o Cortex Framework não ofereça suporte às tabelas
events_fresh_criadas por exportações diárias como tabelas de origem separadas, você pode seguir os comentários de personalização##CORTEX-CUSTOMERna vista de relatóriosEventspara substituir as tabelas de origem por elas e aproveitar o SLA fornecido por esse recurso. Todas as visualizações de relatórios continuarão funcionando após essa substituição.
Atualização e atraso de dados
Como regra geral, a atualização de dados para fontes de dados do Cortex Framework é limitada pelo que a conexão upstream permite, bem como pela frequência de execução do DAG. Ajuste a frequência de execução do DAG para se alinhar à frequência upstream, às restrições de recursos e às necessidades de negócios.
Com o Google Analytics 4, a exportação do BigQuery pode ser atrasada em até um dia, dependendo do fuso horário, a menos que você esteja usando a exportação diária.
Configurações
Esta seção descreve as configurações do processo de dados.
Serviço Gerenciado para Apache Airflow: conexões
Crie as seguintes conexões no Airflow gerenciado. Confira mais detalhes na documentação Gerenciar conexões do Airflow.
| Nome da conexão | Purpose |
dv360_cdc_bq
|
Para transferência de conjunto de dados bruto > conjunto de dados de CDC. |
dv360_reporting_bq
|
Para transferência de conjunto de dados de CDC > conjunto de dados de relatórios. |
Configurações de relatório
É possível configurar e controlar como o Cortex Framework gera dados para a camada de relatórios final do GA4 usando o arquivo de configurações de relatórios src/GA4/config/reporting_settings.yaml. Esse arquivo controla como os objetos do BigQuery da camada de relatórios (tabelas, visualizações,funções ou procedimentos armazenados) são gerados.
Para mais informações, consulte Como personalizar o arquivo de configurações de relatórios.
A seguir
- Para mais informações sobre outras fontes de dados e cargas de trabalho, consulte Fontes de dados e cargas de trabalho.
- Para mais informações sobre as etapas de implantação em ambientes de produção, consulte Pré-requisitos de implantação da base de dados do Cortex Framework.
