Google 애널리틱스 4와의 통합

이 페이지에서는 Cortex Framework Data Foundation의 마케팅 워크로드 데이터 소스로 Google 애널리틱스 4 (GA4)의 데이터를 가져오는 데 필요한 구성을 설명합니다.

GA4는 Google 애널리틱스의 최신 버전입니다. 이 도구는 이벤트 기반 추적과 머신러닝에 중점을 두어 사용자 행동을 전체적으로 파악하고 더 심층적인 통계를 제공합니다. Cortex Framework를 사용하면 GA4에서 데이터를 추출하고 BigQuery에 통합하여 추가 분석 및 보고를 할 수 있습니다. 가치 있는 통계를 얻고 비즈니스 실적을 개선할 수 있습니다.

다음 다이어그램은 Cortex Framework Data Foundation의 마케팅 워크로드를 통해 GA4 데이터를 사용할 수 있는 방법을 설명합니다.

GA4 데이터 소스

그림 1. GA4 데이터 소스입니다.

구성 파일

config.json 파일은 다양한 워크로드에서 데이터를 전송하기 위해 데이터 소스에 연결하는 데 필요한 설정을 구성합니다. 이 파일에는 GA4의 다음 매개변수가 포함되어 있습니다.

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

다음 표에서는 각 마케팅 매개변수의 값을 설명합니다.

매개변수 의미 기본값 설명
marketing.deployGA4 GA4 배포 true GA4 데이터 소스의 배포를 실행합니다.
marketing.GA4.datasets.cdc GA4용 BigQuery Export 데이터 세트 [{"property_id": 0, "name": ""}] Google 애널리틱스 4 BigQuery 내보내기 데이터 세트의 배열입니다. 각 요소는 Property IDINT로 지정하고 해당 BigQuery Export 데이터 세트 이름을 지정합니다.
marketing.GA4.datasets.reporting GA4의 보고 데이터 세트 REPORTING_GA4 GA4의 보고 데이터 세트입니다.

데이터 모델

이 섹션에서는 엔티티 관계 다이어그램 (ERD)을 사용하여 GA4 데이터 모델을 설명합니다.

GA4의 엔티티 관계 다이어그램

그림 2. GA4: 엔티티 관계 다이어그램

기본 뷰

이는 ERD의 파란색 객체이며 복잡한 데이터 구조를 압축 해제하기 위한 최소한의 변환이 적용된 CDC 테이블의 뷰입니다. src/marketing/src/GA4/src/reporting/ddls의 스크립트를 참고하세요.

보고 보기

ERD의 녹색 객체이며 집계 측정항목이 포함된 보고 뷰입니다. src/marketing/src/GA4/src/reporting/ddls의 스크립트를 참고하세요.

GA4 통합 구성

Cortex Framework 데이터 기반은 Cortex Framework 아키텍처에서 CDC 데이터 세트로 처리되는 GA4의 BigQuery Export 데이터 세트 위에 보고 레이어를 만들어 GA4와 통합됩니다. 이는 보고 설정 구성에 따라 CDC 테이블 위에 런타임 뷰를 만들거나 BigQuery 테이블의 구체화된 데이터에 Managed Service for Apache Airflow DAG를 실행하여 달성됩니다.

GA4 BigQuery Export 설정

Cortex Framework는 GA4의 BigQuery Export 기능을 사용하여 소스 시스템의 데이터를 BigQuery에 로드합니다. 이 GA4 도움말(GA4 - BigQuery Export 설정)의 BigQuery Export 또는 각 GA4 속성 설정 안내를 따르세요.

알려진 문제, 제한사항, 기타 고려사항

GA4 BigQuery Export를 설정할 때는 다음 사항을 고려하세요.

  • 데이터 채우기: GA4 BigQuery Export는 설정된 날짜부터 시작되며 데이터 채우기는 없습니다.
  • GA4 UI와 Cortex Framework에 보고된 수치 간의 차이: 샘플링, 데이터 수집 지연, 카디널리티가 높은 보고서 등 여러 요인으로 인해 Google 애널리틱스 UI와 Cortex Framework 간에 약간의 불일치가 발생할 수 있습니다. 이는 Google 애널리틱스의 알려진 내재적 제한사항입니다. 자세한 내용은 Google 애널리틱스 UI와 BigQuery 내보내기 간의 격차 해소 를 참고하세요.
  • 이벤트 내보내기하는 데이터의 양 제한: Google 애널리틱스 버전에 따라 일일 BigQuery 내보내기하는 데이터의 양 제한이 다를 수 있습니다. 자세한 내용은 GA4 - BigQuery Export 설정하기를 참고하세요.
  • 시간대: BigQuery Export에서 event_date속성의 보고 시간대로 설정되고 event_timestamp는 마이크로초 단위의 UTC 타임스탬프입니다. 따라서 event_timestamp를 사용하는 경우 UI 번호와 비교할 때 올바른 보고 시간대로 조정해야 합니다.
  • 일일 이벤트 내보내기와 스트리밍 (실시간) 이벤트 내보내기: 이벤트 내보내기의 경우 Cortex Framework는 전체 일일 내보내기로 생성된 events_YYYYMMDD 테이블만 지원합니다. 자세한 내용은 GA4 - BigQuery Export를 참고하세요.
  • BigQuery Export용 GA4 360 서비스수준계약 (SLA): Cortex Framework는 일일 업데이트 내보내기로 생성된 events_fresh_ 테이블을 별도의 소스 테이블로 지원하지 않지만 Events 보고서 보기의 ##CORTEX-CUSTOMER 맞춤설정 주석에 따라 소스 테이블을 이러한 테이블로 대체하여 이 기능에서 제공하는 SLA를 활용할 수 있습니다. 이 대체 후에도 모든 보고 보기의 작동은 계속됩니다.

데이터 업데이트 빈도 및 지연

일반적으로 Cortex Framework 데이터 소스의 데이터 기록 빈도는 업스트림 연결에서 허용하는 사항과 DAG 실행 빈도에 따라 제한됩니다. 업스트림 빈도, 리소스 제약, 비즈니스 요구사항에 맞게 DAG 실행 빈도를 조정합니다.

Google 애널리틱스 4를 사용하는 경우 일일 업데이트 내보내기를 사용하지 않는 한 시간대에 따라 BigQuery Export 데이터가 최대 하루까지 지연될 수 있습니다.

구성

이 섹션에서는 데이터 처리의 구성을 설명합니다.

Managed Service for Apache Airflow 연결

관리형 Airflow에서 다음 연결을 만듭니다. 자세한 내용은 Airflow 연결 관리 문서를 참고하세요.

연결 이름 목적
dv360_cdc_bq 원시 데이터 세트 > CDC 데이터 세트 전송
dv360_reporting_bq CDC 데이터 세트 > 보고 데이터 세트 전송

보고서 설정

보고 설정 파일 src/GA4/config/reporting_settings.yaml를 사용하여 Cortex Framework에서 GA4 최종 보고 레이어의 데이터를 생성하는 방식을 구성하고 제어할 수 있습니다. 이 파일은 보고 레이어 BigQuery 객체(테이블, 뷰,함수 또는 저장 프로시저)가 생성되는 방식을 제어합니다.

자세한 내용은 보고 설정 파일 맞춤설정을 참고하세요.

다음 단계