Google Ads와 통합
이 페이지에서는 Cortex Framework Data Foundation의 마케팅 워크로드 데이터 소스로 Google Ads의 데이터를 가져오는 데 필요한 구성에 대해 설명합니다.
Google Ads는 비즈니스에서 다양한 Google 서비스 전반에 제품 또는 서비스를 광고할 수 있는 온라인 광고 플랫폼입니다. Cortex Framework는 Google Ads 데이터를 다른 마케팅 채널과 통합하고, 포괄적으로 분석하며, AI를 사용하여 캠페인 결과를 개선합니다.
다음 다이어그램은 Cortex Framework Data Foundation의 마케팅 워크로드를 통해 Google Ads 데이터를 사용할 수 있는 방법을 설명합니다.

구성 파일
config.json 파일은 Google Ads를 비롯한
모든 데이터 소스에서 데이터를 전송하는 데 필요한 설정을 구성합니다. 이 파일에는 Google Ads의 다음 매개변수가 포함되어 있습니다.
"marketing": {
"deployGoogleAds": true,
"GoogleAds": {
"deployCDC": true,
"lookbackDays": 180,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_GoogleAds"
}
}
}
다음 표에서는 각 Google Ads 마케팅 매개변수의 값을 설명합니다.
| 파라미터 | 의미 | 기본값 | 설명 |
marketing.deployGoogleAds
|
Google Ads 배포 | true
|
Google Ads 데이터 소스의 배포를 실행합니다. |
marketing.GoogleAds.deployCDC
|
Google Ads용 CDC 배포 | true
|
관리형 Airflow에서 DAG로 실행할 Google Ads CDC 처리 스크립트를 생성합니다. |
marketing.GoogleAds.lookbackDays
|
Google Ads의 조회 기간 | 180
|
Google Ads API에서 데이터 가져오기를 시작할 일 수입니다. |
marketing.GoogleAds.datasets.cdc
|
Google Ads의 CDC 데이터 세트 | Google Ads의 CDC 데이터 세트입니다. | |
marketing.GoogleAds.datasets.raw
|
Google Ads의 원시 데이터 세트 | Google Ads의 원시 데이터 세트입니다. | |
marketing.GoogleAds.datasets.reporting
|
Google Ads의 보고 데이터 세트 | "REPORTING_GoogleAds"
|
Google Ads의 보고 데이터 세트입니다. |
데이터 모델
이 섹션에서는 ERD (엔티티 관계 다이어그램)를 사용하여 Google Ads 데이터 모델을 설명합니다.
기본 뷰
ERD의 파란색 객체이며 일부 열 이름 별칭 외에는 변환이 없는 CDC 테이블의 뷰입니다.
src/marketing/src/GoogleAds/src/reporting/ddls의 스크립트를 참고하세요.
보고 뷰
ERD의 녹색 객체이며 집계 측정항목이 포함된 보고 뷰입니다.
src/marketing/src/GoogleAds/src/reporting/ddls의 스크립트를 참고하세요.
API 연결
Cortex Framework 수집 템플릿은 Google Ads API 를 사용하여 Google Ads에서 보고 속성 및 측정항목을 가져옵니다. 현재 Cortex Framework 템플릿은 Google Ads API 버전 17.1을 사용합니다. Google Ads API 제한사항을 고려하세요.
- 일일 기본 액세스 작업: 15,000 (유효한
next_page_token이 포함된 페이지가 나뉜 요청은 집계되지 않음) - 최대 페이지 크기: 페이지당 10,000개 행
- 권장되는 기본 매개변수: 페이지 크기는 페이지당 10,000개 행과 같음
API 연결에 대한 자세한 내용은 Google Ads API 참고 리소스를 참고하세요..
계정 인증
계정 인증을 설정하려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 탐색 메뉴 > API 및 서비스 > 사용자 인증 정보 > 사용자 인증 정보 만들기를 클릭합니다.
다음 특성을 사용하여 OAuth 클라이언트 ID 사용자 인증 정보를 만듭니다. 자세한 내용은 OAuth 2.0을 사용하여 Google API에 액세스하기를 참고하세요.
Application type: "Web Application" Name: CHOSEN_NAME #(For example,"Cortex Authentication Client"). Authorized redirect URIs: http://127.0.0.1CHOSEN_NAME을 OAuth 클라이언트 ID 사용자 인증 정보 계정의 선택한 이름으로 바꿉니다.사용자 인증 정보가 구성된 후
Client ID와Client secret를 저장합니다. 이 값은 나중에 필요합니다.OAuth 2.0을 사용하여 Google API에 액세스하기를 사용하여 새 토큰을 생성합니다. Cortex Data Foundation은 토큰을 생성하는 데 사용된 사용자 인증 정보에 액세스할 수 있는 모든 고객(계정)의 데이터를 자동으로 감지하고 수집합니다.
Secret Manager를 사용하여 보안 비밀 을 만듭니다.
- 콘솔에서 Secret Manager 를 클릭합니다.Google Cloud
- 다음 형식을 사용하여
cortex-framework-google-ads-yaml이라는 보안 비밀을 만들고 설정에 따라 값을 변경합니다.
{"developer_token": "DEVELOPER_TOKEN_VALUE", "refresh_token": "REFRESH_TOKEN_VALUE", "client_id": "CLIENT_ID_VALUE", "client_secret": "CLIENT_SECRET_VALUE", "use_proto_plus": False}
다음을 바꿉니다.
DEVELOPER_TOKEN_VALUE를 Google Ads 계정에서 사용할 수 있는 개발자 토큰 값으로 바꿉니다.REFRESH_TOKEN_VALUE를 4단계에서 가져온 갱신 토큰 값으로 바꿉니다.CLIENT_ID_VALUE를 2단계의 OAuth 설정에서 가져온 클라이언트 ID 값으로 바꿉니다.CLIENT_SECRET_VALUE를 2단계의 OAuth 설정에서 가져온 클라이언트 보안 비밀번호 값으로 바꿉니다.
데이터 최신 상태 및 지연 시간
일반적으로 Cortex Framework 데이터 소스의 데이터 기록 빈도는 업스트림 연결에서 허용하는 항목과 DAG 실행 빈도에 따라 제한됩니다. DAG 실행 빈도를 업스트림 빈도, 리소스 제약 조건, 비즈니스 요구사항에 맞게 조정합니다.
Google Ads API 를 사용하여 가져온 데이터는 일반적으로 3시간 이상의 지연 시간으로 제공됩니다. 전환 및 무효 트래픽 감지로 인해 나중에 조정될 수 있습니다. 자세한 내용은 Google Ads 고객센터의 다음 데이터 기록 빈도 정보 도움말을 참고하세요.
Managed Service for Apache Airflow 연결 권한
관리형 Airflow에서 다음 연결을 만듭니다. 자세한 내용은 Airflow 연결 관리 문서를 참고하세요.
| 연결 이름 | 목적 |
googleads_raw_dataflow
|
Google Ads API > BigQuery 원시 데이터 세트 |
googleads_cdc_bq
|
원시 데이터 세트 > CDC 데이터 세트 전송 |
googleads_reporting_bq
|
CDC 데이터 세트 > 보고 데이터 세트 전송 |
관리형 Airflow 서비스 계정 권한
관리형 Airflow에서 사용되는 서비스 계정 (googleads_raw_dataflow 연결에서 구성됨)에 Dataflow 권한을 부여합니다. Dataflow 문서의 안내를 참고하세요.
수집 설정
src/GoogleAds/config/ingestion_settings.yaml 파일의 설정을 통해 Source to Raw 및 Raw to CDC 데이터 파이프라인을 제어합니다. 이 섹션에서는 각 데이터 파이프라인의 매개변수를 설명합니다.
소스에서 원시 테이블로
이 섹션에서는 API에서 가져오는 항목과 가져오는 방법을 설명합니다. 각 항목은 하나의 Google Ads 항목에 해당합니다. 이 구성을 기반으로 Cortex는 Google Ads API를 사용하여 데이터를 가져오는 Dataflow 파이프라인을 실행하는 Airflow DAG를 만듭니다.
다음 매개변수는 각 항목의 Source to Raw 설정을 제어합니다.
| 파라미터 | 설명 |
load_frequency
|
이 항목의 DAG가 Google Ads에서 데이터를 가져오기 위해 실행되는 빈도입니다. 가능한 값에 대한 자세한 내용은 Airflow 문서를 참고하세요. |
api_name
|
API 리소스 이름 (예:
customer)
|
table_name
|
가져온 데이터가 저장되는 원시 데이터 세트의 테이블 (예: customer)
|
schema_file
|
API 응답 필드를 대상 테이블의 열 이름에 매핑하는 src/table_schema
디렉터리의 스키마 파일입니다.
|
key
|
이 테이블의 고유 레코드를 구성하는 열 (쉼표로 구분) |
is_metrics_table
|
지정된 항목이 측정항목 항목 (Google Ads API)인지 나타냅니다. 시스템은 이러한 테이블 의 집계된 특성으로 인해 이러한 테이블을 약간 다르게 처리합니다. |
partition_details
|
선택사항: 성능상의 이유로 이 테이블을 파티션으로 나누려는 경우 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능상의 이유로 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
원시 테이블에서 CDC 테이블로
이 섹션에서는 데이터가 원시 테이블에서 CDC 테이블로 이동하는 방식을 제어하는 항목을 설명합니다. 각 항목은 원시 테이블에 해당하며, 이는 언급된 대로 Google Ads API 항목에 해당합니다.
다음 매개변수는 각 항목의 Raw to CDC 설정을 제어합니다.
| 파라미터 | 설명 |
table_name
|
CDC 변환 후 원시 데이터가 저장되는 CDC 데이터 세트의 테이블 (예: customer)
|
raw_table
|
원시 데이터가 복제된 테이블 |
key
|
이 테이블의 고유 레코드를 구성하는 열 (쉼표로 구분) |
load_frequency
|
이 항목의 DAG가 CDC 테이블을 채우기 위해 실행되는 빈도입니다. 가능한 값에 대한 자세한 내용은, Airflow 문서를 참고하세요. |
schema_file
|
원시 열을 CDC 열 및 CDC 열의 데이터 유형에 매핑하는 src/table_schema
디렉터리의 스키마 파일입니다.
이전 섹션에서 참조된 스키마 파일과 동일합니다.
|
partition_details
|
선택사항: 성능상의 이유로 이 테이블을 파티션으로 나누려는 경우 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능상의 이유로 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
보고서 설정
보고서 설정 파일 src/GoogleAds/config/reporting_settings.yaml을 사용하여 Cortex Framework에서 Google Ads 최종 보고 레이어의 데이터를 생성하는 방법을 구성하고 제어할 수 있습니다.
이 파일은 보고 레이어 BigQuery 객체(테이블, 뷰,함수 또는 저장 프로시져)가 생성되는 방식을 제어합니다.
자세한 내용은 보고서 설정 파일 맞춤설정을 참고하세요.
다음 단계
- 다른 데이터 소스 및 워크로드에 대한 자세한 내용은 데이터 소스 및 워크로드를 참고하세요.
- 프로덕션 환경의 배포 단계에 대한 자세한 내용은 Cortex Framework Data Foundation 배포 기본 요건을 참고하세요.
