TikTok과의 통합
이 페이지에서는 Cortex Framework Data Foundation의 마케팅 워크로드 데이터 소스로 TikTok의 데이터를 가져오는 데 필요한 구성을 설명합니다.
TikTok은 짧은 형식 동영상으로 유명한 인기 소셜 미디어 앱으로, Cortex Framework를 사용하면 전반적인 마케팅 실적을 분석할 데이터를 가져올 수 있습니다. TikTok과 다양한 소스의 데이터를 결합하면 타겟 잠재고객과 다양한 플랫폼에서 소셜 미디어 캠페인의 효과를 더 포괄적으로 파악할 수 있습니다.
다음 다이어그램은 Cortex Framework Data Foundation의 마케팅 워크로드를 통해 TikTok 데이터를 사용할 수 있는 방법을 설명합니다.

구성 파일
config.json 파일은 다양한 워크로드에서 데이터를 전송하기 위해 데이터 소스에 연결하는 데 필요한 설정을 구성합니다. 이 파일에는 TikTok의 다음 매개변수가 포함됩니다.
"marketing": {
"deployTikTok": true,
},
"TikTok": {
"deployCDC": true,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_TikTok"
}
}
다음 표에서는 각 마케팅 매개변수의 값을 설명합니다.
| 매개변수 | 의미 | 기본값 | 설명 |
marketing.deployTikTok
|
TikTok 배포 | true
|
TikTok 데이터 소스의 배포를 실행합니다. |
marketing.TikTok.deployCDC
|
TikTok용 CDC 스크립트 배포 | true
|
Managed Service for Apache Airflow에서 DAG로 실행할 TikTok CDC 처리 스크립트를 생성합니다. |
marketing.TikTok.datasets.cdc
|
TikTok용 CDC 데이터 세트 | TikTok의 CDC 데이터 세트입니다. | |
marketing.TikTok.datasets.raw
|
TikTok 원시 데이터 세트 | TikTok의 원시 데이터 세트입니다. | |
marketing.TikTok.datasets.reporting
|
TikTok 보고 데이터 세트 | "REPORTING_TikTok"
|
TikTok의 보고 데이터 세트입니다. |
데이터 모델
이 섹션에서는 엔티티 관계 다이어그램 (ERD)을 사용하여 TikTok 데이터 모델을 설명합니다.
기본 뷰
ERD의 파란색 객체이며 일부 열 이름 별칭 외에는 변환이 없는 CDC 테이블의 뷰입니다. src/marketing/src/TikTok/src/reporting/ddls의 스크립트를 참고하세요.
보고 보기
ERD의 녹색 객체이며 집계 측정항목이 포함된 보고 뷰입니다. src/marketing/src/TikTok/src/reporting/ddls의 스크립트를 참고하세요.
API 연결
Cortex Framework는 TikTok 데이터의 신뢰할 수 있는 소스로 TikTok Reporting API 버전 v1.3을 사용합니다. Cortex Framework는 동기 모드를 사용하고 Basic Reporting API를 호출하여 광고 및 광고 그룹의 실적 측정항목을 가져옵니다. 이를 통해 Cortex Framework는 TikTok의 최신 정보를 정확하게 파악하여 효과적인 데이터 분석 및 보고를 수행할 수 있습니다.
API 연결에 대한 자세한 내용은 TikTok Reporting API를 참고하세요.
계정 인증
TikTok 계정 및 계정 인증을 구성하려면 다음 단계를 따르세요.
- 아직 없는 경우 TikTok 개발자 계정을 설정합니다.
- Cortex Framework 통합용 앱을 만듭니다. 자세한 내용은 비즈니스용 TikTok API를 참고하세요. 앱의 범위에서 다음 두 가지를 선택해야 합니다.
Ad Account Management/Ad Account InformationReporting/All
- TikTok 가이드에 설명된 대로 앱 ID, 보안 비밀, 장기 액세스 토큰을 가져와 다음 이름으로 Secret Manager에 각각 저장합니다.
- 앱 ID:
cortex_tiktok_app_id - Secret:
cortex_tiktok_app_secret - 장기 액세스 토큰:
cortex_tiktok_access_token
- 앱 ID:
데이터 업데이트 빈도 및 지연
일반적으로 Cortex Framework 데이터 소스의 데이터 기록 빈도는 업스트림 연결에서 허용하는 사항과 DAG 실행 빈도에 따라 제한됩니다. 업스트림 빈도, 리소스 제약, 비즈니스 요구사항에 맞게 DAG 실행 빈도를 조정합니다.
TikTok Marketing API를 사용하면 전환을 제외한 대부분의 데이터를 거의 실시간으로 사용할 수 있습니다.
관리형 Airflow 연결
관리형 Airflow에서 다음 연결을 만듭니다. 자세한 내용은 Airflow 연결 관리 문서를 참고하세요.
| 연결 이름 | 목적 |
tiktok_raw_dataflow
|
TikTok API > BigQuery 원시 데이터 세트 |
tiktok_cdc_bq
|
원시 데이터 세트 > CDC 데이터 세트 전송 |
tiktok_reporting_bq
|
CDC 데이터 세트 > 보고 데이터 세트 전송 |
Managed Service for Apache Airflow 서비스 계정 권한
Managed Airflow에서 사용되는 서비스 계정 (tiktok_raw_dataflow 연결에 구성됨)에 Dataflow 권한을 부여합니다.
Dataflow 문서의 안내를 참고하세요.
또한 동일한 서비스 계정에 Secret Manager 접근자 액세스 권한도 있어야 합니다.
수집 설정
src/TikTok/config/ingestion_settings.yaml 파일의 설정을 통해 Source to Raw 및 Raw to CDC 데이터 파이프라인을 제어합니다. 이 섹션에서는 각 데이터 파이프라인의 매개변수를 설명합니다.
소스에서 원시 테이블로
이 섹션에는 TikTok의 데이터를 가져오는 방법과 데이터가 원시 데이터 세트에 저장되는 위치를 제어하는 항목이 있습니다. 각 항목은 해당 항목에 대해 TikTok API에서 가져온 데이터가 있는 하나의 원시 테이블에 해당합니다. 이 구성 매개변수를 기반으로 Cortex Framework는 TikTok API의 데이터를 처리하기 위해 Dataflow 파이프라인을 실행하는 Airflow DAG를 만듭니다.
다음 매개변수는 각 항목의 Source to Raw 설정을 제어합니다.
| 매개변수 | 설명 |
base_table
|
엔티티의 데이터가 저장되는 원시 데이터 세트의 테이블입니다(예: '광고' 데이터). |
load_frequency
|
이 항목의 데이터를 처리하기 위해 DAG가 실행되는 빈도입니다. 가능한 값에 대한 자세한 내용은 Airflow 문서를 참고하세요. |
schema_file
|
API 응답 필드를 대상 테이블의 열 이름에 매핑하는 src/table_schema 디렉터리의 스키마 파일
|
partition_details
|
선택사항: 성능을 고려하여 이 테이블을 파티션으로 나누려는 경우 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능 고려사항을 위해 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
원시 테이블에서 CDC 테이블로
이 섹션에는 원시 테이블에서 CDC 테이블로 데이터가 이동하는 방식을 제어하는 항목이 있습니다. 각 항목은 CDC 테이블에 해당합니다 (이는 Source to Raw table에 언급된 항목에 해당함).
다음 매개변수는 각 항목의 Raw to CDC 설정을 제어합니다.
| 매개변수 | 설명 |
base_table
|
CDC 변환 후 원시 데이터가 저장되는 CDC 데이터 세트의 테이블입니다 (예:auction_ad_performance).
|
load_frequency
|
이 항목의 DAG가 CDC 테이블을 채우기 위해 실행되는 빈도입니다. 자세한 내용은 Airflow 문서에서 가능한 값을 참고하세요. |
row_identifiers
|
이 테이블의 고유 레코드를 구성하는 열 목록 (쉼표로 구분)입니다. |
partition_details
|
선택사항: 성능을 고려하여 이 테이블을 파티션으로 나누려는 경우 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능을 고려하여 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
보고서 설정
보고 설정 파일 src/TikTok/config/reporting_settings.yaml를 사용하여 Cortex Framework가 TikTok 최종 보고 레이어의 데이터를 생성하는 방식을 구성하고 제어합니다.
이 파일은 보고 레이어 BigQuery 객체(테이블, 뷰, 함수 또는 저장 프로시저)가 생성되는 방식을 제어합니다.
자세한 내용은 보고 설정 파일 맞춤설정을 참고하세요.
다음 단계
- 기타 데이터 소스 및 워크로드에 대한 자세한 내용은 데이터 소스 및 워크로드를 참고하세요.
- 프로덕션 환경에서의 배포 단계에 관한 자세한 내용은 Cortex Framework 데이터 기반 배포 필수사항을 참고하세요.
