TikTok との統合
このページでは、Cortex Framework Data Foundation のマーケティング ワークロードのデータソースとして TikTok からデータを取得するために必要な構成について説明します。
TikTok は、ショート動画で知られる人気のソーシャル メディア アプリです。Cortex Framework は、マーケティング パフォーマンス全体を分析するためのデータを取得できます。TikTok のデータとさまざまなソースのデータを組み合わせることで、ターゲット ユーザーと、さまざまなプラットフォームにおけるソーシャル メディア キャンペーンの効果をより包括的に把握できます。
次の図は、Cortex Framework Data Foundation のマーケティング ワークロードを通じて TikTok データを利用できる仕組みを示しています。

構成ファイル
config.json ファイルは、さまざまなワークロードからデータを転送するためにデータソースに接続するために必要な設定を構成します。このファイルには、TikTok の次のパラメータが含まれています。
"marketing": {
"deployTikTok": true,
},
"TikTok": {
"deployCDC": true,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_TikTok"
}
}
次の表に、各マーケティング パラメータの値を示します。
| パラメータ | 意味 | デフォルト値 | 説明 |
marketing.deployTikTok
|
TikTok をデプロイする | true
|
TikTok データソースのデプロイを実行します。 |
marketing.TikTok.deployCDC
|
TikTok 用の CDC スクリプトをデプロイする | true
|
Managed Service for Apache Airflow で DAG として実行する TikTok CDC 処理スクリプトを生成します。 |
marketing.TikTok.datasets.cdc
|
TikTok の CDC データセット | TikTok の CDC データセット。 | |
marketing.TikTok.datasets.raw
|
TikTok の元データセット | TikTok の元データセット。 | |
marketing.TikTok.datasets.reporting
|
TikTok のレポート用データセット | "REPORTING_TikTok"
|
TikTok のレポート用データセット。 |
データモデル
このセクションでは、エンティティ関連図(ERD)を使用して TikTok データモデルについて説明します。
ベースビュー
これらは ERD の青いオブジェクトであり、一部の列名エイリアス以外の変換がない CDC テーブルのビューです。src/marketing/src/TikTok/src/reporting/ddls のスクリプトをご覧ください。
レポートビュー
これらは ERD の緑色のオブジェクトであり、集計指標を含むレポートビューです。src/marketing/src/TikTok/src/reporting/ddls のスクリプトをご覧ください。
API 接続
Cortex Framework では、TikTok データの信頼できるソースとして TikTok Reporting API バージョン v1.3 を使用します。Cortex Framework は同期モードを使用し、基本的なレポート API を呼び出して、広告と広告グループのパフォーマンス指標を取得します。これにより、Cortex Framework は TikTok の最新かつ正確な情報にアクセスできるようになり、効果的なデータ分析とレポート作成が可能になります。
API 接続の詳細については、TikTok Reporting APIs をご覧ください。
アカウント認証
TikTok アカウントとアカウント認証を設定する手順は次のとおりです。
- TikTok デベロッパー アカウントをまだお持ちでない場合は、設定します。
- Cortex Framework 統合用のアプリを作成します。詳しくは、TikTok API for Business をご覧ください。アプリのスコープで次の 2 つが選択されていることを確認します。
Ad Account Management/Ad Account InformationReporting/All
- TikTok ガイドの説明に沿って、アプリ ID、シークレット、長期アクセス トークンを取得し、それぞれ次の名前で Secret Manager に保存します。
- アプリ ID:
cortex_tiktok_app_id - Secret:
cortex_tiktok_app_secret - 長期アクセス トークン:
cortex_tiktok_access_token
- アプリ ID:
データの更新頻度と遅延
一般的なルールとして、Cortex Framework データソースのデータの鮮度は、上流接続で許可されているものと、DAG の実行頻度によって制限されます。上流の頻度、リソースの制約、ビジネスニーズに合わせて、DAG の実行頻度を調整します。
TikTok Marketing API を使用すると、ほとんどのデータ(コンバージョンを除く)をほぼリアルタイムで利用できます。
Managed Airflow 接続
Managed Airflow で次の接続を作成します。詳細については、Airflow 接続の管理に関するドキュメントをご覧ください。
| 接続名 | 目的 |
tiktok_raw_dataflow
|
TikTok API > BigQuery Raw Dataset |
tiktok_cdc_bq
|
元データセット > CDC データセットの転送 |
tiktok_reporting_bq
|
CDC データセット > レポート データセットの転送 |
Managed Service for Apache Airflow サービス アカウントの権限
Managed Airflow で使用されるサービス アカウント(tiktok_raw_dataflow 接続で構成)に Dataflow 権限を付与します。Dataflow のドキュメントの手順をご覧ください。
また、同じサービス アカウントに Secret Manager アクセサーのアクセス権も必要です。
取り込み設定
src/TikTok/config/ingestion_settings.yaml ファイルの設定を使用して、Source to Raw と Raw to CDC のデータ パイプラインを制御します。このセクションでは、各データ パイプラインのパラメータについて説明します。
ソースから元テーブル
このセクションには、TikTok からデータを取得する方法と、未加工のデータセットでデータがどこに保存されるかを制御するエントリがあります。各エントリは、そのエンティティの TikTok API から取得したデータを含む 1 つの生テーブルに対応します。この構成パラメータに基づいて、Cortex Framework は Airflow DAG を作成します。この DAG は、Dataflow パイプラインを実行して TikTok API からデータを処理します。
次のパラメータは、各エントリの Source to Raw の設定を制御します。
| パラメータ | 説明 |
base_table
|
エンティティのデータ(「広告」データなど)が保存される Raw データセット内のテーブル。 |
load_frequency
|
このエンティティのデータを処理するために DAG が実行される頻度。有効な値の詳細については、Airflow のドキュメントをご覧ください。 |
schema_file
|
API レスポンス フィールドを宛先テーブルの列名にマッピングする src/table_schema ディレクトリ内のスキーマ ファイル。 |
partition_details
|
省略可: パフォーマンスを考慮してこのテーブルをパーティション分割する場合。詳細については、テーブル パーティションをご覧ください。 |
cluster_details
|
省略可: パフォーマンスを考慮してこのテーブルをクラスタ化する場合。詳細については、クラスタの設定をご覧ください。 |
元テーブルから CDC テーブル
このセクションには、データが未加工テーブルから CDC テーブルに移動する方法を制御するエントリがあります。各エントリは CDC テーブルに対応します(CDC テーブルは Source to Raw table で言及されているエンティティに対応します)。
次のパラメータは、各エントリの Raw to CDC の設定を制御します。
| パラメータ | 説明 |
base_table
|
CDC 変換後の元データが保存される CDC データセット内のテーブル(例: auction_ad_performance) |
load_frequency
|
このエンティティの DAG が CDC テーブルにデータを入力するために実行される頻度。詳細については、Airflow のドキュメントで有効な値をご覧ください。 |
row_identifiers
|
このテーブルの一意のレコードを形成する列のリスト(カンマ区切り)。 |
partition_details
|
省略可: パフォーマンス上の理由からこのテーブルをパーティション分割する場合。詳細については、テーブル パーティションをご覧ください。 |
cluster_details
|
省略可: パフォーマンスを考慮してこのテーブルをクラスタ化する場合。詳細については、クラスタの設定をご覧ください。 |
レポート設定
レポート設定ファイル src/TikTok/config/reporting_settings.yaml を使用して、Cortex Framework が TikTok の最終レポート レイヤのデータを生成する方法を構成し、制御します。このファイルは、レポートレイヤの BigQuery オブジェクト(テーブル、ビュー、関数、ストアド プロシージャ)の生成方法を制御します。
詳しくは、レポート設定ファイルのカスタマイズをご覧ください。
次のステップ
- 他のデータソースとワークロードの詳細については、データソースとワークロードをご覧ください。
- 本番環境でのデプロイの手順については、Cortex Framework Data Foundation のデプロイの前提条件をご覧ください。
