TikTok との統合

このページでは、Cortex Framework Data Foundation のマーケティング ワークロードのデータソースとして TikTok からデータを取得するために必要な構成について説明します。

TikTok は、ショート動画で知られる人気のソーシャル メディア アプリです。Cortex Framework は、マーケティング パフォーマンス全体を分析するためのデータを取得できます。TikTok のデータとさまざまなソースのデータを組み合わせることで、ターゲット ユーザーと、さまざまなプラットフォームにおけるソーシャル メディア キャンペーンの効果をより包括的に把握できます。

次の図は、Cortex Framework Data Foundation のマーケティング ワークロードを通じて TikTok データを利用できる仕組みを示しています。

TikTok データソース

図 1. TikTok データソース。

構成ファイル

config.json ファイルは、さまざまなワークロードからデータを転送するためにデータソースに接続するために必要な設定を構成します。このファイルには、TikTok の次のパラメータが含まれています。

   "marketing": {
        "deployTikTok": true,
        },
        "TikTok": {
            "deployCDC": true,
            "datasets": {
                "cdc": "",
                "raw": "",
                "reporting": "REPORTING_TikTok"
            }
        }

次の表に、各マーケティング パラメータの値を示します。

パラメータ 意味 デフォルト値 説明
marketing.deployTikTok TikTok をデプロイする true TikTok データソースのデプロイを実行します。
marketing.TikTok.deployCDC TikTok 用の CDC スクリプトをデプロイする true Managed Service for Apache Airflow で DAG として実行する TikTok CDC 処理スクリプトを生成します。
marketing.TikTok.datasets.cdc TikTok の CDC データセット TikTok の CDC データセット。
marketing.TikTok.datasets.raw TikTok の元データセット TikTok の元データセット。
marketing.TikTok.datasets.reporting TikTok のレポート用データセット "REPORTING_TikTok" TikTok のレポート用データセット。

データモデル

このセクションでは、エンティティ関連図(ERD)を使用して TikTok データモデルについて説明します。

TikTok のエンティティ関係図

図 2. TikTok: エンティティ関係図。

ベースビュー

これらは ERD の青いオブジェクトであり、一部の列名エイリアス以外の変換がない CDC テーブルのビューです。src/marketing/src/TikTok/src/reporting/ddls のスクリプトをご覧ください。

レポートビュー

これらは ERD の緑色のオブジェクトであり、集計指標を含むレポートビューです。src/marketing/src/TikTok/src/reporting/ddls のスクリプトをご覧ください。

API 接続

Cortex Framework では、TikTok データの信頼できるソースとして TikTok Reporting API バージョン v1.3 を使用します。Cortex Framework は同期モードを使用し、基本的なレポート API を呼び出して、広告と広告グループのパフォーマンス指標を取得します。これにより、Cortex Framework は TikTok の最新かつ正確な情報にアクセスできるようになり、効果的なデータ分析とレポート作成が可能になります。

API 接続の詳細については、TikTok Reporting APIs をご覧ください。

アカウント認証

TikTok アカウントとアカウント認証を設定する手順は次のとおりです。

  1. TikTok デベロッパー アカウントをまだお持ちでない場合は、設定します。
  2. Cortex Framework 統合用のアプリを作成します。詳しくは、TikTok API for Business をご覧ください。アプリのスコープで次の 2 つが選択されていることを確認します。
    • Ad Account Management/Ad Account Information
    • Reporting/All
  3. TikTok ガイドの説明に沿って、アプリ IDシークレット長期アクセス トークンを取得し、それぞれ次の名前で Secret Manager に保存します。
    • アプリ ID: cortex_tiktok_app_id
    • Secret: cortex_tiktok_app_secret
    • 長期アクセス トークン: cortex_tiktok_access_token

データの更新頻度と遅延

一般的なルールとして、Cortex Framework データソースのデータの鮮度は、上流接続で許可されているものと、DAG の実行頻度によって制限されます。上流の頻度、リソースの制約、ビジネスニーズに合わせて、DAG の実行頻度を調整します。

TikTok Marketing API を使用すると、ほとんどのデータ(コンバージョンを除く)をほぼリアルタイムで利用できます。

Managed Airflow 接続

Managed Airflow で次の接続を作成します。詳細については、Airflow 接続の管理に関するドキュメントをご覧ください。

接続名 目的
tiktok_raw_dataflow TikTok API > BigQuery Raw Dataset
tiktok_cdc_bq 元データセット > CDC データセットの転送
tiktok_reporting_bq CDC データセット > レポート データセットの転送

Managed Service for Apache Airflow サービス アカウントの権限

Managed Airflow で使用されるサービス アカウント(tiktok_raw_dataflow 接続で構成)に Dataflow 権限を付与します。Dataflow のドキュメントの手順をご覧ください。

また、同じサービス アカウントに Secret Manager アクセサーのアクセス権も必要です。

取り込み設定

src/TikTok/config/ingestion_settings.yaml ファイルの設定を使用して、Source to RawRaw to CDC のデータ パイプラインを制御します。このセクションでは、各データ パイプラインのパラメータについて説明します。

ソースから元テーブル

このセクションには、TikTok からデータを取得する方法と、未加工のデータセットでデータがどこに保存されるかを制御するエントリがあります。各エントリは、そのエンティティの TikTok API から取得したデータを含む 1 つの生テーブルに対応します。この構成パラメータに基づいて、Cortex Framework は Airflow DAG を作成します。この DAG は、Dataflow パイプラインを実行して TikTok API からデータを処理します。

次のパラメータは、各エントリの Source to Raw の設定を制御します。

パラメータ 説明
base_table エンティティのデータ(「広告」データなど)が保存される Raw データセット内のテーブル。
load_frequency このエンティティのデータを処理するために DAG が実行される頻度。有効な値の詳細については、Airflow のドキュメントをご覧ください。
schema_file API レスポンス フィールドを宛先テーブルの列名にマッピングする src/table_schema ディレクトリ内のスキーマ ファイル。
partition_details 省略可: パフォーマンスを考慮してこのテーブルをパーティション分割する場合。詳細については、テーブル パーティションをご覧ください。
cluster_details 省略可: パフォーマンスを考慮してこのテーブルをクラスタ化する場合。詳細については、クラスタの設定をご覧ください。

元テーブルから CDC テーブル

このセクションには、データが未加工テーブルから CDC テーブルに移動する方法を制御するエントリがあります。各エントリは CDC テーブルに対応します(CDC テーブルは Source to Raw table で言及されているエンティティに対応します)。

次のパラメータは、各エントリの Raw to CDC の設定を制御します。

パラメータ 説明
base_table CDC 変換後の元データが保存される CDC データセット内のテーブル(例: auction_ad_performance
load_frequency このエンティティの DAG が CDC テーブルにデータを入力するために実行される頻度。詳細については、Airflow のドキュメントで有効な値をご覧ください。
row_identifiers このテーブルの一意のレコードを形成する列のリスト(カンマ区切り)。
partition_details 省略可: パフォーマンス上の理由からこのテーブルをパーティション分割する場合。詳細については、テーブル パーティションをご覧ください。
cluster_details 省略可: パフォーマンスを考慮してこのテーブルをクラスタ化する場合。詳細については、クラスタの設定をご覧ください。

レポート設定

レポート設定ファイル src/TikTok/config/reporting_settings.yaml を使用して、Cortex Framework が TikTok の最終レポート レイヤのデータを生成する方法を構成し、制御します。このファイルは、レポートレイヤの BigQuery オブジェクト(テーブル、ビュー、関数、ストアド プロシージャ)の生成方法を制御します。

詳しくは、レポート設定ファイルのカスタマイズをご覧ください。

次のステップ