Google アナリティクス 4 との統合
このページでは、Google アナリティクス 4(GA4)から Cortex Framework Data Foundation のマーケティング ワークロードのデータソースとしてデータを取り込むために必要な構成について説明します。
GA4 は Google アナリティクスの最新バージョンです。イベントベースのトラッキングと機械学習に重点を置いて、ユーザー行動の全体像を把握し、より深い分析情報を提供します。Cortex Framework を使用すると、GA4 からデータを抽出し、BigQuery に統合して、さらに分析とレポート作成を行うことができます。これにより、貴重な分析情報を取得し、ビジネス成果を向上させることができます。
次の図は、Cortex Framework Data Foundation のマーケティング ワークロードを通じて GA4 データを利用する方法を示しています。

構成ファイル
The config.json
ファイルは、さまざまなワークロードからデータを転送するためにデータソースに接続するために必要な設定を構成します。このファイルには、GA4 の次のパラメータが含まれています。
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
次の表に、各マーケティング パラメータの値を示します。
| パラメータ | 意味 | デフォルト値 | 説明 |
marketing.deployGA4
|
GA4 をデプロイする | true
|
GA4 データソースのデプロイを実行します。 |
marketing.GA4.datasets.cdc
|
GA4 の BigQuery Export データセット | [{"property_id": 0, "name": ""}]
|
Google アナリティクス 4 の BigQuery
Export データセットの配列。各要素は、Property ID を
INT として指定し、対応する BigQuery Export データセット名を指定します。
|
marketing.GA4.datasets.reporting
|
GA4 のレポート データセット | REPORTING_GA4
|
GA4 のレポート データセット。 |
データモデル
このセクションでは、エンティティ リレーション図(ERD)を使用して GA4 データモデルについて説明します。
ベースビュー
これらは ERD の青いオブジェクトで、複雑なデータ構造を解凍するために最小限の変換を行う CDC テーブルのビューです。
src/marketing/src/GA4/src/reporting/ddls のスクリプトをご覧ください。
レポートビュー
これらは ERD の緑色のオブジェクトで、集計指標を含むレポートビューです。
src/marketing/src/GA4/src/reporting/ddls のスクリプトをご覧ください。
GA4 の統合を構成する
Cortex Framework Data Foundation は、 GA4 の BigQuery Export データセット(Cortex Framework アーキテクチャでは CDC データセット として扱われます)の上に レポートレイヤ を作成することで、 GA4 と統合されます。これは、レポート設定の構成に応じて、CDC テーブルの上にランタイム ビューを作成するか、BigQuery テーブルのマテリアライズド データに対して Managed Service for Apache Airflow DAG を実行することで実現します。
GA4 BigQuery Export を設定する
Cortex Framework は、GA4 の BigQuery Export 機能を使用して、ソースシステムから BigQuery にデータを読み込みます。BigQuery Export または各 GA4 プロパティの設定手順については、GA4 ヘルプ記事の GA4 - BigQuery Export のセットアップをご覧ください。
既知の問題、制限事項、その他の考慮事項
GA4 BigQuery Export を設定する際は、次の点を考慮してください。
- バックフィル: GA4 BigQuery Export は設定した日から開始され、バックフィルはありません。
- GA4 UI と Cortex Framework のレポート数値の違い: サンプリング、データの収集の遅延、 カーディナリティの高いレポートなど、複数の要因により、 Google アナリティクス UI と Cortex Framework の間にわずかな差異が生じることがあります。これは、Google アナリティクスの既知の固有の制限事項です。詳細については、 Google アナリティクス UI と BigQuery Export のギャップを埋める をご覧ください。
- イベント エクスポートのボリューム制限: Google アナリティクスのエディションによっては、1 日あたりの BigQuery Export のボリューム制限が異なる場合があります。詳細については、 GA4 - BigQuery Export のセットアップをご覧ください。
- タイムゾーン: BigQuery Export では、
event_dateはプロパティのレポート タイムゾーン で設定されますが、event_timestampはUTC のタイムスタンプ(マイクロ秒単位)です。そのため、event_timestampを使用する場合は、UI の数値と比較する際に、レポートの正しいタイムゾーンに合わせて調整してください。 - 毎日とストリーミング(リアルタイム)のイベント エクスポート: イベントのエクスポートの場合、
Cortex Framework は、
毎日の完全エクスポートで作成された
events_YYYYMMDDテーブルのみをサポートします。詳細については、 GA4 - BigQuery Exportをご覧ください。 - BigQuery Export の GA4 360 サービスレベル契約(SLA):
Cortex Framework は、
events_fresh_テーブルを 毎日(高頻度)エクスポートで作成された 個別のソーステーブルとしてサポートしていませんが、##CORTEX-CUSTOMERレポートビューのEventsカスタマイズ コメントに沿って、ソース テーブルをこれらのテーブルに置き換えることで、この機能で提供される SLA を活用できます。この置換後も、すべてのレポートビューは引き続き機能します。
データの鮮度と遅延
原則として、Cortex Framework データソースのデータの更新速度は、アップストリーム接続で許可されるものと、DAG の実行頻度によって制限されます。アップストリームの頻度、リソースの制約、ビジネスニーズに合わせて DAG の実行頻度を調整してください。
毎日(高頻度)エクスポートを使用していない場合、Google アナリティクス 4 では、タイムゾーンによっては BigQuery Export データが最大 1 日遅れることがあります。
構成
このセクションでは、データプロセスの構成について説明します。
Managed Service for Apache Airflow 接続
Managed Airflow で次の接続を作成します。詳細については、 Airflow 接続を管理するをご覧ください。
| 接続名 | 目的 |
dv360_cdc_bq
|
元データセットから CDC データセットへの転送用。 |
dv360_reporting_bq
|
CDC データセットからレポート データセットへの 転送用。 |
レポート設定
レポート設定ファイル src/GA4/config/reporting_settings.yaml を使用して、Cortex Framework が GA4
の最終レポートレイヤのデータを生成する方法を構成および制御できます。このファイルは、レポートレイヤの BigQuery
オブジェクト(テーブル、ビュー、関数、ストアド プロシージャ)の生成方法を制御します。
詳細については、レポート設定ファイルをカスタマイズするをご覧ください。
次のステップ
- 他のデータソースとワークロードの詳細については、 データソースとワークロードをご覧ください。
- 本番環境でのデプロイの手順の詳細については、 Cortex Framework Data Foundation のデプロイの前提条件をご覧ください。
