Google アナリティクス 4 との統合
このページでは、Google アナリティクス 4(GA4)から Cortex Framework Data Foundation のマーケティング ワークロードのデータソースとしてデータを取得するために必要な構成について説明します。
GA4 は Google アナリティクスの最新バージョンです。イベントベースのトラッキングと機械学習に焦点を当て、ユーザー行動の全体像を把握し、より深い分析情報を提供します。Cortex Framework を使用すると、GA4 からデータを抽出し、BigQuery に統合して、さらに分析やレポート作成を行うことができます。貴重な分析情報を取得し、ビジネスの成果を高めることができます。
次の図は、Cortex Framework Data Foundation のマーケティング ワークロードを通じて GA4 データを利用できる仕組みを示しています。

構成ファイル
config.json ファイルは、さまざまなワークロードからデータを転送するためにデータソースに接続するために必要な設定を構成します。このファイルには、GA4 の次のパラメータが含まれています。
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
次の表に、各マーケティング パラメータの値を示します。
| パラメータ | 意味 | デフォルト値 | 説明 |
marketing.deployGA4
|
GA4 をデプロイする | true
|
GA4 データソースのデプロイを実行します。 |
marketing.GA4.datasets.cdc
|
GA4 の BigQuery Export データセット | [{"property_id": 0, "name": ""}]
|
Google アナリティクス 4 の BigQuery Export データセットの配列。各要素は、Property ID を INT として指定し、対応する BigQuery Export データセット名も指定します。 |
marketing.GA4.datasets.reporting
|
GA4 のレポート用データセット | REPORTING_GA4
|
GA4 のレポート用データセット。 |
データモデル
このセクションでは、エンティティ関連図(ERD)を使用して GA4 データモデルについて説明します。
ベースビュー
これらは ERD の青いオブジェクトであり、複雑なデータ構造を解凍するための最小限の変換を含む CDC テーブルのビューです。src/marketing/src/GA4/src/reporting/ddls のスクリプトをご覧ください。
レポートビュー
これらは ERD の緑色のオブジェクトであり、集計指標を含むレポートビューです。src/marketing/src/GA4/src/reporting/ddls のスクリプトをご覧ください。
GA4 の統合を設定する
Cortex Framework Data Foundation は、GA4 の BigQuery Export データセット(Cortex Framework アーキテクチャでは CDC データセットとして扱われます)の上にレポートレイヤを作成することで、GA4 と統合されます。これは、レポート設定の構成に応じて、CDC テーブルの上にランタイム ビューを作成するか、BigQuery テーブルのマテリアライズド データに対して Managed Service for Apache Airflow DAG を実行することで実現されます。
GA4 BigQuery Export を設定する
Cortex Framework は、GA4 の BigQuery Export 機能を使用して、ソースシステムから BigQuery にデータを読み込みます。この GA4 ヘルプ記事(GA4 - BigQuery Export を設定する)に記載されている、BigQuery Export または各 GA4 プロパティを設定する手順に沿って操作します。
既知の問題、制限事項、その他の考慮事項
GA4 BigQuery Export を設定する際は、次の点を考慮してください。
- バックフィル: GA4 BigQuery Export は設定された日から開始され、バックフィルは行われません。
- GA4 UI と Cortex Framework のレポートの数値の差異: サンプリング、データの収集の遅延、高基数レポートなど、複数の要因により、Google アナリティクス UI と Cortex Framework の間にわずかな差異が生じることがあります。これは Google アナリティクスの既知の制限事項です。詳細については、Google アナリティクスの UI と BigQuery エクスポートのギャップを埋める をご覧ください。
- イベント エクスポート ボリュームの制限: Google アナリティクスのエディションによっては、1 日あたりの BigQuery エクスポート ボリュームにさまざまな制限が適用される場合があります。詳しくは、[GA4] BigQuery Export のセットアップをご覧ください。
- タイムゾーン: BigQuery Export データにおいて、
event_dateはプロパティのレポートのタイムゾーンで設定されますが、event_timestampは UTC のタイムスタンプ(マイクロ秒単位)です。このため、UI との比較に適した数値を得るには、event_timestampを使用する場合は、レポートのタイムゾーンに合わせて調整する必要があります。 - 日次イベント エクスポートとストリーミング(リアルタイム)イベント エクスポート: イベント エクスポートの場合、Cortex Framework は、日次エクスポートで作成された
events_YYYYMMDDテーブルのみをサポートします。詳細については、GA4 - BigQuery Export をご覧ください。 - BigQuery Export の GA4 360 サービスレベル契約(SLA): Cortex Framework は、毎日(高頻度)エクスポートで作成された
events_fresh_テーブルを個別のソーステーブルとしてサポートしていませんが、Eventsレポート ビューの##CORTEX-CUSTOMERカスタマイズ コメントに沿ってソーステーブルをこれらのテーブルに置き換えることで、この機能で提供される SLA を活用できます。この置換後も、すべてのレポートビューは引き続き機能します。
データの更新頻度と遅延
一般に、Cortex Framework データソースのデータの更新速度は、アップストリーム接続で許可されている内容と DAG 実行の頻度によって制限されます。上流の頻度、リソースの制約、ビジネスニーズに合わせて DAG の実行頻度を調整します。
Google アナリティクス 4 では、毎日(高頻度)エクスポートを使用していない場合、タイムゾーンによっては BigQuery Export のデータが最大 1 日遅れることがあります。
構成
このセクションでは、データ プロセスの構成について説明します。
Managed Service for Apache Airflow 接続
マネージド Airflow で次の接続を作成します。詳細については、Airflow 接続の管理に関するドキュメントをご覧ください。
| 接続名 | 目的 |
dv360_cdc_bq
|
元データセット > CDC データセットの転送。 |
dv360_reporting_bq
|
CDC データセット > レポート データセットの転送。 |
レポート設定
レポート設定ファイル src/GA4/config/reporting_settings.yaml を使用して、Cortex Framework が GA4 の最終レポートレイヤのデータを生成する方法を構成して制御できます。このファイルは、レポートレイヤの BigQuery オブジェクト(テーブル、ビュー、関数、ストアド プロシージャ)の生成方法を制御します。
詳しくは、レポート設定ファイルのカスタマイズをご覧ください。
次のステップ
- 他のデータソースとワークロードの詳細については、データソースとワークロードをご覧ください。
- 本番環境でのデプロイの手順については、Cortex Framework Data Foundation のデプロイの前提条件をご覧ください。
