Google アナリティクス 4 との統合

このページでは、Google アナリティクス 4(GA4)から Cortex Framework Data Foundation のマーケティング ワークロードのデータソースとしてデータを取り込むために必要な構成について説明します。

GA4 は Google アナリティクスの最新バージョンです。イベントベースのトラッキングと機械学習に重点を置いて、ユーザー行動の全体像を把握し、より深い分析情報を提供します。Cortex Framework を使用すると、GA4 からデータを抽出し、BigQuery に統合して、さらに分析とレポート作成を行うことができます。これにより、貴重な分析情報を取得し、ビジネス成果を向上させることができます。

次の図は、Cortex Framework Data Foundation のマーケティング ワークロードを通じて GA4 データを利用する方法を示しています。

GA4 データソース

図 1 。GA4 データソース。

構成ファイル

The config.json ファイルは、さまざまなワークロードからデータを転送するためにデータソースに接続するために必要な設定を構成します。このファイルには、GA4 の次のパラメータが含まれています。

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

次の表に、各マーケティング パラメータの値を示します。

パラメータ 意味 デフォルト値 説明
marketing.deployGA4 GA4 をデプロイする true GA4 データソースのデプロイを実行します。
marketing.GA4.datasets.cdc GA4 の BigQuery Export データセット [{"property_id": 0, "name": ""}] Google アナリティクス 4 の BigQuery Export データセットの配列。各要素は、Property IDINT として指定し、対応する BigQuery Export データセット名を指定します。
marketing.GA4.datasets.reporting GA4 のレポート データセット REPORTING_GA4 GA4 のレポート データセット。

データモデル

このセクションでは、エンティティ リレーション図(ERD)を使用して GA4 データモデルについて説明します。

GA4 のエンティティ関係図

図 2 。GA4: エンティティ リレーション図。

ベースビュー

これらは ERD の青いオブジェクトで、複雑なデータ構造を解凍するために最小限の変換を行う CDC テーブルのビューです。 src/marketing/src/GA4/src/reporting/ddls のスクリプトをご覧ください。

レポートビュー

これらは ERD の緑色のオブジェクトで、集計指標を含むレポートビューです。 src/marketing/src/GA4/src/reporting/ddls のスクリプトをご覧ください。

GA4 の統合を構成する

Cortex Framework Data Foundation は、 GA4BigQuery Export データセット(Cortex Framework アーキテクチャでは CDC データセット として扱われます)の上に レポートレイヤ を作成することで、 GA4 と統合されます。これは、レポート設定の構成に応じて、CDC テーブルの上にランタイム ビューを作成するか、BigQuery テーブルのマテリアライズド データに対して Managed Service for Apache Airflow DAG を実行することで実現します。

GA4 BigQuery Export を設定する

Cortex Framework は、GA4 の BigQuery Export 機能を使用して、ソースシステムから BigQuery にデータを読み込みます。BigQuery Export または各 GA4 プロパティの設定手順については、GA4 ヘルプ記事の GA4 - BigQuery Export のセットアップをご覧ください。

既知の問題、制限事項、その他の考慮事項

GA4 BigQuery Export を設定する際は、次の点を考慮してください。

  • バックフィル: GA4 BigQuery Export は設定した日から開始され、バックフィルはありません。
  • GA4 UI と Cortex Framework のレポート数値の違い: サンプリング、データの収集の遅延、 カーディナリティの高いレポートなど、複数の要因により、 Google アナリティクス UI と Cortex Framework の間にわずかな差異が生じることがあります。これは、Google アナリティクスの既知の固有の制限事項です。詳細については、 Google アナリティクス UI と BigQuery Export のギャップを埋める をご覧ください。
  • イベント エクスポートのボリューム制限: Google アナリティクスのエディションによっては、1 日あたりの BigQuery Export のボリューム制限が異なる場合があります。詳細については、 GA4 - BigQuery Export のセットアップをご覧ください。
  • タイムゾーン: BigQuery Export では、 event_dateプロパティのレポート タイムゾーン で設定されますが、 event_timestampUTC のタイムスタンプ(マイクロ秒単位)です。そのため、event_timestamp を使用する場合は、UI の数値と比較する際に、レポートの正しいタイムゾーンに合わせて調整してください。
  • 毎日とストリーミング(リアルタイム)のイベント エクスポート: イベントのエクスポートの場合、 Cortex Framework は、 毎日の完全エクスポートで作成された events_YYYYMMDD テーブルのみをサポートします。詳細については、 GA4 - BigQuery Exportをご覧ください。
  • BigQuery Export の GA4 360 サービスレベル契約(SLA): Cortex Framework は、events_fresh_ テーブルを 毎日(高頻度)エクスポートで作成された 個別のソーステーブルとしてサポートしていませんが、##CORTEX-CUSTOMER レポートビューのEvents カスタマイズ コメントに沿って、ソース テーブルをこれらのテーブルに置き換えることで、この機能で提供される SLA を活用できます。この置換後も、すべてのレポートビューは引き続き機能します。

データの鮮度と遅延

原則として、Cortex Framework データソースのデータの更新速度は、アップストリーム接続で許可されるものと、DAG の実行頻度によって制限されます。アップストリームの頻度、リソースの制約、ビジネスニーズに合わせて DAG の実行頻度を調整してください。

毎日(高頻度)エクスポートを使用していない場合、Google アナリティクス 4 では、タイムゾーンによっては BigQuery Export データが最大 1 日遅れることがあります。

構成

このセクションでは、データプロセスの構成について説明します。

Managed Service for Apache Airflow 接続

Managed Airflow で次の接続を作成します。詳細については、 Airflow 接続を管理するをご覧ください。

接続名 目的
dv360_cdc_bq 元データセットから CDC データセットへの転送用。
dv360_reporting_bq CDC データセットからレポート データセットへの 転送用。

レポート設定

レポート設定ファイル src/GA4/config/reporting_settings.yaml を使用して、Cortex Framework が GA4 の最終レポートレイヤのデータを生成する方法を構成および制御できます。このファイルは、レポートレイヤの BigQuery オブジェクト(テーブル、ビュー、関数、ストアド プロシージャ)の生成方法を制御します。

詳細については、レポート設定ファイルをカスタマイズするをご覧ください。

次のステップ