Integration mit Google Analytics 4

Auf dieser Seite werden die erforderlichen Konfigurationen beschrieben, um Daten aus Google Analytics 4 (GA4) als Datenquelle für die Marketing-Arbeitslast der Cortex Framework Data Foundation zu verwenden.

GA4 ist die neueste Version von Google Analytics. Sie bietet einen ganzheitlichen Überblick über das Nutzerverhalten und konzentriert sich auf ereignisbasiertes Tracking und maschinelles Lernen, um tiefere Einblicke zu ermöglichen. Mit dem Cortex Framework können Sie Daten aus GA4 extrahieren und zur weiteren Analyse und Berichterstellung in BigQuery einbinden. So können Sie wertvolle Statistiken erhalten und bessere Geschäftsergebnisse erzielen.

Das folgende Diagramm zeigt, wie GA4-Daten über die Marketing-Arbeitslast der Cortex Framework Data Foundation verfügbar sind:

GA4-Datenquelle

Abbildung 1. GA4-Datenquelle.

Konfigurationsdatei

In der Datei config.json werden die Einstellungen konfiguriert, die für die Verbindung zu Datenquellen zum Übertragen von Daten aus verschiedenen Arbeitslasten erforderlich sind. Diese Datei enthält die folgenden Parameter für GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

In der folgenden Tabelle wird der Wert für jeden Marketingparameter beschrieben:

Parameter Bedeutung Standardwert Beschreibung
marketing.deployGA4 GA4 bereitstellen true Führen Sie die Bereitstellung für die GA4-Datenquelle aus.
marketing.GA4.datasets.cdc BigQuery Export-Datasets für GA4 [{"property_id": 0, "name": ""}] Array von Google Analytics 4-BigQuery-Export-Datasets. Jedes Element gibt Property ID als INT sowie den entsprechenden Namen des BigQuery-Export-Datasets an.
marketing.GA4.datasets.reporting Berichtsdatensatz für GA4 REPORTING_GA4 Berichtsdatensatz für GA4.

Datenmodell

In diesem Abschnitt wird das GA4-Datenmodell anhand des Entity-Relationship-Diagramms (ERD) beschrieben.

Entity-Relationship-Diagramm für GA4

Abbildung 2: GA4: Entity-Relationship-Diagramm.

Basisansichten

Das sind die blauen Objekte im ERD. Sie sind Ansichten von CDC-Tabellen mit minimalen Transformationen zum Entpacken komplexer Datenstrukturen. Scripts finden Sie unter src/marketing/src/GA4/src/reporting/ddls.

Berichtsdatenansichten

Das sind die grünen Objekte im ERD. Sie sind Berichtsansichten, die aggregierte Messwerte enthalten. Scripts finden Sie unter src/marketing/src/GA4/src/reporting/ddls.

Integration für GA4 konfigurieren

Die Data Foundation von Cortex Framework wird in GA4 eingebunden, indem eine Berichtsebene über den BigQuery Export-Datasets von GA4 erstellt wird. Diese werden in der Cortex Framework-Architektur als CDC-Datasets behandelt. Dazu werden je nach Konfiguration der Berichterstellungseinstellungen Laufzeitansichten für CDC-Tabellen erstellt oder Managed Service for Apache Airflow-DAGs für materialisierte Daten in BigQuery-Tabellen ausgeführt.

GA4 BigQuery Export einrichten

Das Cortex Framework verwendet die BigQuery Export-Funktion von GA4, um Daten aus dem Quellsystem in BigQuery zu laden. Folgen Sie der Anleitung zum Einrichten von BigQuery Export für jede GA4-Property in diesem GA4-Hilfeartikel: [GA4] BigQuery Export einrichten.

Bekannte Probleme, Einschränkungen und weitere Aspekte

Beachten Sie beim Einrichten des GA4 BigQuery Export Folgendes:

  • Backfilling: Der GA4 BigQuery Export beginnt mit dem Tag, an dem er eingerichtet wird. Es gibt kein Backfilling.
  • Unterschied zwischen den Zahlen in der GA4-Benutzeroberfläche und im Cortex Framework: Mehrere Faktoren, darunter Stichprobenerhebung, Verzögerung bei der Datenerhebung und Berichte mit hoher Kardinalität, können zu geringfügigen Abweichungen zwischen der Google Analytics-Benutzeroberfläche und dem Cortex Framework führen. Dies ist eine bekannte und inhärente Einschränkung von Google Analytics. Weitere Informationen finden Sie unter Die Lücke zwischen Google Analytics-UI und BigQuery-Export schließen .
  • Beschränkungen für das Exportvolumen von Ereignissen: Je nach Google Analytics-Version gelten unterschiedliche Beschränkungen für das tägliche BigQuery-Exportvolumen. Weitere Informationen finden Sie unter [GA4] BigQuery Export einrichten.
  • Zeitzone: Beim BigQuery-Export wird event_date in der Berichtszeitzone der Property festgelegt, während event_timestamp der UTC-Zeitstempel in Mikrosekunden ist. Wenn event_timestamp verwendet wird, müssen Sie die Zahlen an die richtige Zeitzone für Berichte anpassen, wenn Sie sie mit Zahlen aus der Benutzeroberfläche vergleichen.
  • Tägliche Ereignisexporte im Vergleich zu Streaming-Ereignisexporten (Echtzeit): Für Ereignis-Exporte werden vom Cortex Framework nur die events_YYYYMMDD-Tabellen unterstützt, die durch den vollständigen täglichen Export erstellt wurden. Weitere Informationen finden Sie unter GA4 – BigQuery Export.
  • GA4 360-Service Level Agreement (SLA) für BigQuery Export: Das Cortex Framework unterstützt die events_fresh_-Tabellen, die durch tagesaktuelle Exporte erstellt werden, nicht als separate Quelltabellen. Sie können jedoch den ##CORTEX-CUSTOMER-Anpassungshinweisen in der Events-Berichtsdatenansicht folgen, um die Quelltabellen durch diese zu ersetzen und so das SLA zu nutzen, das durch diese Funktion bereitgestellt wird. Alle Berichtsansichten funktionieren nach dieser Ersetzung weiterhin.

Datenaktualität und ‑verzögerung

Im Allgemeinen wird die Datenaktualität für Cortex Framework-Datenquellen durch die Upstream-Verbindung und die Häufigkeit der DAG-Ausführung begrenzt. Passen Sie die Ausführungshäufigkeit Ihres DAG an die Upstream-Häufigkeit, Ressourcenbeschränkungen und Ihre geschäftlichen Anforderungen an.

Bei Google Analytics 4 kann es beim BigQuery-Export je nach Zeitzone zu einer Verzögerung von bis zu einem Tag kommen, sofern Sie nicht den tagesaktuellen Export verwenden.

Konfigurationen

In diesem Abschnitt werden die Konfigurationen für den Datenprozess beschrieben.

Verbindungen für Managed Service for Apache Airflow

Erstellen Sie die folgenden Verbindungen in Managed Airflow. Weitere Informationen finden Sie in der Dokumentation zum Verwalten von Airflow-Verbindungen.

Verbindungsname Purpose
dv360_cdc_bq Für die Übertragung von Rohdaten-Datasets zu CDC-Datasets.
dv360_reporting_bq Für die Übertragung von CDC-Datasets in Berichts-Datasets.

Berichtseinstellungen

Mit der Datei src/GA4/config/reporting_settings.yaml können Sie konfigurieren und steuern, wie Cortex Framework Daten für die letzte GA4-Berichtsebene generiert. Mit dieser Datei wird gesteuert, wie BigQuery-Objekte (Tabellen, Ansichten, Funktionen oder gespeicherte Prozeduren) für die Berichtsebene generiert werden.

Weitere Informationen finden Sie unter Datei mit Berichtseinstellungen anpassen.

Nächste Schritte