Integration mit Google Analytics 4
Auf dieser Seite werden die erforderlichen Konfigurationen beschrieben, um Daten aus Google Analytics 4 (GA4) als Datenquelle für die Marketing-Arbeitslast der Cortex Framework Data Foundation zu verwenden.
GA4 ist die neueste Version von Google Analytics. Sie bietet einen ganzheitlichen Überblick über das Nutzerverhalten und konzentriert sich auf ereignisbasiertes Tracking und maschinelles Lernen, um tiefere Einblicke zu ermöglichen. Mit dem Cortex Framework können Sie Daten aus GA4 extrahieren und zur weiteren Analyse und Berichterstellung in BigQuery einbinden. So können Sie wertvolle Statistiken erhalten und bessere Geschäftsergebnisse erzielen.
Das folgende Diagramm zeigt, wie GA4-Daten über die Marketing-Arbeitslast der Cortex Framework Data Foundation verfügbar sind:

Konfigurationsdatei
In der Datei config.json werden die Einstellungen konfiguriert, die für die Verbindung zu Datenquellen zum Übertragen von Daten aus verschiedenen Arbeitslasten erforderlich sind. Diese Datei enthält die folgenden Parameter für GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
In der folgenden Tabelle wird der Wert für jeden Marketingparameter beschrieben:
| Parameter | Bedeutung | Standardwert | Beschreibung |
marketing.deployGA4
|
GA4 bereitstellen | true
|
Führen Sie die Bereitstellung für die GA4-Datenquelle aus. |
marketing.GA4.datasets.cdc
|
BigQuery Export-Datasets für GA4 | [{"property_id": 0, "name": ""}]
|
Array von Google Analytics 4-BigQuery-Export-Datasets. Jedes Element gibt Property ID als INT sowie den entsprechenden Namen des BigQuery-Export-Datasets an.
|
marketing.GA4.datasets.reporting
|
Berichtsdatensatz für GA4 | REPORTING_GA4
|
Berichtsdatensatz für GA4. |
Datenmodell
In diesem Abschnitt wird das GA4-Datenmodell anhand des Entity-Relationship-Diagramms (ERD) beschrieben.
Basisansichten
Das sind die blauen Objekte im ERD. Sie sind Ansichten von CDC-Tabellen mit minimalen Transformationen zum Entpacken komplexer Datenstrukturen. Scripts finden Sie unter src/marketing/src/GA4/src/reporting/ddls.
Berichtsdatenansichten
Das sind die grünen Objekte im ERD. Sie sind Berichtsansichten, die aggregierte Messwerte enthalten. Scripts finden Sie unter src/marketing/src/GA4/src/reporting/ddls.
Integration für GA4 konfigurieren
Die Data Foundation von Cortex Framework wird in GA4 eingebunden, indem eine Berichtsebene über den BigQuery Export-Datasets von GA4 erstellt wird. Diese werden in der Cortex Framework-Architektur als CDC-Datasets behandelt. Dazu werden je nach Konfiguration der Berichterstellungseinstellungen Laufzeitansichten für CDC-Tabellen erstellt oder Managed Service for Apache Airflow-DAGs für materialisierte Daten in BigQuery-Tabellen ausgeführt.
GA4 BigQuery Export einrichten
Das Cortex Framework verwendet die BigQuery Export-Funktion von GA4, um Daten aus dem Quellsystem in BigQuery zu laden. Folgen Sie der Anleitung zum Einrichten von BigQuery Export für jede GA4-Property in diesem GA4-Hilfeartikel: [GA4] BigQuery Export einrichten.
Bekannte Probleme, Einschränkungen und weitere Aspekte
Beachten Sie beim Einrichten des GA4 BigQuery Export Folgendes:
- Backfilling: Der GA4 BigQuery Export beginnt mit dem Tag, an dem er eingerichtet wird. Es gibt kein Backfilling.
- Unterschied zwischen den Zahlen in der GA4-Benutzeroberfläche und im Cortex Framework: Mehrere Faktoren, darunter Stichprobenerhebung, Verzögerung bei der Datenerhebung und Berichte mit hoher Kardinalität, können zu geringfügigen Abweichungen zwischen der Google Analytics-Benutzeroberfläche und dem Cortex Framework führen. Dies ist eine bekannte und inhärente Einschränkung von Google Analytics. Weitere Informationen finden Sie unter Die Lücke zwischen Google Analytics-UI und BigQuery-Export schließen .
- Beschränkungen für das Exportvolumen von Ereignissen: Je nach Google Analytics-Version gelten unterschiedliche Beschränkungen für das tägliche BigQuery-Exportvolumen. Weitere Informationen finden Sie unter [GA4] BigQuery Export einrichten.
- Zeitzone: Beim BigQuery-Export wird
event_datein der Berichtszeitzone der Property festgelegt, währendevent_timestampder UTC-Zeitstempel in Mikrosekunden ist. Wennevent_timestampverwendet wird, müssen Sie die Zahlen an die richtige Zeitzone für Berichte anpassen, wenn Sie sie mit Zahlen aus der Benutzeroberfläche vergleichen. - Tägliche Ereignisexporte im Vergleich zu Streaming-Ereignisexporten (Echtzeit): Für Ereignis-Exporte werden vom Cortex Framework nur die
events_YYYYMMDD-Tabellen unterstützt, die durch den vollständigen täglichen Export erstellt wurden. Weitere Informationen finden Sie unter GA4 – BigQuery Export. - GA4 360-Service Level Agreement (SLA) für BigQuery Export:
Das Cortex Framework unterstützt die
events_fresh_-Tabellen, die durch tagesaktuelle Exporte erstellt werden, nicht als separate Quelltabellen. Sie können jedoch den##CORTEX-CUSTOMER-Anpassungshinweisen in derEvents-Berichtsdatenansicht folgen, um die Quelltabellen durch diese zu ersetzen und so das SLA zu nutzen, das durch diese Funktion bereitgestellt wird. Alle Berichtsansichten funktionieren nach dieser Ersetzung weiterhin.
Datenaktualität und ‑verzögerung
Im Allgemeinen wird die Datenaktualität für Cortex Framework-Datenquellen durch die Upstream-Verbindung und die Häufigkeit der DAG-Ausführung begrenzt. Passen Sie die Ausführungshäufigkeit Ihres DAG an die Upstream-Häufigkeit, Ressourcenbeschränkungen und Ihre geschäftlichen Anforderungen an.
Bei Google Analytics 4 kann es beim BigQuery-Export je nach Zeitzone zu einer Verzögerung von bis zu einem Tag kommen, sofern Sie nicht den tagesaktuellen Export verwenden.
Konfigurationen
In diesem Abschnitt werden die Konfigurationen für den Datenprozess beschrieben.
Verbindungen für Managed Service for Apache Airflow
Erstellen Sie die folgenden Verbindungen in Managed Airflow. Weitere Informationen finden Sie in der Dokumentation zum Verwalten von Airflow-Verbindungen.
| Verbindungsname | Purpose |
dv360_cdc_bq
|
Für die Übertragung von Rohdaten-Datasets zu CDC-Datasets. |
dv360_reporting_bq
|
Für die Übertragung von CDC-Datasets in Berichts-Datasets. |
Berichtseinstellungen
Mit der Datei src/GA4/config/reporting_settings.yaml können Sie konfigurieren und steuern, wie Cortex Framework Daten für die letzte GA4-Berichtsebene generiert. Mit dieser Datei wird gesteuert, wie BigQuery-Objekte (Tabellen, Ansichten, Funktionen oder gespeicherte Prozeduren) für die Berichtsebene generiert werden.
Weitere Informationen finden Sie unter Datei mit Berichtseinstellungen anpassen.
Nächste Schritte
- Weitere Informationen zu anderen Datenquellen und Arbeitslasten finden Sie unter Datenquellen und Arbeitslasten.
- Weitere Informationen zu den Schritten für die Bereitstellung in Produktionsumgebungen finden Sie unter Voraussetzungen für die Bereitstellung der Cortex Framework Data Foundation.
