Integration mit Google Analytics 4
Auf dieser Seite werden die erforderlichen Konfigurationen beschrieben, um Daten aus Google Analytics 4 (GA4) als Datenquelle für die Marketingarbeitslast der Cortex Framework Data Foundation zu verwenden.
GA4 ist die neueste Version von Google Analytics. Es bietet eine ganzheitliche Sicht auf das Nutzerverhalten und konzentriert sich auf ereignisbasiertes Tracking und maschinelles Lernen, um detailliertere Analysen zu ermöglichen. Mit Cortex Framework können Sie Daten aus GA4 extrahieren und in BigQuery einbinden, um sie weiter zu analysieren und Berichte zu erstellen. So erhalten Sie wertvolle Einblicke und können bessere Geschäftsergebnisse erzielen.
Das folgende Diagramm zeigt, wie GA4-Daten über die Marketingarbeitslast der Cortex Framework Data Foundation verfügbar sind:

Konfigurationsdatei
Die config.json
Datei konfiguriert die Einstellungen, die für die Verbindung zu Datenquellen erforderlich sind, um
Daten aus verschiedenen Arbeitslasten zu übertragen. Diese Datei enthält die folgenden Parameter für GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
In der folgenden Tabelle wird der Wert für jeden Marketingparameter beschrieben:
| Parameter | Bedeutung | Standardwert | Beschreibung |
marketing.deployGA4
|
GA4 bereitstellen | true
|
Führen Sie die Bereitstellung für die GA4-Datenquelle aus. |
marketing.GA4.datasets.cdc
|
BigQuery-Export-Datasets für GA4 | [{"property_id": 0, "name": ""}]
|
Array von Google Analytics 4-BigQuery
-Export-Datasets. Jedes Element gibt Property ID als
INT sowie den entsprechenden Namen des BigQuery-Export-Datasets an.
|
marketing.GA4.datasets.reporting
|
Berichts-Dataset für GA4 | REPORTING_GA4
|
Berichts-Dataset für GA4. |
Datenmodell
In diesem Abschnitt wird das GA4-Datenmodell anhand des Entity-Relationship-Diagramms (ERD) beschrieben.
Basisansichten
Das sind die blauen Objekte im ERD. Sie sind Ansichten von CDC-Tabellen mit minimalen Transformationen zum Entpacken komplexer Datenstrukturen. Die Skripts finden Sie unter
src/marketing/src/GA4/src/reporting/ddls.
Berichtsansichten
Das sind die grünen Objekte im ERD. Sie sind Berichtsansichten, die aggregierte Messwerte enthalten. Die Skripts finden Sie unter
src/marketing/src/GA4/src/reporting/ddls.
Integration für GA4 konfigurieren
Die Cortex Framework Data Foundation wird in GA4 integriert, indem eine Berichtsebene über den BigQuery-Export-Datasets von GA4 erstellt wird (die in der Cortex Framework-Architektur als CDC-Datasets behandelt werden). Dies erfolgt durch das Erstellen von Laufzeitansichten über CDC-Tabellen oder das Ausführen von Managed Service for Apache Airflow-DAGs für materialisierte Daten in BigQuery-Tabellen, je nach Konfiguration der Berichtseinstellungen.
GA4-BigQuery-Export einrichten
Cortex Framework verwendet die BigQuery-Exportfunktion von GA4, um Daten aus dem Quellsystem in BigQuery zu laden. Folgen Sie der Anleitung zum Einrichten des BigQuery-Exports für jede GA4-Property in diesem GA4-Hilfeartikel: GA4-Property mit BigQuery verknüpfen.
Bekannte Probleme und Einschränkungen
Beachten Sie beim Einrichten des GA4-BigQuery-Exports Folgendes:
- Nachträgliche Datenerfassung: Der GA4-BigQuery-Export beginnt mit dem Tag, an dem er eingerichtet wird. Eine nachträgliche Datenerfassung ist nicht möglich.
- Unterschied zwischen den in der GA4-Benutzeroberfläche und in Cortex Framework gemeldeten Zahlen: Mehrere Faktoren, darunter Stichprobenerhebung, Verzögerung bei der Datenerfassung und Berichte mit hoher Kardinalität, können zu geringfügigen Abweichungen zwischen der Google Analytics-Benutzeroberfläche und Cortex Framework führen. Dies ist eine bekannte und inhärente Einschränkung von Google Analytics. Weitere Informationen finden Sie unter Die Lücke zwischen Google Analytics-UI und BigQuery-Export schließen .
- Beschränkungen des Ereignisexportvolumens: Je nach Google Analytics-Version können unterschiedliche Beschränkungen für das BigQuery-Exportvolumen pro Tag gelten. Weitere Informationen finden Sie unter GA4 – BigQuery Export einrichten.
- Zeitzone: In BigQuery Export wird
event_datein der Berichtszeitzone der Property festgelegt, währendevent_timestampder UTC-Zeitstempel in Mikrosekunden ist. Wennevent_timestampverwendet wird, müssen Sie die korrekte Berichtszeitzone anpassen, wenn Sie sie mit den Zahlen der Benutzeroberfläche vergleichen. - Tägliche vs. Streaming-Ereignisexporte (Echtzeit): Für Ereignis-Exporte unterstützt Cortex Framework nur die
events_YYYYMMDD-Tabellen, die durch den vollständigen täglichen Export erstellt wurden. Weitere Informationen finden Sie unter GA4 - BigQuery Export. - GA4 360-Service Level Agreement (SLA) für BigQuery Export:
Cortex Framework unterstützt die
events_fresh_Tabellen, die durch tagesaktuelle Exporte erstellt wurden, nicht als separate Quelltabellen. Sie können jedoch den##CORTEX-CUSTOMERAnpassungskommentaren in derEventsBerichtsdatenansicht folgen, um die Quell tabellen durch diese zu ersetzen und so das SLA zu nutzen, das von dieser Funktion bereitgestellt wird. Alle Berichtsansichten funktionieren nach dieser Ersetzung weiterhin.
Datenaktualität und Verzögerung
Im Allgemeinen wird die Datenaktualität für Cortex Framework-Datenquellen durch die Möglichkeiten der Upstream-Verbindung sowie die Häufigkeit der DAG-Ausführung begrenzt. Passen Sie die Häufigkeit der DAG-Ausführung an die Upstream-Häufigkeit, die Ressourcenbeschränkungen und Ihre geschäftlichen Anforderungen an.
Bei Google Analytics 4 können sich BigQuery-Exportdaten je nach Zeitzone um bis zu einen Tag verzögern, es sei denn, Sie verwenden den tagesaktuellen Export.
Konfigurationen
In diesem Abschnitt werden die Konfigurationen für den Datenprozess beschrieben.
Managed Service for Apache Airflow-Verbindungen
Erstellen Sie die folgenden Verbindungen in Managed Airflow. Weitere Informationen finden Sie in der Dokumentation zu Airflow-Verbindungen verwalten.
| Verbindungsname | Zweck |
dv360_cdc_bq
|
Für die Übertragung von Rohdaten-Datasets zu CDC-Datasets. |
dv360_reporting_bq
|
Für die Übertragung von CDC-Datasets zu Berichts-Datasets Transfer. |
Berichtseinstellungen
Sie können konfigurieren und steuern, wie Cortex Framework Daten für die endgültige Berichtsebene von GA4 generiert, indem Sie die Datei mit den Berichtseinstellungen src/GA4/config/reporting_settings.yaml verwenden. Diese Datei steuert, wie BigQuery-Objekte der Berichtsebene (Tabellen, Ansichten, Funktionen oder gespeicherte Prozeduren) generiert werden.
Weitere Informationen finden Sie unter Datei mit Berichtseinstellungen anpassen.
Nächste Schritte
- Weitere Informationen zu anderen Datenquellen und Arbeitslasten finden Sie unter Datenquellen und Arbeitslasten.
- Weitere Informationen zu den Schritten für die Bereitstellung in Produktionsumgebungen, siehe Voraussetzungen für die Bereitstellung der Cortex Framework Data Foundation.
