Integration mit Google Analytics 4

Auf dieser Seite werden die erforderlichen Konfigurationen beschrieben, um Daten aus Google Analytics 4 (GA4) als Datenquelle für die Marketingarbeitslast der Cortex Framework Data Foundation zu verwenden.

GA4 ist die neueste Version von Google Analytics. Es bietet eine ganzheitliche Sicht auf das Nutzerverhalten und konzentriert sich auf ereignisbasiertes Tracking und maschinelles Lernen, um detailliertere Analysen zu ermöglichen. Mit Cortex Framework können Sie Daten aus GA4 extrahieren und in BigQuery einbinden, um sie weiter zu analysieren und Berichte zu erstellen. So erhalten Sie wertvolle Einblicke und können bessere Geschäftsergebnisse erzielen.

Das folgende Diagramm zeigt, wie GA4-Daten über die Marketingarbeitslast der Cortex Framework Data Foundation verfügbar sind:

GA4-Datenquelle

Abbildung 1. GA4-Datenquelle.

Konfigurationsdatei

Die config.json Datei konfiguriert die Einstellungen, die für die Verbindung zu Datenquellen erforderlich sind, um Daten aus verschiedenen Arbeitslasten zu übertragen. Diese Datei enthält die folgenden Parameter für GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

In der folgenden Tabelle wird der Wert für jeden Marketingparameter beschrieben:

Parameter Bedeutung Standardwert Beschreibung
marketing.deployGA4 GA4 bereitstellen true Führen Sie die Bereitstellung für die GA4-Datenquelle aus.
marketing.GA4.datasets.cdc BigQuery-Export-Datasets für GA4 [{"property_id": 0, "name": ""}] Array von Google Analytics 4-BigQuery -Export-Datasets. Jedes Element gibt Property ID als INT sowie den entsprechenden Namen des BigQuery-Export-Datasets an.
marketing.GA4.datasets.reporting Berichts-Dataset für GA4 REPORTING_GA4 Berichts-Dataset für GA4.

Datenmodell

In diesem Abschnitt wird das GA4-Datenmodell anhand des Entity-Relationship-Diagramms (ERD) beschrieben.

Entity-Relationship-Diagramm für GA4

Abbildung 2. GA4: Entity-Relationship-Diagramm.

Basisansichten

Das sind die blauen Objekte im ERD. Sie sind Ansichten von CDC-Tabellen mit minimalen Transformationen zum Entpacken komplexer Datenstrukturen. Die Skripts finden Sie unter src/marketing/src/GA4/src/reporting/ddls.

Berichtsansichten

Das sind die grünen Objekte im ERD. Sie sind Berichtsansichten, die aggregierte Messwerte enthalten. Die Skripts finden Sie unter src/marketing/src/GA4/src/reporting/ddls.

Integration für GA4 konfigurieren

Die Cortex Framework Data Foundation wird in GA4 integriert, indem eine Berichtsebene über den BigQuery-Export-Datasets von GA4 erstellt wird (die in der Cortex Framework-Architektur als CDC-Datasets behandelt werden). Dies erfolgt durch das Erstellen von Laufzeitansichten über CDC-Tabellen oder das Ausführen von Managed Service for Apache Airflow-DAGs für materialisierte Daten in BigQuery-Tabellen, je nach Konfiguration der Berichtseinstellungen.

GA4-BigQuery-Export einrichten

Cortex Framework verwendet die BigQuery-Exportfunktion von GA4, um Daten aus dem Quellsystem in BigQuery zu laden. Folgen Sie der Anleitung zum Einrichten des BigQuery-Exports für jede GA4-Property in diesem GA4-Hilfeartikel: GA4-Property mit BigQuery verknüpfen.

Bekannte Probleme und Einschränkungen

Beachten Sie beim Einrichten des GA4-BigQuery-Exports Folgendes:

  • Nachträgliche Datenerfassung: Der GA4-BigQuery-Export beginnt mit dem Tag, an dem er eingerichtet wird. Eine nachträgliche Datenerfassung ist nicht möglich.
  • Unterschied zwischen den in der GA4-Benutzeroberfläche und in Cortex Framework gemeldeten Zahlen: Mehrere Faktoren, darunter Stichprobenerhebung, Verzögerung bei der Datenerfassung und Berichte mit hoher Kardinalität, können zu geringfügigen Abweichungen zwischen der Google Analytics-Benutzeroberfläche und Cortex Framework führen. Dies ist eine bekannte und inhärente Einschränkung von Google Analytics. Weitere Informationen finden Sie unter Die Lücke zwischen Google Analytics-UI und BigQuery-Export schließen .
  • Beschränkungen des Ereignisexportvolumens: Je nach Google Analytics-Version können unterschiedliche Beschränkungen für das BigQuery-Exportvolumen pro Tag gelten. Weitere Informationen finden Sie unter GA4 – BigQuery Export einrichten.
  • Zeitzone: In BigQuery Export wird event_date in der Berichtszeitzone der Property festgelegt, während event_timestamp der UTC-Zeitstempel in Mikrosekunden ist. Wenn event_timestamp verwendet wird, müssen Sie die korrekte Berichtszeitzone anpassen, wenn Sie sie mit den Zahlen der Benutzeroberfläche vergleichen.
  • Tägliche vs. Streaming-Ereignisexporte (Echtzeit): Für Ereignis-Exporte unterstützt Cortex Framework nur die events_YYYYMMDD-Tabellen, die durch den vollständigen täglichen Export erstellt wurden. Weitere Informationen finden Sie unter GA4 - BigQuery Export.
  • GA4 360-Service Level Agreement (SLA) für BigQuery Export: Cortex Framework unterstützt die events_fresh_ Tabellen, die durch tagesaktuelle Exporte erstellt wurden, nicht als separate Quelltabellen. Sie können jedoch den ##CORTEX-CUSTOMER Anpassungskommentaren in der Events Berichtsdatenansicht folgen, um die Quell tabellen durch diese zu ersetzen und so das SLA zu nutzen, das von dieser Funktion bereitgestellt wird. Alle Berichtsansichten funktionieren nach dieser Ersetzung weiterhin.

Datenaktualität und Verzögerung

Im Allgemeinen wird die Datenaktualität für Cortex Framework-Datenquellen durch die Möglichkeiten der Upstream-Verbindung sowie die Häufigkeit der DAG-Ausführung begrenzt. Passen Sie die Häufigkeit der DAG-Ausführung an die Upstream-Häufigkeit, die Ressourcenbeschränkungen und Ihre geschäftlichen Anforderungen an.

Bei Google Analytics 4 können sich BigQuery-Exportdaten je nach Zeitzone um bis zu einen Tag verzögern, es sei denn, Sie verwenden den tagesaktuellen Export.

Konfigurationen

In diesem Abschnitt werden die Konfigurationen für den Datenprozess beschrieben.

Managed Service for Apache Airflow-Verbindungen

Erstellen Sie die folgenden Verbindungen in Managed Airflow. Weitere Informationen finden Sie in der Dokumentation zu Airflow-Verbindungen verwalten.

Verbindungsname Zweck
dv360_cdc_bq Für die Übertragung von Rohdaten-Datasets zu CDC-Datasets.
dv360_reporting_bq Für die Übertragung von CDC-Datasets zu Berichts-Datasets Transfer.

Berichtseinstellungen

Sie können konfigurieren und steuern, wie Cortex Framework Daten für die endgültige Berichtsebene von GA4 generiert, indem Sie die Datei mit den Berichtseinstellungen src/GA4/config/reporting_settings.yaml verwenden. Diese Datei steuert, wie BigQuery-Objekte der Berichtsebene (Tabellen, Ansichten, Funktionen oder gespeicherte Prozeduren) generiert werden.

Weitere Informationen finden Sie unter Datei mit Berichtseinstellungen anpassen.

Nächste Schritte