Integration mit Campaign Manager 360

Auf dieser Seite werden die erforderlichen Konfigurationen beschrieben, um Daten aus Campaign Manager 360 als Datenquelle für die Marketing-Arbeitslast der Cortex Framework Data Foundation zu verwenden.

Campaign Manager 360 (CM360) ist eine webbasierte Plattform zur Anzeigenverwaltung von Google, die speziell für Werbetreibende und Agenturen entwickelt wurde. Sie dient als zentraler Hub zum Verwalten und Optimieren aller digitalen Werbekampagnen auf verschiedenen Kanälen. Cortex Framework bietet die Tools und die Plattform, um CM360-Daten zu analysieren, sie mit Daten aus anderen Marketingkanälen zu kombinieren und mithilfe von KI umfassendere Statistiken zu erhalten und die gesamte Marketingstrategie zu optimieren.

Das folgende Diagramm zeigt, wie CM360-Daten über die Marketing-Arbeitslast der Cortex Framework Data Foundation verfügbar sind:

CM360-Datenquelle

Abbildung 1. CM360-Datenquelle

Konfigurationsdatei

Die config.json Datei konfiguriert die Einstellungen, die für die Verbindung zu Datenquellen erforderlich sind, um Daten aus verschiedenen Arbeitslasten zu übertragen. Diese Datei enthält die folgenden Parameter für CM360:

   "marketing": {
        "deployCM360": true,
        }

        "CM360": {
            "deployCDC": true,
            "dataTransferBucket": "",
            "datasets": {
                "cdc": "",
                "raw": "",
                "reporting": "REPORTING_CM360"
            }
        }

In der folgenden Tabelle wird der Wert für jeden Marketingparameter beschrieben:

Parameter Bedeutung Standardwert Beschreibung
marketing.deployCM360 CM360 bereitstellen true Führen Sie die Bereitstellung für die CM360-Datenquelle aus.
marketing.CM360.deployCDC CDC-Skripts für CM360 bereitstellen true Generieren Sie CM360-CDC-Verarbeitungsskripts, die als DAGs in Managed Service for Apache Airflow ausgeführt werden.
marketing.CM360.dataTransferBucket Bucket mit Ergebnissen des Data Transfer Service - Bucket, in dem DTv2-Dateien gespeichert sind.
marketing.CM360.datasets.cdc CDC-Dataset für CM360 CDC-Dataset für CM360.
marketing.CM360.datasets.raw Rohdaten-Dataset für CM360 Rohdaten-Dataset für CM360.
marketing.CM360.datasets.reporting Berichts-Dataset für CM360 "REPORTING_CM360" Berichts-Dataset für CM360.

Datenmodell

In diesem Abschnitt wird das CM360-Datenmodell anhand des Entity-Relationship-Diagramms (ERD) beschrieben.

Entitätsbeziehungsdiagramm für CM360

Abbildung 2. CM360: Entity-Relationship-Diagramm

Basisansichten

Das sind die blauen Objekte im ERD. Sie sind Ansichten von CDC-Tabellen ohne Transformationen außer einigen Aliasnamen für Spaltennamen. Die Skripts finden Sie unter src/marketing/src/CM360/src/reporting/ddls.

Berichtsdatenansichten

Das sind die grünen Objekte im ERD. Sie sind Berichtsansichten, die aggregierte Messwerte enthalten. Die Skripts finden Sie unter src/marketing/src/CM360/src/reporting/ddls.

Speicher für DTv2-Dateien

DTv2-Dateien (Data Transfer Version 2) haben ein bestimmtes Format, das von CM360 verwendet wird, um Leistungsdaten von Kampagnen zu liefern. Richten Sie den Datenübertragungsprozess gemäß der Dokumentation zu Data Transfer V2.0 ein, um CM360 mit Cortex Framework zu verwenden.

Erstellen oder fügen Sie einen Cloud Storage-Bucket hinzu, um Ihre DTv2-Dateien aus CM360 zu speichern. Achten Sie darauf, dass die Dateien im Bucket vom Dienstkonto gelesen werden können, das DAGs in Managed Airflow ausführt. Weitere Informationen finden Sie unter Speicher-Buckets erstellen.

Datenaktualität und Verzögerung

Im Allgemeinen wird die Datenaktualität für Cortex Framework-Datenquellen durch die Upstream-Verbindung sowie die Häufigkeit der DAG-Ausführung begrenzt. Passen Sie die Häufigkeit der DAG-Ausführung an die Upstream-Häufigkeit, die Ressourcenbeschränkungen und Ihre geschäftlichen Anforderungen an.

Mit CM360 Data Transfer v2, werden Daten zu Impressionen und Klicks 24 Mal pro Tag (stündlich) bereitgestellt. Die Verarbeitungszeit kann je nach Datei variieren, sodass Dateien möglicherweise in falscher Reihenfolge angezeigt werden. Aktivitätsdateien werden täglich bereitgestellt.

Managed Airflow-Verbindungen

Erstellen Sie die folgenden Verbindungen in Managed Airflow. Weitere Informationen finden Sie unter siehe die Dokumentation zu Airflow-Verbindungen verwalten.

Verbindungsname Purpose
cm360_raw_dataflow Für CM360-DTv2-Dateien > BigQuery Rohdaten-Dataset
cm360_cdc_bq Für Rohdaten-Dataset > CDC-Dataset-Übertragung
cm360_reporting_bq Für CDC-Dataset > Berichts-Dataset Übertragung

Berechtigungen für das Dienstkonto von Managed Service for Apache Airflow

Gewähren Sie dem Dienstkonto, das in Managed Airflow verwendet wird (wie in der Verbindung cm360_raw_dataflow konfiguriert), Dataflow-Berechtigungen. Eine Anleitung finden Sie in der Dataflow-Dokumentation.

Aufnahmeeinstellungen

Sie können die Datenpipelines Source to Raw und Raw to CDC über die Einstellungen in der Datei src/CM360/config/ingestion_settings.yaml steuern. In diesem Abschnitt werden die Parameter der einzelnen Datenpipelines beschrieben.

Tabellen „Source to Raw“

In diesem Abschnitt wird beschrieben, wie Einträge gesteuert werden, mit denen festgelegt wird, welche Dateien aus DTv2 verarbeitet werden. Jeder Eintrag entspricht Dateien, die mit einer Entität verknüpft sind. Basierend auf dieser Konfiguration erstellt Cortex Framework Airflow-DAGs, die Dataflow-Pipelines ausführen, um Daten aus den DTv2-Dateien zu verarbeiten.

Die folgenden Parameter steuern die Einstellungen für Source to Raw für jeden Eintrag:

Parameter Beschreibung
base_table Tabelle im Rohdaten-Dataset, in dem die Daten für eine Entität gespeichert sind (z. B. „Klicks“-Daten).
load_frequency Wie oft ein DAG für diese Entität ausgeführt wird, um die CDC-Tabelle zu füllen. Weitere Informationen zu möglichen Werten finden Sie in der Airflow-Dokumentation.
file_pattern Basierte Dateinamensmuster die einer Entität entsprechen.
schema_file Schemadatei im src/table_schema Verzeichnis, die DTv2-Felder den Spaltennamen und Datentypen der Zieltabelle zuordnet.
partition_details Optional: Wenn diese Tabelle aus Leistungsgründen partitioniert werden soll. Weitere Informationen finden Sie unter Tabellenpartitionierung.
cluster_details Optional: Wenn diese Tabelle aus Leistungsgründen geclustert werden soll. Weitere Informationen finden Sie unter Clustereinstellungen.

Tabellen „Raw to CDC“

Dieser Abschnitt enthält Einträge, mit denen gesteuert wird, wie Daten aus Rohdatentabellen in CDC-Tabellen verschoben werden. Jeder Eintrag entspricht einer Rohdatentabelle, die wiederum der oben genannten DTv2-Entität entspricht.

Die folgenden Parameter steuern die Einstellungen für Raw to CDC für jeden Eintrag:

Parameter Beschreibung
base_table Tabelle im CDC-Dataset, in dem die Rohdaten nach der CDC-Transformation gespeichert werden (z. B. customer).
load_frequency Wie oft ein DAG für diese Entität ausgeführt wird, um die CDC-Tabelle zu füllen. Weitere Informationen zu möglichen Werten finden Sie in der Airflow-Dokumentation.
row_identifiers Liste der Spalten (durch Kommas getrennt) die einen eindeutigen Datensatz für diese Tabelle bilden.
partition_details Optional: Wenn diese Tabelle aus Leistungsgründen partitioniert werden soll. Weitere Informationen finden Sie unter Tabellenpartitionierung.
cluster_details Optional: Wenn diese Tabelle aus Leistungsgründen geclustert werden soll. Weitere Informationen finden Sie unter Clustereinstellungen.
Berichtseinstellungen

Sie können konfigurieren und steuern, wie Cortex Framework Daten für die endgültige Berichtsebene von CM360 generiert. Verwenden Sie dazu die Datei mit den Berichtseinstellungen (src/CM360/config/reporting_settings.yaml). Mit dieser Datei wird festgelegt, wie BigQuery-Objekte (Tabellen, Ansichten, Funktionen oder gespeicherte Prozeduren) der Berichtsebene generiert werden.

Weitere Informationen finden Sie unter Datei mit Berichtseinstellungen anpassen.

Nächste Schritte