Integrazione con Campaign Manager 360

Questa pagina descrive le configurazioni richieste per importare i dati da Campaign Manager 360 come origine dati del carico di lavoro di marketing di Cortex Framework Data Foundation.

Campaign Manager 360 (CM360) è una piattaforma di gestione della pubblicità basata sul web offerta da Google e progettata specificamente per inserzionisti e agenzie. Funziona come hub centrale per gestire e ottimizzare tutte le tue campagne pubblicitarie digitali su vari canali. Cortex Framework fornisce gli strumenti e la piattaforma per analizzare i dati di CM360, combinarli con i dati di altri canali di marketing e utilizzare l'AI per ottenere informazioni più approfondite e ottimizzare la tua strategia di marketing complessiva.

Il seguente diagramma descrive come i dati CM360 sono disponibili tramite il workload di marketing di Cortex Framework Data Foundation:

Origine dati CM360

Figura 1. Origine dati CM360.

File di configurazione

Il file config.json configura le impostazioni necessarie per connettersi alle origini dati per il trasferimento dei dati da vari workload. Questo file contiene i seguenti parametri per CM360:

   "marketing": {
        "deployCM360": true,
        }

        "CM360": {
            "deployCDC": true,
            "dataTransferBucket": "",
            "datasets": {
                "cdc": "",
                "raw": "",
                "reporting": "REPORTING_CM360"
            }
        }

La seguente tabella descrive il valore di ogni parametro di marketing:

Parametro Significato Valore predefinito Descrizione
marketing.deployCM360 Esegui il deployment di CM360 true Esegui il deployment per l'origine dati CM360.
marketing.CM360.deployCDC Implementare gli script CDC per CM360 true Genera script di elaborazione CDC CM360 da eseguire come DAG in Managed Service for Apache Airflow.
marketing.CM360.dataTransferBucket Bucket con i risultati di Data Transfer Service - Bucket in cui sono archiviati i file DTv2.
marketing.CM360.datasets.cdc Dataset CDC per CM360 Set di dati CDC per CM360.
marketing.CM360.datasets.raw Set di dati non elaborati per CM360 Set di dati non elaborati per CM360.
marketing.CM360.datasets.reporting Set di dati dei report per CM360 "REPORTING_CM360" Set di dati dei report per CM360.

Modello dati

Questa sezione descrive il modello di dati CM360 utilizzando il diagramma delle relazioni tra entità (ERD).

Diagramma delle relazioni tra entità per CM360

Figura 2. CM360: diagramma delle relazioni tra entità.

Visualizzazioni di base

Si tratta degli oggetti blu nel diagramma ERD e sono viste delle tabelle CDC senza trasformazioni, ad eccezione di alcuni alias dei nomi delle colonne. Vedi gli script in src/marketing/src/CM360/src/reporting/ddls.

Viste report

Si tratta degli oggetti verdi nel diagramma ER e sono viste dei report che contengono metriche aggregate. Vedi gli script in src/marketing/src/CM360/src/reporting/ddls.

Archiviazione file DTv2

I file DTv2 (Data Transfer versione 2) sono un formato specifico utilizzato da CM360 per fornire i dati sul rendimento delle campagne. Configura il processo di trasferimento dei dati seguendo la documentazione di Data Transfer V2.0 per utilizzare CM360 con Cortex Framework.

Crea o aggiungi un bucket Cloud Storage per archiviare i file DTv2 di CM360. Assicurati che i file nel bucket siano leggibili dal account di servizio che esegue i DAG in Managed Airflow. Per saperne di più, consulta Creare bucket di archiviazione.

Aggiornamento e ritardo dei dati

Come regola generale, l'aggiornamento dei dati per le origini dati di Cortex Framework è limitato da ciò che consente la connessione upstream, nonché dalla frequenza di esecuzione del DAG. Modifica la frequenza di esecuzione del DAG in modo che sia in linea con la frequenza upstream, i vincoli delle risorse e le esigenze aziendali.

Con Data Transfer v2 di CM360, i dati su impressioni e clic vengono inviati 24 volte al giorno (ogni ora). Il tempo di elaborazione può variare in base al file, quindi i file potrebbero non essere visualizzati in ordine. I file di attività vengono inviati ogni giorno.

Connessioni Managed Airflow

Crea le seguenti connessioni in Managed Airflow. Per ulteriori dettagli, consulta la documentazione Gestire le connessioni Airflow.

Nome connessione Purpose
cm360_raw_dataflow Per i file CM360 DTv2 > BigQuery Set di dati non elaborato
cm360_cdc_bq Per il set di dati Raw > Trasferimento del set di dati CDC
cm360_reporting_bq Per il set di dati CDC > Trasferimento del set di dati dei report

Autorizzazioni del account di servizio Managed Service for Apache Airflow

Concedi le autorizzazioni Dataflow al account di servizio utilizzato in Managed Airflow (come configurato nella connessione cm360_raw_dataflow). Consulta le istruzioni nella documentazione di Dataflow.

Impostazioni di importazione

Controlla le pipeline di dati Source to Raw e Raw to CDC tramite le impostazioni nel file src/CM360/config/ingestion_settings.yaml. Questa sezione descrive i parametri di ogni pipeline di dati.

Origine alle tabelle non elaborate

Questa sezione descrive come le voci che controllano quali file di DTv2 vengono elaborati. Ogni voce corrisponde ai file associati a un'entità. In base a questa configurazione, Cortex Framework crea DAG Airflow che eseguono pipeline Dataflow per elaborare i dati dai file DTv2.

I seguenti parametri controllano le impostazioni per Source to Raw per ogni voce:

Parametro Descrizione
base_table Tabella nel set di dati non elaborato in cui sono archiviati i dati per un'entità (ad esempio, i dati "Clic").
load_frequency La frequenza con cui viene eseguito un DAG per questa entità per popolare la tabella CDC. Per saperne di più sui valori possibili, consulta la documentazione di Airflow.
file_pattern Basati su pattern di nomi di file che corrispondono a un'entità.
schema_file File di schema nella directory src/table_schema che mappa i campi DTv2 ai nomi delle colonne e ai tipi di dati della tabella di destinazione.
partition_details (Facoltativo) Se vuoi che questa tabella venga partizionata per motivi di rendimento. Per saperne di più, vedi Partizione della tabella.
cluster_details (Facoltativo) Se vuoi che questa tabella venga raggruppata per motivi di rendimento. Per saperne di più, vedi Impostazioni cluster.

Tabelle non elaborate in tabelle CDC

Questa sezione contiene voci che controllano il modo in cui i dati vengono spostati dalle tabelle non elaborate alle tabelle CDC. Ogni voce corrisponde a una tabella non elaborata (che a sua volta corrisponde all'entità DTv2 come indicato sopra).

I seguenti parametri controllano le impostazioni per Raw to CDC per ogni voce:

Parametro Descrizione
base_table Tabella nel set di dati CDC in cui sono archiviati i dati non elaborati dopo la trasformazione CDC (ad esempio, customer).
load_frequency La frequenza con cui viene eseguito un DAG per questa entità per popolare la tabella CDC. Per saperne di più sui valori possibili, consulta la documentazione di Airflow.
row_identifiers Elenco di colonne (separate da virgola) che formano un record univoco per questa tabella.
partition_details (Facoltativo) Se vuoi che questa tabella venga partizionata per motivi di rendimento. Per saperne di più, vedi Partizione della tabella.
cluster_details (Facoltativo) Se vuoi che questa tabella venga raggruppata per motivi di rendimento. Per saperne di più, consulta Impostazioni cluster.
Impostazioni report

Puoi configurare e controllare il modo in cui Cortex Framework genera i dati per il livello di report finale di CM360 utilizzando il file delle impostazioni dei report (src/CM360/config/reporting_settings.yaml). Questo file controlla la modalità di generazione degli oggetti BigQuery del livello di report (tabelle, viste, funzioni o procedure archiviate).

Per ulteriori informazioni, vedi Personalizzare il file delle impostazioni dei report.

Passaggi successivi