Integration mit TikTok

Auf dieser Seite werden die erforderlichen Konfigurationen beschrieben, um Daten aus TikTok als Datenquelle für die Marketingarbeitslast der Cortex Framework Data Foundation zu verwenden.

TikTok ist eine beliebte Social-Media-App, die für Kurzvideos bekannt ist. Cortex Framework kann Daten daraus abrufen, um die allgemeine Marketingleistung zu analysieren. Durch die Kombination von Daten aus TikTok und verschiedenen anderen Quellen erhalten Sie ein umfassenderes Bild Ihrer Zielgruppe und der Effektivität Ihrer Social-Media-Kampagnen auf verschiedenen Plattformen.

Das folgende Diagramm zeigt, wie TikTok-Daten über die Marketingarbeitslast der Cortex Framework Data Foundation verfügbar sind:

TikTok-Datenquelle

Abbildung 1. TikTok-Datenquelle.

Konfigurationsdatei

Die config.json Datei konfiguriert die Einstellungen, die für die Verbindung zu Datenquellen erforderlich sind, um Daten aus verschiedenen Arbeitslasten zu übertragen. Diese Datei enthält die folgenden Parameter für TikTok:

   "marketing": {
        "deployTikTok": true,
        },
        "TikTok": {
            "deployCDC": true,
            "datasets": {
                "cdc": "",
                "raw": "",
                "reporting": "REPORTING_TikTok"
            }
        }

In der folgenden Tabelle wird der Wert für jeden Marketingparameter beschrieben:

Parameter Bedeutung Standardwert Beschreibung
marketing.deployTikTok TikTok bereitstellen true Die Bereitstellung für die TikTok-Datenquelle ausführen.
marketing.TikTok.deployCDC CDC-Skripts für TikTok bereitstellen true CDC-Verarbeitungsskripts für TikTok generieren, die als DAGs in Managed Service for Apache Airflow ausgeführt werden.
marketing.TikTok.datasets.cdc CDC-Dataset für TikTok CDC-Dataset für TikTok.
marketing.TikTok.datasets.raw Rohdaten-Dataset für TikTok Rohdaten-Dataset für TikTok.
marketing.TikTok.datasets.reporting Berichts-Dataset für TikTok "REPORTING_TikTok" Berichts-Dataset für TikTok.

Datenmodell

In diesem Abschnitt wird das TikTok-Datenmodell anhand des Entity-Relationship-Diagramms (ERD) beschrieben.

Entitäts-Beziehungs-Diagramm für TikTok

Abbildung 2. TikTok: Entity-Relationship-Diagramm.

Basisansichten

Das sind die blauen Objekte im ERD. Sie sind Ansichten von CDC-Tabellen ohne Transformationen außer einigen Aliasen für Spaltennamen. Skripts finden Sie unter src/marketing/src/TikTok/src/reporting/ddls.

Berichtsdatenansichten

Das sind die grünen Objekte im ERD. Sie sind Berichtsansichten, die aggregierte Messwerte enthalten. Skripts finden Sie unter src/marketing/src/TikTok/src/reporting/ddls.

API-Verbindung

Cortex Framework verwendet die TikTok Reporting APIs, Version v1.3, als maßgebliche Quelle für TikTok-Daten. Cortex Framework verwendet den synchronen Modus und ruft Basic Reporting APIs auf, um Leistungsmesswerte für Anzeigen und Anzeigengruppen abzurufen. So hat Cortex Framework Zugriff auf aktuelle und genaue Informationen von TikTok, was eine effektive Datenanalyse und Berichterstellung ermöglicht.

Weitere Informationen zur API-Verbindung finden Sie unter TikTok Reporting APIs.

Kontoauthentifizierung

So konfigurieren Sie ein TikTok-Konto und die Kontoauthentifizierung:

  1. Richten Sie ein TikTok-Entwicklerkonto ein, falls Sie noch keines haben.
  2. Erstellen Sie eine App für die Cortex Framework-Integration. Weitere Informationen finden Sie unter TikTok API for Business. Wählen Sie in den Bereichen für die App die folgenden beiden Bereiche aus:
    • Ad Account Management/Ad Account Information
    • Reporting/All
  3. Rufen Sie die App-ID, das Secret und das langlebige Zugriffstoken wie in der TikTok-Anleitung beschrieben ab und speichern Sie sie mit den folgenden Namen in Secret Manager:
    • App-ID: cortex_tiktok_app_id
    • Secret: cortex_tiktok_app_secret
    • Langlebiges Zugriffstoken: cortex_tiktok_access_token

Datenaktualität und Verzögerung

Im Allgemeinen wird die Datenaktualität für Cortex Framework-Datenquellen durch die Möglichkeiten der Upstream-Verbindung sowie die Häufigkeit der DAG-Ausführung begrenzt. Passen Sie die Häufigkeit der DAG-Ausführung an die Upstream-Häufigkeit, die Ressourcenbeschränkungen und Ihre geschäftlichen Anforderungen an.

Mit der TikTok Marketing API, sind die meisten Daten (außer Conversions) fast in Echtzeit verfügbar.

Managed Airflow-Verbindungen

Erstellen Sie die folgenden Verbindungen in Managed Airflow. Weitere Informationen finden Sie unter Managed Airflow-Verbindungen.

Verbindungsname Zweck
tiktok_raw_dataflow Für TikTok API > BigQuery Rohdaten-Dataset
tiktok_cdc_bq Für Rohdaten-Dataset > CDC-Dataset-Übertragung
tiktok_reporting_bq Für CDC-Dataset > Berichts-Dataset-Übertragung

Berechtigungen für das Dienstkonto von Managed Service for Apache Airflow

Gewähren Sie dem in Managed Airflow verwendeten Dienstkonto Dataflow-Berechtigungen (wie in der Verbindung tiktok_raw_dataflow konfiguriert). Eine Anleitung finden Sie in der Dataflow-Dokumentation.

Außerdem sollte dasselbe Dienstkonto auch Zugriff auf Secret Manager Accessor haben.

Aufnahmeeinstellungen

Sie können die Datenpipelines Source to Raw und Raw to CDC über die Einstellungen in der Datei src/TikTok/config/ingestion_settings.yaml steuern. In diesem Abschnitt werden die Parameter der einzelnen Datenpipelines beschrieben.

Quelltabelle zu Rohdatentabelle

Dieser Abschnitt enthält Einträge, die steuern, wie Daten aus TikTok abgerufen werden und wo sie im Rohdaten-Dataset landen. Jeder Eintrag entspricht einer Rohdatentabelle, deren Daten für diese Entität aus der TikTok API abgerufen wurden. Anhand dieser Konfigurationsparameter erstellt Cortex Framework Airflow-DAGs, die Dataflow-Pipelines ausführen, um Daten aus TikTok APIs zu verarbeiten.

Die folgenden Parameter steuern die Einstellungen für Source to Raw für jeden Eintrag:

Parameter Beschreibung
base_table Tabelle im Rohdaten-Dataset, in der die Daten für eine Entität gespeichert sind(z. B. Anzeigendaten).
load_frequency Wie oft ein DAG für diese Entität ausgeführt wird, um Daten zu verarbeiten. Details zu möglichen Werten finden Sie in der Airflow-Dokumentation.
schema_file Schemadatei im src/table_schema Verzeichnis, die API-Antwortfelder den Spaltennamen der Zieltabelle zuordnet.
partition_details Optional: Wenn diese Tabelle aus Leistungsgründen partitioniert werden soll. Weitere Informationen finden Sie unter Tabellenpartitionierung.
cluster_details Optional: Wenn diese Tabelle aus Leistungsgründen geclustert werden soll. Weitere Informationen finden Sie unter Clustereinstellungen.

Rohdatentabelle zu CDC-Tabelle

Dieser Abschnitt enthält Einträge, die steuern, wie Daten von Rohdatentabellen zu CDC-Tabellen verschoben werden. Jeder Eintrag entspricht einer CDC-Tabelle, die wiederum einer Entität entspricht, die für die Source to Raw table erwähnt wurde.

Die folgenden Parameter steuern die Einstellungen für Raw to CDC für jeden Eintrag:

Parameter Beschreibung
base_table Tabelle im CDC-Dataset,in der die Roh daten nach der CDC-Transformation gespeichert werden (z. B.auction_ad_performance).
load_frequency Wie oft ein DAG für diese Entität ausgeführt wird, um die CDC-Tabelle zu füllen. Details zu möglichen Werten finden Sie in der Airflow-Dokumentation.
row_identifiers Liste der Spalten (durch Kommas getrennt) die einen eindeutigen Datensatz für diese Tabelle bilden.
partition_details Optional: Wenn diese Tabelle aus Leistungsgründen partitioniert werden soll. Weitere Informationen finden Sie unter Tabellenpartitionierung.
cluster_details Optional: Wenn diese Tabelle aus Leistungsgründen geclustert werden soll. Weitere Informationen finden Sie unter Clustereinstellungen.

Berichtseinstellungen

Konfigurieren und steuern Sie, wie Cortex Framework Daten für die endgültige Berichtsebene von TikTok generiert, indem Sie die Berichtseinstellungsdatei src/TikTok/config/reporting_settings.yaml verwenden. Diese Datei steuert, wie BigQuery-Objekte der Berichtsebene (Tabellen, Ansichten, Funktionen oder gespeicherte Prozeduren) generiert werden.

Weitere Informationen finden Sie unter Berichtseinstellungsdatei anpassen.

Nächste Schritte