Integrasi dengan Google Ads
Halaman ini menjelaskan konfigurasi yang diperlukan untuk mengambil data dari Google Ads sebagai sumber data workload pemasaran Cortex Framework Data Foundation.
Google Ads adalah platform iklan online yang memungkinkan bisnis mengiklankan produk atau layanan mereka di berbagai properti Google. Cortex Framework menggabungkan data Google Ads Anda dengan saluran pemasaran lainnya, menganalisisnya secara komprehensif, dan menggunakan AI untuk meningkatkan hasil kampanye Anda.
Diagram berikut menjelaskan cara data Google Ads tersedia melalui workload pemasaran Cortex Framework Data Foundation:

File konfigurasi
File config.json mengonfigurasi setelan yang diperlukan untuk mentransfer data dari
sumber data mana pun, termasuk Google Ads. File ini berisi parameter berikut untuk Google Ads:
"marketing": {
"deployGoogleAds": true,
"GoogleAds": {
"deployCDC": true,
"lookbackDays": 180,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_GoogleAds"
}
}
}
Tabel berikut menjelaskan nilai untuk setiap parameter pemasaran Google Ads:
| Parameter | Artinya | Nilai Default | Deskripsi |
marketing.deployGoogleAds
|
Men-deploy Google Ads | true
|
Menjalankan deployment untuk sumber data Google Ads. |
marketing.GoogleAds.deployCDC
|
Men-deploy CDC untuk Google Ads | true
|
Membuat skrip pemrosesan CDC Google Ads untuk dijalankan sebagai DAG di Managed Airflow. |
marketing.GoogleAds.lookbackDays
|
Periode analisis data historis untuk Google Ads | 180
|
Jumlah hari untuk mulai mengambil data dari Google Ads API. |
marketing.GoogleAds.datasets.cdc
|
Set data CDC untuk Google Ads | Set data CDC untuk Google Ads. | |
marketing.GoogleAds.datasets.raw
|
Set data mentah untuk Google Ads | Set data mentah untuk Google Ads. | |
marketing.GoogleAds.datasets.reporting
|
Set data pelaporan untuk Google Ads | "REPORTING_GoogleAds"
|
Set data pelaporan untuk Google Ads. |
Model Data
Bagian ini menjelaskan Model Data Google Ads menggunakan Diagram Hubungan Entity (ERD).
Tampilan dasar
Ini adalah objek biru dalam ERD dan merupakan tampilan pada tabel CDC tanpa transformasi selain beberapa alias nama kolom. Lihat skrip di
src/marketing/src/GoogleAds/src/reporting/ddls.
Tampilan pelaporan
Ini adalah objek hijau dalam ERD dan merupakan tampilan pelaporan yang berisi metrik gabungan. Lihat skrip di
src/marketing/src/GoogleAds/src/reporting/ddls.
Koneksi API
Template penyerapan Cortex Framework menggunakan Google Ads API untuk mengambil atribut dan metrik pelaporan dari Google Ads. Template Cortex Framework saat ini menggunakan Google Ads API versi 17.1. Pertimbangkan batasan Google Ads API:
- Operasi akses dasar per hari: 15.000 (permintaan yang dipaginasi yang berisi
valid
next_page_tokentidak dihitung). - Ukuran halaman maksimum: 10.000 baris per halaman.
- Parameter default yang direkomendasikan: Ukuran halaman sama dengan 10.000 baris per halaman.
Untuk mengetahui informasi selengkapnya tentang koneksi API, lihat dokumentasi Google Ads API..
Autentikasi akun
Ikuti langkah-langkah berikut untuk menyiapkan autentikasi akun:
- Di Google Cloud konsol, klik Navigation menu > API & Services > Credentials > Create credentials.
Buat kredensial OAuth Client ID dengan karakteristik berikut. Untuk mengetahui informasi selengkapnya, lihat Menggunakan OAuth 2.0 untuk Mengakses Google API.
Application type: "Web Application" Name: CHOSEN_NAME #(For example,"Cortex Authentication Client"). Authorized redirect URIs: http://127.0.0.1Ganti
CHOSEN_NAMEdengan nama yang dipilih untuk akun kredensial Client ID OAuth.Simpan
Client IDdanClient secretsetelah kredensial dikonfigurasi. Anda akan memerlukannya nanti.Buat token baru menggunakan OAuth 2.0 Access Google API. Cortex Data Foundation secara otomatis mendeteksi dan menyerap data dari semua pelanggan (akun) yang dapat diakses oleh kredensial yang digunakan untuk membuat token.
Buat secret menggunakan Secret Manager:
- Di Google Cloud konsol, klik Secret Manager.
- Buat secret bernama
cortex-framework-google-ads-yamlmenggunakan format berikut dan ubah nilainya sesuai dengan setelan Anda:
{"developer_token": "DEVELOPER_TOKEN_VALUE", "refresh_token": "REFRESH_TOKEN_VALUE", "client_id": "CLIENT_ID_VALUE", "client_secret": "CLIENT_SECRET_VALUE", "use_proto_plus": False}
Ganti kode berikut:
DEVELOPER_TOKEN_VALUEdengan nilai token developer yang tersedia di akun Google Ads.REFRESH_TOKEN_VALUEdengan nilai token refresh yang diperoleh pada langkah 4.CLIENT_ID_VALUEdengan nilai client ID yang diperoleh dalam penyiapan OAuth pada langkah 2.CLIENT_SECRET_VALUEdengan nilai rahasia klien yang diperoleh dari penyiapan OAuth pada langkah 2.
Keaktualan dan Penundaan Data
Sebagai aturan umum, keaktualan data untuk sumber data Cortex Framework dibatasi oleh hal yang diizinkan oleh koneksi upstream, serta frekuensi eksekusi DAG Anda. Sesuaikan frekuensi eksekusi DAG agar selaras dengan frekuensi upstream, batasan resource, dan kebutuhan bisnis Anda.
Data yang diambil menggunakan Google Ads API umumnya tersedia dengan latensi 3+ jam. Data tersebut dapat disesuaikan setelahnya karena konversi dan deteksi traffic tidak valid. Untuk mengetahui informasi selengkapnya, lihat artikel Tentang keaktualan data berikut di Pusat Bantuan Google Ads.
Izin koneksi Managed Service untuk Apache Airflow
Buat koneksi berikut di Managed Airflow. Lihat detail selengkapnya di dokumentasi Mengelola koneksi Airflow.
| Nama Koneksi | Tujuan |
googleads_raw_dataflow
|
Untuk Google Ads API > Set Data Mentah BigQuery. |
googleads_cdc_bq
|
Untuk transfer Set data mentah > Set data CDC. |
googleads_reporting_bq
|
Untuk transfer Set data CDC > Set data pelaporan transfer. |
Izin akun layanan Managed Airflow
Berikan izin Dataflow ke akun layanan yang digunakan di Managed Airflow (seperti yang dikonfigurasi dalam koneksi googleads_raw_dataflow). Lihat petunjuk di dokumentasi Dataflow.
Setelan penyerapan
Kontrol pipeline data Source to Raw dan Raw to CDC melalui setelan dalam file src/GoogleAds/config/ingestion_settings.yaml. Bagian ini menjelaskan parameter setiap pipeline data.
Tabel sumber ke mentah
Bagian ini menjelaskan entity mana yang diambil oleh API dan caranya. Setiap entri sesuai dengan satu entity Google Ads. Berdasarkan konfigurasi ini, Cortex membuat DAG Airflow yang menjalankan pipeline Dataflow untuk mengambil data menggunakan Google Ads API.
Parameter berikut mengontrol setelan untuk Source to Raw untuk setiap entri:
| Parameter | Deskripsi |
load_frequency
|
Seberapa sering DAG untuk entity ini berjalan untuk mengambil data dari Google Ads. Untuk mengetahui informasi selengkapnya tentang kemungkinan nilai, lihat dokumentasi Airflow. |
api_name
|
Nama Resource API (misalnya,
customer).
|
table_name
|
Tabel dalam set data Mentah tempat data yang diambil disimpan (misalnya, customer).
|
schema_file
|
File skema di direktori src/table_schema
yang memetakan kolom respons API ke nama kolom tabel tujuan.
|
key
|
Kolom (dipisahkan dengan koma) yang membentuk rekaman unik untuk tabel ini. |
is_metrics_table
|
Menunjukkan apakah entri tertentu adalah untuk entity metrik (di Google Ads API). Sistem memperlakukan tabel tersebut sedikit berbeda karena sifat gabungan dari tabel tersebut. |
partition_details
|
Opsional: Jika Anda ingin tabel ini dipartisi untuk pertimbangan performa. Untuk mengetahui informasi selengkapnya, lihat Partisi Tabel. |
cluster_details
|
Opsional: Jika Anda ingin tabel ini di kelompokkan untuk pertimbangan performa. Untuk mengetahui informasi selengkapnya, lihat Setelan Cluster. |
Tabel mentah ke CDC
Bagian ini menjelaskan entri mana yang mengontrol cara data dipindahkan dari tabel mentah ke tabel CDC. Setiap entri sesuai dengan tabel mentah (yang pada gilirannya sesuai dengan entity Google Ads API seperti yang disebutkan).
Parameter berikut mengontrol setelan untuk Raw to CDC untuk setiap entri:
| Parameter | Deskripsi |
table_name
|
Tabel dalam set data CDC tempat
data mentah setelah transformasi CDC disimpan (misalnya, customer).
|
raw_table
|
Tabel tempat data mentah direplikasi. |
key
|
Kolom (dipisahkan dengan koma) yang membentuk rekaman unik untuk tabel ini. |
load_frequency
|
Seberapa sering DAG untuk entity ini berjalan untuk mengisi tabel CDC. Untuk mengetahui informasi selengkapnya tentang kemungkinan nilai, lihat dokumentasi Airflow. |
schema_file
|
File skema di src/table_schema
direktori yang memetakan kolom mentah ke kolom CDC dan jenis data kolom CDC.
Ini adalah file skema yang sama yang dirujuk di bagian sebelumnya.
|
partition_details
|
Opsional: Jika Anda ingin tabel ini di partisi untuk pertimbangan performa. Untuk mengetahui informasi selengkapnya, lihat Partisi Tabel. |
cluster_details
|
Opsional: Jika Anda ingin tabel ini di kelompokkan untuk pertimbangan performa. Untuk mengetahui informasi selengkapnya, lihat Setelan Cluster. |
Setelan pelaporan
Anda dapat mengonfigurasi dan mengontrol cara Cortex Framework membuat data untuk lapisan pelaporan akhir Google Ads menggunakan file setelan pelaporan src/GoogleAds/config/reporting_settings.yaml.
File ini mengontrol cara objek BigQuery lapisan pelaporan (tabel, tampilan, fungsi, atau prosedur tersimpan) dibuat.
Untuk mengetahui informasi selengkapnya, lihat Menyesuaikan file setelan pelaporan.
Apa langkah selanjutnya?
- Untuk mengetahui informasi selengkapnya tentang sumber data dan workload lainnya, lihat Sumber data dan workload.
- Untuk mengetahui informasi selengkapnya tentang langkah-langkah deployment di lingkungan produksi, lihat Prasyarat deployment Cortex Framework Data Foundation.
