Integrasi dengan Google Analytics 4
Halaman ini menjelaskan konfigurasi yang diperlukan untuk mengambil data dari Google Analytics 4 (GA4) sebagai sumber data beban kerja pemasaran Cortex Framework Data Foundation.
GA4 adalah versi terbaru Google Analytics. Fitur ini memberikan gambaran menyeluruh tentang perilaku pengguna, dengan berfokus pada pelacakan berbasis peristiwa dan machine learning untuk menawarkan insight yang lebih mendalam. Cortex Framework memungkinkan Anda mengekstrak data dari GA4 dan mengintegrasikannya ke BigQuery untuk analisis dan pelaporan lebih lanjut. Anda dapat memperoleh insight berharga dan meningkatkan hasil bisnis.
Diagram berikut menjelaskan cara data GA4 tersedia melalui beban kerja pemasaran Cortex Framework Data Foundation:

File konfigurasi
File config.json
mengonfigurasi setelan yang diperlukan untuk terhubung ke sumber data guna mentransfer
data dari berbagai beban kerja. File ini berisi parameter berikut untuk GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
Tabel berikut menjelaskan nilai untuk setiap parameter pemasaran:
| Parameter | Arti | Nilai Default | Deskripsi |
marketing.deployGA4
|
Men-deploy GA4 | true
|
Jalankan deployment untuk sumber data GA4. |
marketing.GA4.datasets.cdc
|
Set data BigQuery Export untuk GA4 | [{"property_id": 0, "name": ""}]
|
Array set data BigQuery
Export Google Analytics 4. Setiap elemen menentukan Property ID sebagai
INT, serta nama set data BigQuery Export yang sesuai.
|
marketing.GA4.datasets.reporting
|
Set data pelaporan untuk GA4 | REPORTING_GA4
|
Set data pelaporan untuk GA4. |
Model Data
Bagian ini menjelaskan Model Data GA4 menggunakan Diagram Hubungan Entitas (ERD).
Tampilan dasar
Objek ini adalah objek biru dalam ERD dan merupakan tampilan pada tabel CDC dengan
transformasi minimal untuk mengekstrak struktur data yang kompleks. Lihat skrip di
src/marketing/src/GA4/src/reporting/ddls.
Tampilan pelaporan
Ini adalah objek hijau dalam ERD dan merupakan tampilan pelaporan yang berisi metrik gabungan. Lihat skrip di
src/marketing/src/GA4/src/reporting/ddls.
Mengonfigurasi integrasi untuk GA4
Fondasi Data Cortex Framework terintegrasi dengan GA4 dengan membuat Lapisan pelaporan di atas set data BigQuery Export GA4 (diperlakukan sebagai set data CDC dalam arsitektur Cortex Framework). Hal ini dilakukan dengan membuat tampilan runtime di atas tabel CDC atau menjalankan DAG Managed Service for Apache Airflow untuk data yang di-materialize di tabel BigQuery, bergantung pada konfigurasi setelan pelaporan.
Menyiapkan BigQuery Export GA4
Cortex Framework menggunakan fitur BigQuery Export GA4 untuk memuat data dari sistem sumber ke BigQuery. Ikuti petunjuk cara menyiapkan BigQuery Export untuk setiap properti GA4 di artikel Bantuan GA4 ini: GA4 - Menyiapkan BigQuery Export.
Masalah umum, batasan, dan pertimbangan lainnya
Pertimbangkan hal berikut saat menyiapkan BigQuery Export GA4:
- Pengisian ulang: BigQuery Export GA4 dimulai dari hari saat penyiapannya dilakukan dan tidak ada pengisian ulang.
- Perbedaan antara angka yang dilaporkan oleh UI GA4 dan Framework Cortex: Beberapa faktor, termasuk, tetapi tidak terbatas pada sampling, penundaan pengumpulan data, dan laporan berkardinalitas tinggi, dapat menyebabkan sedikit perbedaan antara UI Google Analytics dan Framework Cortex. Ini adalah batasan bawaan dan umum Google Analytics. Untuk mengetahui informasi selengkapnya, lihat Menjembatani kesenjangan antara UI Google Analytics dan BigQuery Export .
- Batasan volume ekspor peristiwa: Bergantung pada edisi Google Analytics Anda, Anda mungkin menghadapi berbagai tingkat batasan volume ekspor BigQuery per hari. Untuk mengetahui informasi selengkapnya, lihat GA4 - Menyiapkan BigQuery Export.
- Zona waktu: Di BigQuery Export,
event_dateditetapkan di zona waktu pelaporan properti, sementaraevent_timestampadalah stempel waktu UTC dalam mikrodetik. Oleh karena itu, jikaevent_timestampdigunakan, pastikan untuk menyesuaikan zona waktu pelaporan yang benar saat membandingkan dengan angka UI. - Ekspor Peristiwa Harian versus Streaming (real-time): Untuk ekspor Peristiwa, Cortex Framework hanya mendukung tabel
events_YYYYMMDDyang dibuat oleh ekspor harian penuh. Untuk mengetahui informasi selengkapnya, lihat GA4 - BigQuery Export. - Perjanjian Tingkat Layanan (SLA) GA4 360 untuk BigQuery Export:
Meskipun Cortex Framework tidak mendukung tabel
events_fresh_yang dibuat oleh ekspor Harian Langsung sebagai tabel sumber terpisah, Anda dapat mengikuti komentar penyesuaian##CORTEX-CUSTOMERdi tampilan PelaporanEventsuntuk mengganti tabel sumber dengan tabel ini, guna memanfaatkan SLA yang disediakan oleh fitur ini. Semua Tampilan pelaporan akan terus berfungsi setelah penggantian ini.
Keaktualan dan Penundaan Data
Sebagai aturan umum, keaktualan data untuk sumber data Cortex Framework dibatasi oleh koneksi upstream yang diizinkan, serta frekuensi eksekusi DAG Anda. Sesuaikan frekuensi eksekusi DAG agar selaras dengan frekuensi upstream, batasan resource, dan kebutuhan bisnis Anda.
Dengan Google Analytics 4, data BigQuery Export mungkin tertunda hingga satu hari, bergantung pada zona waktu Anda, kecuali jika Anda menggunakan Ekspor Harian Langsung.
Konfigurasi
Bagian ini menjelaskan konfigurasi untuk proses data.
Koneksi Managed Service untuk Apache Airflow
Buat koneksi berikut di Managed Airflow. Lihat detail selengkapnya di Dokumentasi mengelola koneksi Airflow.
| Nama Koneksi | Tujuan |
dv360_cdc_bq
|
Untuk Transfer set data mentah > set data CDC. |
dv360_reporting_bq
|
Untuk transfer set data CDC > Set data pelaporan. |
Setelan pelaporan
Anda dapat mengonfigurasi dan mengontrol cara Cortex Framework membuat data untuk lapisan pelaporan akhir GA4 menggunakan file setelan pelaporan src/GA4/config/reporting_settings.yaml. File ini mengontrol cara objek BigQuery lapisan pelaporan
(tabel, tampilan, fungsi, atau prosedur tersimpan) dibuat.
Untuk mengetahui informasi selengkapnya, lihat Menyesuaikan file setelan pelaporan.
Apa langkah selanjutnya?
- Untuk mengetahui informasi selengkapnya tentang sumber data dan workload lainnya, lihat Sumber data dan workload.
- Untuk mengetahui informasi selengkapnya tentang langkah-langkah deployment di lingkungan produksi, lihat Prasyarat deployment Data Foundation Cortex Framework.
