Menjadwalkan operasi produksi
Panduan memulai ini akan memandu Anda melalui langkah-langkah berikut untuk menjadwalkan eksekusi produksi di Dataform:
- Buat repositori Dataform.
- Berikan peran yang diperlukan.
Buat konfigurasi rilis dan konfigurasi alur kerja.
Buat konfigurasi rilis
productiondan tetapkan frekuensi pembuatan hasil kompilasiproduction. Kemudian, buatproductionkonfigurasi alur kerja, pilih konfigurasi rilisproduction, dan tetapkan jadwal untuk menjalankan hasil kompilasiproduction.
Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
Admin Dataform (
roles/dataform.admin) di repositori -
Dataform Editor (
roles/dataform.editor) di ruang kerja dan pemanggilan alur kerja -
Pengguna Akun Layanan (
roles/iam.serviceAccountUser) di akun layanan kustom -
Project IAM Admin (
roles/resourcemanager.projectIamAdmin) pada project - BigQuery Data Editor
(
roles/bigquery.dataEditor) di project yang memerlukan akses baca dan tulis Dataform, yang biasanya mencakup project yang menghosting repositori Dataform Anda. - BigQuery Data Viewer
(
roles/bigquery.dataViewer) di project yang memerlukan akses hanya baca Dataform. - Pengguna Tugas BigQuery
(
roles/bigquery.jobUser) di project yang menghosting repositori Dataform Anda. - Service Account Token Creator
(
roles/iam.serviceAccountTokenCreator) - Service Account User
(
roles/iam.serviceAccountUser) Di konsol Google Cloud , buka halaman IAM.
Klik Grant access.
Di kolom New principals, masukkan ID akun layanan kustom Anda.
Di menu Pilih peran, pilih peran berikut satu per satu, menggunakan Tambahkan peran lain untuk setiap peran tambahan:
- BigQuery Data Editor
- BigQuery Data Viewer
- BigQuery Job User
Klik Simpan.
Di konsol Google Cloud , buka halaman Service accounts.
Pilih akun layanan kustom Anda.
Buka Penerima akses, lalu klik Berikan akses.
Di kolom New principals, masukkan ID agen layanan Dataform default Anda.
ID agen layanan Dataform default Anda menggunakan format berikut:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.comDi daftar Pilih peran, tambahkan peran berikut:
- Pengguna Akun Layanan
- Service Account Token Creator
Klik Simpan.
Di konsol Google Cloud , buka halaman Dataform.
Klik Buat repositori.
Di halaman Create repository, lakukan hal berikut:
Di kolom Repository ID, masukkan
quickstart-production.Di daftar Region, pilih
europe-west4.Di kolom Akun layanan, klik Masukkan secara manual, lalu masukkan nama akun layanan kustom Anda. Pastikan Anda memasukkan akun layanan kustom di kolom ini.
Klik Buat.
Klik Go to repositories.
Di konsol Google Cloud , buka halaman Dataform.
Klik
quickstart-production.Klik Rilis & penjadwalan, lalu klik Buat rilis produksi.
Di panel Create release configuration, konfigurasi setelan berikut:
- Di kolom Release ID, masukkan
production. - Di kolom Git commitish, gunakan nilai default
main. - Di bagian Frekuensi jadwal, di menu Berulang, pilih Kustom.
- Di kolom Jadwal kustom, masukkan
0 16 * * *. Di menu Timezone, pilih zona waktu UTC+1, misalnya, Central European Standard Time (CET).
Setiap hari pukul 16.00 UTC+1, Dataform mengompilasi repositori
quickstart-productiondan menerapkan setelan kompilasi yang dikonfigurasi dalam konfigurasi rilis ini untuk membuat hasil kompilasiproduction.
- Di kolom Release ID, masukkan
Klik Buat.
Konfigurasi rilis
productionmembuat hasil kompilasi seluruh repositoriquickstart-productionsetiap hari pada pukul 16.00 UTC+1.Pastikan Anda berada di tab Rilis & penjadwalan. Buka bagian Konfigurasi alur kerja, lalu klik Buat.
Di panel Create workflow configuration, konfigurasi setelan berikut:
- Di kolom Configuration ID, masukkan
production. - Di menu Konfigurasi rilis, pilih
production. - Di bagian Frekuensi jadwal, di menu Berulang, pilih Kustom.
- Di kolom Jadwal kustom, masukkan
0 17 * * *. Di menu Timezone, pilih zona waktu UTC+1, misalnya, Central European Standard Time (CET).
Setiap hari pada pukul 17.00 UTC+1, Dataform menjalankan hasil kompilasi
productionterbaru dari repositoriquickstart-production.Klik Semua tindakan.
Dataform menjalankan semua tindakan alur kerja dalam hasil kompilasi
production.
- Di kolom Configuration ID, masukkan
Klik Buat.
Konfigurasi alur kerja
productionmenjalankan seluruh hasil kompilasi terbaru yang dibuat oleh konfigurasi rilis produksi setiap hari pada pukul 17.00 UTC+1.Di konsol Google Cloud , buka halaman Dataform.
Pilih repositori
quickstart-production.Klik Rilis & penjadwalan.
Di bagian Konfigurasi rilis, klik
production.Di konsol Google Cloud , buka halaman Dataform.
Pilih repositori
quickstart-production.Klik Workflow Execution Logs.
Pilih eksekusi alur kerja untuk melihat informasi yang lebih mendetail, termasuk status setiap tindakan dan log apa pun.
Di konsol Google Cloud , buka halaman BigQuery.
Di panel Explorer, luaskan project Anda dan pilih
dataform_production.Klik menu Tindakan , lalu pilih Hapus.
Pada dialog Hapus set data, masukkan delete, lalu klik Hapus.
Di konsol Google Cloud , buka halaman Dataform.
Klik
quickstart-production.Klik Rilis & penjadwalan, lalu buka bagian Konfigurasi rilis.
Dengan konfigurasi rilis
production, klik menu Lainnya, lalu klik Hapus.Pada dialog Hapus konfigurasi rilis, klik Hapus.
Di konsol Google Cloud , buka halaman Dataform.
Klik
quickstart-production.Klik Rilis & penjadwalan, lalu buka bagian Konfigurasi alur kerja.
Dengan konfigurasi alur kerja
production, klik menu Lainnya, lalu klik Hapus.Pada dialog Hapus konfigurasi rilis, klik Hapus.
Di konsol Google Cloud , buka halaman Dataform.
Dengan
quickstart-production, klik menu Lainnya, lalu pilih Hapus.Di jendela Hapus repositori, masukkan nama repositori untuk mengonfirmasi penghapusan.
Untuk mengonfirmasi, klik Hapus.
- Untuk mempelajari akun layanan lebih lanjut, lihat Tentang akun layanan kustom dan agen layanan Dataform.
- Untuk mempelajari lebih lanjut siklus proses kode di Dataform, lihat Pengantar siklus proses kode di Dataform.
- Untuk mempelajari lebih lanjut praktik terbaik untuk siklus proses alur kerja di Dataform, lihat Praktik terbaik untuk siklus proses alur kerja.
- Untuk mempelajari lebih lanjut konfigurasi rilis di Dataform, lihat Membuat konfigurasi rilis.
- Untuk mempelajari lebih lanjut konfigurasi alur kerja di Dataform, lihat Menjadwalkan eksekusi dengan konfigurasi alur kerja.
Selain itu, pilih atau buat akun layanan kustom untuk menjalankan alur kerja di BigQuery.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan guna melakukan semua tugas dalam tutorial ini, minta administrator Anda untuk memberi Anda peran IAM berikut:
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Memberikan peran yang diperlukan
Untuk menjalankan alur kerja di BigQuery, Anda dapat menggunakan akun layanan kustom atau Akun Google Anda (Pratinjau). Namun, kredensial akun layanan kustom adalah opsi default untuk jalankan terjadwal. Penggunaan kredensial akun pengguna Akun Google tidak disarankan untuk menjalankan tugas terjadwal.
Untuk menjalankan alur kerja di BigQuery, akun layanan kustom Anda harus memiliki peran wajib berikut:
Agar Dataform dapat menggunakan akun layanan kustom Anda, agen layanan Dataform default harus memiliki peran berikut pada resource akun layanan kustom:
Untuk memberikan peran ini, ikuti langkah-langkah berikut:
Membuat repositori Dataform
Membuat konfigurasi rilis dan konfigurasi alur kerja
Untuk membuat hasil kompilasi produksi repositori quickstart-production dan menjadwalkan eksekusi tabel production, ikuti langkah-langkah berikut:
Melihat hasil kompilasi production sebelumnya
Untuk melihat hasil kompilasi terjadwal production sebelumnya, ikuti langkah-langkah berikut:
Melihat eksekusi alur kerja production sebelumnya
Untuk melihat eksekusi alur kerja production sebelumnya, ikuti langkah-langkah berikut:
Pembersihan
Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
Hapus set data yang dibuat di BigQuery
Untuk menghindari biaya aset BigQuery, ikuti langkah-langkah berikut untuk menghapus set data yang disebut dataform_production:
Hapus konfigurasi rilis Dataform
Tidak ada biaya yang terkait dengan pembuatan konfigurasi rilis Dataform. Namun, jika Anda ingin menghapus konfigurasi rilis production, ikuti langkah-langkah berikut:
Menghapus konfigurasi alur kerja Dataform
Untuk menghindari biaya aset BigQuery, ikuti langkah-langkah berikut untuk menghapus konfigurasi alur kerja production Dataform:
Menghapus repositori Dataform
Tidak ada biaya yang terkait dengan pembuatan repositori Dataform. Namun, jika Anda ingin menghapus repositori dan semua isinya, ikuti langkah-langkah berikut: