Menjadwalkan operasi produksi
Panduan memulai ini akan memandu Anda melalui langkah-langkah berikut untuk menjadwalkan eksekusi produksi di Dataform:
- Buat repositori Dataform.
- Berikan peran yang diperlukan.
Buat konfigurasi rilis dan konfigurasi alur kerja.
Buat konfigurasi rilis
productiondan tetapkan frekuensi pembuatan hasil kompilasiproduction. Kemudian, buat konfigurasi alur kerjaproduction, pilih konfigurasi rilisproduction, dan tetapkan jadwal untuk menjalankan hasil kompilasiproduction.
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Selain itu, pilih atau buat akun layanan kustom untuk menjalankan alur kerja di BigQuery.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk melakukan semua tugas dalam panduan memulai ini, minta administrator Anda untuk memberi Anda peran IAM berikut:
-
Admin Dataform (
roles/dataform.admin) di repositori -
Pengguna Akun Layanan (
roles/iam.serviceAccountUser) di akun layanan kustom -
Project IAM Admin (
roles/resourcemanager.projectIamAdmin) pada project
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Memberikan peran yang diperlukan
Untuk menjalankan alur kerja di BigQuery, Anda dapat menggunakan akun layanan kustom atau Akun Google Anda (Pratinjau). Namun, kredensial akun layanan kustom adalah opsi default untuk jalankan terjadwal. Penggunaan kredensial akun pengguna Akun Google tidak disarankan untuk menjalankan tugas terjadwal.
Akun layanan kustom Anda harus memiliki peran wajib berikut:
- BigQuery Data Editor
(
roles/bigquery.dataEditor) di project atau set data BigQuery tertentu yang memerlukan akses baca dan tulis Dataform. Hal ini biasanya mencakup project yang menghosting repositori Dataform Anda. - BigQuery Data Viewer
(
roles/bigquery.dataViewer) di project atau set data BigQuery tertentu yang memerlukan akses hanya baca Dataform. - BigQuery Job User
(
roles/bigquery.jobUser) di project yang menghosting repositori Dataform Anda.
Agar Dataform dapat menggunakan akun layanan kustom Anda, agen layanan Dataform default harus memiliki peran berikut pada resource akun layanan kustom:
- Service Account Token Creator
(
roles/iam.serviceAccountTokenCreator) - Service Account User
(
roles/iam.serviceAccountUser)
Untuk memberikan peran ini, ikuti langkah-langkah berikut:
Di konsol Google Cloud , buka halaman IAM.
Klik Grant access.
Di kolom New principals, masukkan ID akun layanan kustom Anda.
Di menu Pilih peran, pilih peran berikut satu per satu, menggunakan Tambahkan peran lain untuk setiap peran tambahan:
- BigQuery Data Editor
- BigQuery Data Viewer
- BigQuery Job User
Klik Simpan.
Di konsol Google Cloud , buka halaman Service accounts.
Pilih akun layanan kustom Anda.
Buka Principals with access, lalu klik Grant access.
Di kolom New principals, masukkan ID agen layanan Dataform default Anda.
ID agen layanan Dataform default Anda memiliki format berikut:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.comGanti
PROJECT_NUMBERdengan ID angka project Google Cloud Anda. Anda dapat menemukan Google Cloud project ID di dasbor konsolGoogle Cloud . Untuk mengetahui informasi selengkapnya, lihat Mengidentifikasi project.Di daftar Pilih peran, tambahkan peran berikut:
- Pengguna Akun Layanan
- Service Account Token Creator
Klik Simpan.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Memberi Dataform akses yang diperlukan.
Membuat repositori Dataform
Di konsol Google Cloud , buka halaman Dataform.
Klik Buat repositori.
Di halaman Create repository, lakukan hal berikut:
Di kolom Repository ID, masukkan
quickstart-production.Di daftar Region, pilih
europe-west4.Dalam daftar Service account, pilih akun layanan kustom untuk repositori.
Di bagian pemeriksaan izin actAs, terapkan pemeriksaan izin pada tindakan pengguna di repositori.
Klik Create.
Klik Go to repositories.
Membuat konfigurasi rilis dan konfigurasi alur kerja
Untuk membuat hasil kompilasi produksi repositori quickstart-production dan menjadwalkan eksekusi tabel production, ikuti langkah-langkah berikut:
Di konsol Google Cloud , buka halaman Dataform.
Klik
quickstart-production.Klik Rilis & penjadwalan, lalu klik Buat rilis produksi.
Di panel Create release configuration, konfigurasi setelan berikut:
- Di kolom Release ID, masukkan
production. - Di kolom Git commitish, gunakan nilai default
main. - Di bagian Frekuensi jadwal, di menu Berulang, pilih Kustom.
- Di kolom Jadwal kustom, masukkan
0 16 * * *. Di menu Timezone, pilih zona waktu UTC+1, misalnya, Central European Standard Time (CET).
Setiap hari pukul 16.00 UTC+1, Dataform mengompilasi repositori
quickstart-productiondan menerapkan setelan kompilasi yang dikonfigurasi dalam konfigurasi rilis ini untuk membuat hasil kompilasiproduction.
- Di kolom Release ID, masukkan
Klik Create.
Konfigurasi rilis
productionmembuat hasil kompilasi seluruh repositoriquickstart-productionsetiap hari pada pukul 16.00 UTC+1.Pastikan Anda berada di tab Rilis & penjadwalan. Buka bagian Konfigurasi alur kerja, lalu klik Buat.
Di panel Create workflow configuration, konfigurasi setelan berikut:
- Di kolom Configuration ID, masukkan
production. - Di menu Konfigurasi rilis, pilih
production. - Di bagian Frekuensi jadwal, di menu Berulang, pilih Kustom.
- Di kolom Jadwal kustom, masukkan
0 17 * * *. Di menu Timezone, pilih zona waktu UTC+1, misalnya, Central European Standard Time (CET).
Setiap hari pada pukul 17.00 UTC+1, Dataform menjalankan hasil kompilasi
productionterbaru dari repositoriquickstart-production.Klik Semua tindakan.
Dataform menjalankan semua tindakan alur kerja dalam hasil kompilasi
production.
- Di kolom Configuration ID, masukkan
Klik Create.
Konfigurasi alur kerja
productionmenjalankan seluruh hasil kompilasi terbaru yang dibuat oleh konfigurasi rilis produksi setiap hari pada pukul 17.00 UTC+1.
Melihat hasil kompilasi production sebelumnya
Untuk melihat hasil kompilasi terjadwal production sebelumnya, ikuti langkah-langkah berikut:
Di konsol Google Cloud , buka halaman Dataform.
Pilih repositori
quickstart-production.Klik Rilis & penjadwalan.
Di bagian Konfigurasi rilis, klik
production.
Melihat eksekusi alur kerja production sebelumnya
Untuk melihat eksekusi alur kerja production sebelumnya, ikuti langkah-langkah berikut:
Di konsol Google Cloud , buka halaman Dataform.
Pilih repositori
quickstart-production.Klik Workflow Execution Logs.
Pilih eksekusi alur kerja untuk melihat informasi yang lebih mendetail, termasuk status setiap tindakan dan log apa pun.
Pembersihan
Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
Hapus set data yang dibuat di BigQuery
Untuk menghindari biaya aset BigQuery, ikuti langkah-langkah berikut untuk menghapus set data yang disebut dataform_production:
Di konsol Google Cloud , buka halaman BigQuery.
Di panel Explorer, luaskan project Anda dan pilih
dataform_production.Klik menu Tindakan , lalu pilih Hapus.
Pada dialog Delete dataset, masukkan delete, lalu klik Delete.
Hapus konfigurasi rilis Dataform
Tidak ada biaya yang terkait dengan pembuatan konfigurasi rilis Dataform. Namun, jika Anda ingin menghapus konfigurasi rilis production, ikuti langkah-langkah berikut:
Di konsol Google Cloud , buka halaman Dataform.
Klik
quickstart-production.Klik Rilis & penjadwalan, lalu buka bagian Konfigurasi rilis.
Dengan konfigurasi rilis
production, klik menu Lainnya, lalu klik Hapus.Pada dialog Hapus konfigurasi rilis, klik Hapus.
Menghapus konfigurasi alur kerja Dataform
Untuk menghindari biaya aset BigQuery, ikuti langkah-langkah berikut untuk menghapus konfigurasi alur kerja production Dataform:
Di konsol Google Cloud , buka halaman Dataform.
Klik
quickstart-production.Klik Rilis & penjadwalan, lalu buka bagian Konfigurasi alur kerja.
Dengan konfigurasi alur kerja
production, klik menu Lainnya, lalu klik Hapus.Pada dialog Hapus konfigurasi rilis, klik Hapus.
Menghapus repositori Dataform
Tidak ada biaya yang terkait dengan pembuatan repositori Dataform. Namun, jika Anda ingin menghapus repositori dan semua isinya, ikuti langkah-langkah berikut:
Di konsol Google Cloud , buka halaman Dataform.
Dengan
quickstart-production, klik menu Lainnya, lalu pilih Hapus.Di jendela Hapus repositori, masukkan nama repositori untuk mengonfirmasi penghapusan.
Untuk mengonfirmasi, klik Hapus.
Langkah berikutnya
- Untuk mempelajari lebih lanjut akun layanan, lihat Tentang akun layanan kustom dan agen layanan Dataform.
- Untuk mempelajari lebih lanjut siklus proses kode di Dataform, lihat Pengantar siklus proses kode di Dataform.
- Untuk mempelajari lebih lanjut praktik terbaik untuk siklus proses alur kerja di Dataform, lihat Praktik terbaik untuk siklus proses alur kerja.
- Untuk mempelajari lebih lanjut konfigurasi rilis di Dataform, lihat Membuat konfigurasi rilis.
- Untuk mempelajari lebih lanjut konfigurasi alur kerja di Dataform, lihat Menjadwalkan eksekusi dengan konfigurasi alur kerja.