Membuat lingkungan pengembangan
Panduan memulai ini akan memandu Anda melalui langkah-langkah untuk membuat lingkungan pengembangan individual di Dataform, sehingga setiap developer dapat bekerja di lingkungan pengembangannya sendiri:
- Buat repositori Dataform.
- Berikan peran yang diperlukan.
Mengonfigurasi penggantian kompilasi ruang kerja.
Konfigurasi penggantian kompilasi yang diterapkan Dataform ke semua ruang kerja di repositori Anda, yang mengubah ruang kerja menjadi lingkungan pengembangan yang terisolasi.
Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
Admin Dataform (
roles/dataform.admin) di repositori -
Dataform Editor (
roles/dataform.editor) di ruang kerja dan pemanggilan alur kerja -
Pengguna Akun Layanan (
roles/iam.serviceAccountUser) di akun layanan kustom -
Project IAM Admin (
roles/resourcemanager.projectIamAdmin) pada project - BigQuery Data Editor
(
roles/bigquery.dataEditor) di project yang memerlukan akses baca dan tulis Dataform, yang biasanya mencakup project yang menghosting repositori Dataform Anda. - BigQuery Data Viewer
(
roles/bigquery.dataViewer) di project yang memerlukan akses hanya baca Dataform. - Pengguna Tugas BigQuery
(
roles/bigquery.jobUser) di project yang menghosting repositori Dataform Anda. Di konsol Google Cloud , buka halaman IAM.
Klik Grant access.
Di kolom New principals, masukkan ID akun layanan kustom Anda atau alamat email Akun Google Anda (Pratinjau).
Di menu Pilih peran, pilih peran berikut satu per satu, menggunakan Tambahkan peran lain untuk setiap peran tambahan:
- BigQuery Data Editor
- BigQuery Data Viewer
- BigQuery Job User
Klik Simpan.
Di konsol Google Cloud , buka IAM > Service accounts.
Pilih akun layanan kustom Anda.
Buka Principals with access, lalu klik Grant access.
Di kolom New principals, masukkan ID agen layanan Dataform default Anda.
ID agen layanan Dataform default Anda memiliki format berikut:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.comGanti
PROJECT_NUMBERdengan Google Cloud nomor project Anda.Di daftar Select a role, tambahkan peran Service Account Token Creator.
Klik Simpan.
Di konsol Google Cloud , buka halaman Dataform.
Klik Buat repositori.
Di halaman Create repository, lakukan hal berikut:
Di kolom Repository ID, masukkan
quickstart-dev.Dalam daftar Region, pilih
europe-west4.Klik Create.
Klik Go to repositories.
Di konsol Google Cloud , buka halaman Dataform.
Klik
quickstart-dev.Klik Setelan, lalu klik Edit.
Di panel Penggantian kompilasi ruang kerja, di kolom Sufiks skema, masukkan
${workspaceName}.Saat Anda memicu proses di ruang kerja, Dataform akan menambahkan nama ruang kerja sebagai akhiran ke skema default yang ditetapkan di setelan alur kerja. Panduan memulai ini menggunakan setelan Dataform default dengan skema default
dataform.Klik Simpan.
Di konsol Google Cloud , buka halaman BigQuery.
Di panel Explorer, luaskan project Anda dan pilih set data.
Klik menu Tindakan , lalu pilih Hapus.
Pada dialog Delete dataset, masukkan
deleteke dalam kolom, lalu klik Delete.Di konsol Google Cloud , buka halaman Dataform.
Pada
quickstart-dev, klik menu Lainnya, lalu pilih Hapus.- Di jendela Hapus repositori, masukkan nama repositori untuk mengonfirmasi penghapusan.
Untuk mengonfirmasi, klik Hapus.
- Untuk mempelajari lebih lanjut akun layanan, lihat Tentang akun layanan kustom dan agen layanan Dataform.
- Untuk mempelajari lebih lanjut siklus proses kode di Dataform, lihat Pengantar siklus proses kode di Dataform.
- Untuk mempelajari lebih lanjut praktik terbaik untuk siklus proses alur kerja di Dataform, lihat Praktik terbaik untuk siklus proses alur kerja.
- Untuk mempelajari lebih lanjut penggantian kompilasi ruang kerja di Dataform, lihat Membuat penggantian kompilasi ruang kerja.
- Untuk mempelajari cara menjadwalkan proses produksi di Dataform, lihat Menjadwalkan proses produksi.
Selain itu, jika Anda ingin menggunakan akun layanan kustom untuk menjalankan alur kerja di BigQuery, pilih atau buat akun layanan kustom.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk melakukan semua tugas dalam tutorial ini, minta administrator Anda untuk memberi Anda peran IAM berikut:
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Memberikan peran yang diperlukan
Untuk menjalankan alur kerja di BigQuery, Anda dapat menggunakan akun layanan kustom atau Akun Google Anda (Pratinjau). Bagian berikut menjelaskan peran yang diperlukan untuk akun layanan kustom atau Akun Google Anda dan untuk agen layanan Dataform default.
Memberikan peran ke akun layanan kustom atau Akun Google Anda
Untuk menjalankan alur kerja di BigQuery, akun layanan kustom Anda atau Akun Google Anda (Pratinjau) harus memiliki peran yang diperlukan berikut:
Untuk memberikan peran BigQuery ke akun layanan kustom atau Akun Google Anda (Pratinjau), ikuti langkah-langkah berikut:
Memberikan peran ke agen layanan Dataform default
Jika Anda menggunakan akun layanan kustom untuk menjalankan alur kerja di
BigQuery, Anda harus mengizinkan Dataform menggunakan akun layanan
kustom Anda. Untuk memberikan
peran Service Account Token Creator
(roles/iam.serviceAccountTokenCreator) kepada agen layanan Dataform
default di resource akun layanan kustom, ikuti langkah-langkah berikut:
Membuat repositori Dataform
Mengonfigurasi penggantian kompilasi ruang kerja
Untuk membuat lingkungan pengembangan terisolasi dengan penggantian kompilasi ruang kerja Dataform, ikuti langkah-langkah berikut:
Dataform menerapkan penggantian kompilasi ruang kerja ke semua ruang kerja di repositori Anda.
Dengan konfigurasi ini, saat Anda menjalankan alur kerja secara manual di
ruang kerja, Dataform akan menjalankannya dengan penggantian kompilasi ruang kerja.
Akibatnya, Dataform menjalankan alur kerja dalam skema dataform_workspaceName di BigQuery, mengubah ruang kerja menjadi lingkungan pengembangan yang terisolasi.
Misalnya, saat Anda memicu proses secara manual di ruang kerja sasha,
Dataform menjalankan alur kerja Anda dalam skema dataform_sasha di
BigQuery.
Untuk menjalankan alur kerja tanpa penggantian kompilasi ruang kerja, tetapi tetap mempertahankan penggantian kompilasi ruang kerja untuk lingkungan pengembangan, Anda dapat membuat konfigurasi rilis untuk mengonfigurasi lingkungan eksekusi lainnya, misalnya, staging dan production.
Pembersihan
Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
Menghapus set data yang dibuat di BigQuery
Untuk menghindari timbulnya biaya untuk aset BigQuery, hapus set data dengan nama yang diawali dengan dataform, misalnya, dataform-sasha.
Menghapus repositori Dataform
Tidak ada biaya yang terkait dengan pembuatan repositori Dataform. Namun, jika Anda ingin menghapus repositori dan semua isinya, ikuti langkah-langkah berikut: