Halaman ini menjelaskan cara memberikan peran Service Account User di Akun Layanan Dataproc kepada Agen Layanan Cloud Data Fusion agar dapat menyediakan dan menjalankan pipeline di cluster Dataproc.
Untuk akun layanan yang digunakan oleh Dataproc, Anda juga perlu memberikan izin datafusion.instances.runtime
untuk mengakses resource runtime Cloud Data Fusion.
Baik Anda menggunakan akun layanan yang dikelola pengguna, atau akun layanan default Compute Engine di virtual machine dalam cluster, Anda harus memberikan peran Service Account User ke Cloud Data Fusion. Jika tidak, Cloud Data Fusion tidak dapat menyediakan cluster Dataproc dan error berikut akan muncul saat Anda menjalankan pipeline data:
PROVISION task failed in REQUESTING_CREATE state for program run [pipeline-name] due to Dataproc operation failure: INVALID_ARGUMENT: User not authorized to act as service account '[service-account-name]'
Mendapatkan nama akun layanan
- Di konsol Google Cloud , buka halaman Identity and Access Management.
Buka halaman IAM - Dari pemilih project di bagian atas halaman, pilih project, folder, atau organisasi tempat instance Cloud Data Fusion berada.
- Temukan dan salin nama akun layanan Cloud Data Fusion. Gunakan format berikut:
service-[project-number]@gcp-sa-datafusion.iam.gserviceaccount.com
.
Memberikan izin pengguna akun layanan
- Di konsol Google Cloud , buka halaman Service Accounts.
Buka halaman Akun Layanan - Klik Pilih project, pilih project tempat akun layanan yang ingin Anda gunakan untuk cluster Dataproc berada, lalu klik Buka.
Klik alamat email akun layanan Dataproc.
Klik tab Principals with access. Halaman ini menampilkan daftar akun utama yang telah diberi peran di akun layanan.
Klik
Grant access.Di kolom New principals, tempel nama akun layanan Cloud Data Fusion yang Anda salin sebelumnya.
Pilih peran Service Account User.
Klik Simpan.
Memberikan peran ke akun layanan Dataproc
Memberikan izin peran pelaksana
Berikan peran pelaksana Cloud Data Fusion
(roles/datafusion.runner
) ke akun layanan yang digunakan oleh
Dataproc. Tindakan ini memberi otorisasi akun layanan Dataproc untuk menjalankan pipeline Cloud Data Fusion di project Anda.
Untuk mengetahui informasi selengkapnya, lihat Mewajibkan izin untuk melampirkan akun layanan ke resource.
Memberikan izin admin Cloud Storage
Di Cloud Data Fusion versi 6.2.0 dan yang lebih baru, berikan
peran admin Cloud Storage
(roles/storage.admin
) kepada akun layanan yang digunakan oleh
Dataproc di project Anda.
Langkah berikutnya
- Pelajari lebih lanjut Kontrol akses di Cloud Data Fusion.
- Pelajari lebih lanjut akun layanan Cloud Data Fusion.