Halaman ini menjelaskan cara membuat instance Cloud Data Fusion .
Sebelum memulai
- Aktifkan Cloud Data Fusion API.
- Izin berikut diperlukan untuk membuat instance Cloud Data Fusion:
instances.create. Untuk mengetahui informasi selengkapnya, lihat Kontrol akses. - Instance Cloud Data Fusion berjalan sebagai akun layanan default Compute Engine. Untuk mengetahui informasi tentang jenis dan peran yang tersedia, lihat Akun layanan.
- Secara default, Cloud Data Fusion menjalankan pipeline menggunakan cluster Managed Service for Apache Spark di project Anda. Pastikan project Anda memenuhi persyaratan jaringan Managed Service for Apache Spark.
- Project baru dimulai dengan jaringan default. Jaringan default telah diisi sebelumnya dengan aturan firewall default-allow-ssh, yang memungkinkan koneksi masuk pada port TCP 22 dari sumber mana pun ke instance mana pun di jaringan. Pada versi sebelum 6.2.0, jika aturan untuk mengizinkan ingress pada port TCP 22 tidak ada di jaringan yang digunakan oleh instance Cloud Data Data Fusion Anda, Anda harus membuat aturan ini.
Membuat instance
Konsol
Jika API diaktifkan, bagian Cloud Data Fusion di Google Cloud konsol akan menampilkan halaman Instances, tempat Anda dapat membuat dan mengelola instance Cloud Data Fusion.
- Di konsol, buka halaman Cloud Data Fusion.
- Klik Instances, lalu klik Create an instance.
- Masukkan Instance name.
- Masukkan Description untuk instance Anda.
- Tentukan Region tempat instance akan dibuat.
- Tentukan Version Cloud Data Fusion.
- Pilih Edition. Nilai defaultnya adalah Basic.
- Opsional: Klik Add accelerators untuk memilih akselerator yang akan digunakan di instance Anda.
- Tentukan Managed Service for Apache Spark service account yang akan digunakan untuk menjalankan pipeline Cloud Data Fusion Anda di Managed Service for Apache Spark. Nilai defaultnya adalah akun Compute Engine. Terlepas dari versinya, pastikan akun layanan memiliki peran Pengelolaan Akses dan Identitas yang sesuai dengan kebutuhan Anda. Untuk mengetahui informasi selengkapnya, lihat Memberikan izin pengguna akun layanan.
Opsional: Tentukan opsi lanjutan apa pun. Jika Anda tidak menentukan apa pun, nilai default berikut akan digunakan:
Kategori Setelan Deskripsi Default IP Pribadi Aktifkan alamat IP internal Buat instance Cloud Data Fusion dengan alamat IP internal. Nonaktif Pemantauan dan logging lanjutan Aktifkan Cloud Logging Managed Service for Apache Spark
Aktifkan Cloud Monitoring Managed Service for Apache Spark
Lihat log pipeline lanjutan di Cloud Logging. Nonaktif Integrasi silsilah data Knowledge Catalog Aktifkan atau nonaktifkan integrasi dengan silsilah data Knowledge Catalog Lihat silsilah di Knowledge Catalog. Nonaktif Enkripsi Gunakan kunci enkripsi yang dikelola pelanggan (CMEK) Gunakan role-based access control di versi 6.5 dan yang lebih baru. Nonaktif Label Pasangan nilai kunci Label resource untuk instance yang akan digunakan untuk memberi anotasi pada resource pokok terkait, seperti VM Compute Engine. Kunci label dan nilai label hanya boleh berisi huruf, angka, tanda hubung, dan garis bawah. Kunci label harus diawali dengan a huruf atau angka. Tidak ada Pemeliharaan Aktifkan masa pemeliharaan Tetapkan jangka waktu saat Cloud Data Fusion dapat melakukan operasi pemeliharaan pada instance. Untuk mengetahui informasi selengkapnya, lihat Mengonfigurasi masa pemeliharaan. Nonaktif Klik Create. Proses pembuatan instance memerlukan waktu hingga 30 menit.
Saat Cloud Data Fusion membuat instance Anda, roda progres akan ditampilkan di samping nama instance di halaman Instances. Setelah selesai, roda progres akan berubah menjadi tanda centang hijau dan menunjukkan bahwa Anda dapat mulai menggunakan instance.
API
Membuat instance:
Untuk membuat instance Cloud Data Fusion dengan
Cloud Data Fusion REST API,
buat permintaan API
instances.create, lalu isi resource
Instance
dengan informasi konfigurasi Anda.
Langkah berikutnya
- Pelajari Cloud Data Fusion lebih lanjut.
- Ikuti tutorial.