Menggunakan kembali cluster

Halaman ini menjelaskan cara menggunakan kembali cluster Managed Service for Apache Spark untuk menjalankan pipeline di Cloud Data Fusion. Untuk mengetahui informasi selengkapnya, lihat Kapan harus menggunakan kembali cluster dan Menjalankan pipeline terhadap cluster Managed Service for Apache Spark yang ada.

Sebelum memulai

  • Anda harus memiliki instance Cloud Data Fusion dalam versi 6.5.0 atau yang lebih baru.

Mengaktifkan penggunaan kembali cluster

Anda dapat menggunakan kembali cluster dalam profil komputasi baru, atau di cluster yang telah digunakan dalam pipeline yang di-deploy.

Mengaktifkan penggunaan kembali cluster dalam profil baru

  1. Buka instance Anda:

    1. Di konsol Google Cloud , buka halaman Cloud Data Fusion.

    2. Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.

      Buka Instance

  2. Klik Admin sistem > Konfigurasi > Profil komputasi sistem.

  3. Klik Buat profil baru.

  4. Pilih penyedia Managed Service for Apache Spark.

  5. Di jendela Buat profil untuk Managed Service for Apache Spark, masukkan detail tentang cluster Anda:

    1. Di kolom Label profil dan Nama profil, masukkan nama untuk mengidentifikasi profil—misalnya, execution_compute-profile.
    2. Di kolom Deskripsi, jelaskan tujuan profil—misalnya, Profile used for pipeline execution.
    3. Di kolom Waktu tidak ada aktivitas maksimum, masukkan nilai. Untuk mengetahui informasi selengkapnya, lihat Menetapkan waktu tidak ada aktivitas maksimum.
    4. Tetapkan kolom Lewati penghapusan cluster ke True. Untuk mengetahui informasi selengkapnya, lihat Kapan harus menggunakan kembali cluster.
    5. Opsional: konfigurasi kolom opsional lainnya.
    6. Klik Buat.

Mengaktifkan penggunaan kembali cluster dalam pipeline yang di-deploy

  1. Buka instance Anda:

    1. Di konsol Google Cloud , buka halaman Cloud Data Fusion.

    2. Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.

      Buka Instance

  2. Klik Daftar.

  3. Klik tab Di-deploy , lalu klik nama pipeline. Pipeline yang di-deploy akan terbuka di halaman Studio di antarmuka web Cloud Data Fusion.

  4. Klik Konfigurasi.

  5. Di jendela Konfigurasi komputasi , buka profil yang dipilih, lalu klik Sesuaikan.

  6. Di jendela yang terbuka, masukkan nilai berikut:

    1. Di kolom Waktu Tidak Ada Aktivitas Maksimum, masukkan nilai. Untuk mengetahui informasi selengkapnya, lihat Menetapkan waktu tidak ada aktivitas maksimum.
    2. Tetapkan Lewati penghapusan cluster ke True. Untuk mengetahui informasi selengkapnya, lihat Kapan harus menggunakan kembali cluster.
  7. Klik Selesai.

Langkah berikutnya