Untuk menghindari timbulnya Google Cloud biaya untuk cluster yang tidak aktif, atau kebutuhan untuk menghapus dan membuat ulang cluster untuk menghindari timbulnya biaya cluster, gunakan fitur penghentian terjadwal cluster Managed Service for Apache Spark, yang menghentikan semua VM cluster. Anda tidak dikenai biaya untuk VM yang dihentikan, tetapi biaya akan terus dikenakan untuk resource terkait, seperti persistent disk.
Menghentikan cluster akan menghentikan semua VM cluster dan menyebabkan kegagalan semua tugas yang sedang berjalan. Saat cluster dihentikan, Anda tidak dapat mengupdate cluster, mengirimkan tugas ke cluster, atau mengakses komponen opsional di cluster menggunakan Managed Service for Apache Spark Component Gateway. Setelah menghentikan cluster, Anda dapat memulai ulang cluster, dan melanjutkan pekerjaan.
Penghentian terjadwal cluster tersedia untuk cluster yang dibuat dengan 2.2.42+ , 2.1.76+, dan 2.0.57+, serta versi image yang lebih baru.
Fitur
Anda dapat menghentikan cluster setelah periode tidak ada aktivitas tertentu, pada waktu mendatang tertentu, atau setelah periode tertentu dari permintaan pembuatan cluster.
Penghentian terjadwal cluster mendukung cluster dengan worker sekunder dan cluster skala nol.
Anda dapat memperbarui atau membatalkan konfigurasi penghentian terjadwal cluster.
Batasan dan pertimbangan
- Penghentian terjadwal cluster tidak didukung untuk cluster dengan SSD lokal.
- Anda tidak dapat menetapkan nilai penghentian terjadwal cluster menggunakan konsol Google Cloud .
- Meskipun Anda dapat memperbarui konfigurasi penghentian terjadwal cluster, operasi penghentian yang dimulai akan tetap berlanjut. Untuk memeriksa apakah operasi penghentian telah dimulai, periksa log cluster di Cloud Logging.
- Memperbarui jadwal penghentian pada cluster yang memiliki waktu penghentian terjadwal yang telah berlalu akan menghapus konfigurasi penghentian terjadwal. Untuk mengaktifkan kembali penghentian terjadwal, sertakan waktu mendatang dalam permintaan update Anda.
Tindakan yang menonaktifkan penghentian terjadwal cluster
Saat cluster berjalan, tindakan berikut akan menonaktifkan penghentian terjadwal cluster hingga tindakan penonaktifan dibatalkan:
- Menghapus IAM Managed Service for Apache Spark Service Agent role di akun layanan Dataproc Service Agent
- Menonaktifkan Managed Service for Apache Spark API di project cluster
- Mengaktifkan Kontrol Layanan VPC jika Managed Service for Apache Spark akun layanan Agen Layanan (Identitas bidang kontrol) tidak berada dalam batas perimeter
Penghitungan waktu tidak ada aktivitas cluster
Agar cluster dianggap tidak ada aktivitas, kondisi berikut harus dipenuhi:
- pembuatan cluster selesai (waktu yang diperlukan untuk penyediaan dan startup cluster tidak termasuk dalam perhitungan waktu tidak ada aktivitas)
- tidak ada tugas yang berjalan di cluster
- cluster tidak dalam status
STOPPED
Mengirimkan tugas ke cluster atau menghentikan cluster akan mereset perhitungan waktu tunggu tidak ada aktivitas.
dataproc:dataproc.cluster-ttl.consider-yarn-activity
Properti cluster
memengaruhi penghitungan waktu tunggu cluster, sebagai berikut:
- Properti ini diaktifkan (ditetapkan ke
true) secara default. - Jika properti ini diaktifkan, aktivitas YARN dan Managed Service for Apache Spark Jobs API harus tidak ada aktivitas agar dapat memulai dan terus menghitung waktu tidak ada aktivitas cluster.
- Aktivitas YARN mencakup aplikasi YARN yang tertunda dan sedang berjalan.
- Aktivitas Managed Service for Apache Spark Jobs API mencakup tugas yang tertunda dan berjalan yang dikirimkan ke Managed Service for Apache Spark Jobs API.
- Jika properti ini disetel ke
false, penghitungan waktu tunggu cluster dimulai dan berlanjut hanya saat aktivitas Managed Service for Apache Spark Jobs API tidak ada.
Menggunakan Penghentian Terjadwal Cluster
gcloud CLI
Anda dapat menetapkan nilai penghentian terjadwal saat membuat cluster menggunakan Google Cloud CLI atau Managed Service for Apache Spark API. Setelah membuat cluster, Anda dapat memperbarui cluster untuk mengubah atau menghapus nilai scheduledstop cluster yang sebelumnya ditetapkan di cluster.
| Flag | Deskripsi | Perincian Terhalus | Nilai Min | Nilai Maksimum |
|---|---|---|---|---|
--stop-max-idle1 |
Berlaku untuk perintah pembuatan cluster dan update cluster.
Durasi dari saat cluster memasuki status tidak ada aktivitas
(setelah pembuatan atau startup) hingga saat cluster mulai berhenti.
Berikan durasi dalam format IntegerUnit, dengan unitnya dapat berupa "s, m, h, d" (detik, menit, jam, hari). Contoh:
"30m" atau "1d" (30 menit atau 1 hari sejak cluster menjadi tidak ada aktivitas). |
1 detik | 5 menit | 14 hari |
--no-stop-max-idle |
Hanya berlaku untuk perintah update cluster.
Membatalkan penghentian terjadwal cluster berdasarkan tanda
--stop-max-idle yang ditetapkan sebelumnya |
Tidak berlaku | Tidak berlaku | Tidak berlaku |
--stop-expiration-time2 |
Berlaku untuk perintah pembuatan cluster dan update cluster. Waktu untuk mulai menghentikan cluster dalam format tanggal dan waktu ISO 8601. Anda dapat membuat datetime dalam format yang benar menggunakan Timestamp Generator. Misalnya, "2017-08-22T13:31:48-08:00" menentukan waktu habis masa berlaku 13:21:48 di zona waktu UTC -8:00. | 1 detik | 10 menit dari waktu saat ini | 14 hari dari waktu saat ini |
--stop-max-age2 |
Berlaku untuk perintah pembuatan cluster dan update cluster.
Durasi sejak saat pengiriman permintaan pembuatan cluster
hingga saat cluster mulai berhenti. Berikan durasi
dalam format IntegerUnit, dengan unitnya dapat berupa "s, m, h, d"
(detik, menit, jam, hari). Contoh: "30m": 30 menit dari sekarang;
"1d": 1 hari dari sekarang. |
1 detik | 10 menit | 14 hari |
- Anda dapat meneruskan flag
stop-max-idledengan flagstop-expiration-timeataustop-max-agedalam permintaan pembuatan atau update cluster. Yang pertama menjadi benar akan berlaku untuk menghentikan cluster. - Anda dapat meneruskan flag
stop-expiration-timeatau flagstop-max-ageke perintah pembuatan atau update cluster, tetapi tidak keduanya.
Contoh pembuatan cluster:
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ --stop-max-idle=DURATION \ --stop-expiration-time=TIME \ ... other flags ...
Contoh update cluster:
Contoh:
gcloud dataproc clusters update CLUSTER_NAME \ --region=REGION \ --stop-max-idle=DURATION \ --no-stop-max-age \ ... other flags
REST API
Anda dapat membuat atau memperbarui nilai penghentian terjadwal pada cluster dengan menetapkan kolom dan nilai ClusterLifecycleConfig API Managed Service for Apache Spark yang tercantum dalam tabel berikut sebagai bagian dari permintaan API cluster.create atau cluster.patch Managed Service for Apache Spark.
| Flag | Deskripsi | Perincian Terhalus | Nilai Min | Nilai Maksimum |
|---|---|---|---|---|
idleStopTtl1 |
Berlaku untuk perintah pembuatan cluster dan update cluster.
Durasi dari saat cluster memasuki status tidak ada aktivitas
setelah cluster dibuat atau diupdate hingga saat cluster
mulai berhenti.
Berikan durasi dalam detik dengan maksimal sembilan digit pecahan,
diakhiri dengan 's'. Contoh: "3.5s".
Kirim permintaan cluster.patch dengan
durasi kosong untuk membatalkan nilai idleDeleteTtl yang ditetapkan
sebelumnya. |
1 detik | 5 menit |
14 hari |
autoStopTime2 |
Berlaku untuk perintah pembuatan cluster dan update cluster. Waktu untuk mulai menghentikan cluster. Berikan stempel waktu dalam format RFC 3339 UTC "Zulu", akurat hingga nanodetik. Contoh: "2014-10-02T15:01:23.045123456Z". | 1 detik | 10 menit dari waktu saat ini | 14 hari dari waktu saat ini |
autoStopTtl2 |
Durasi dari saat pengiriman permintaan pembuatan atau update cluster hingga saat cluster mulai berhenti. Berikan durasi dalam detik dengan maksimal sembilan digit pecahan, yang diakhiri dengan 's'. Contoh: "3.5s". | 1 detik | 10 menit. Kirimkan permintaan cluster.patch dengan durasi kosong
untuk membatalkan nilai autoStopTtl yang ditetapkan sebelumnya. |
14 hari |
- Anda dapat meneruskan flag
stop-max-idledengan flagstop-expiration-timeataustop-max-agedalam permintaan pembuatan atau update cluster. Yang pertama menjadi benar akan berlaku untuk menghentikan cluster. - Anda dapat meneruskan flag
stop-expiration-timeatau flagstop-max-ageke perintah pembuatan atau update cluster, tetapi tidak keduanya.
Menggunakan penghentian terjadwal dengan penghapusan terjadwal
Jika Anda menggunakan penghentian terjadwal cluster dengan penghapusan terjadwal cluster, saat membuat atau memperbarui cluster, perhatikan batasan berikut:
Periode
stop-max-idleharus lebih pendek atau sama dengan periodedelete-max-idle, atau periode yang dihasilkan daridelete-max-ageataudelete-expiration-time.stop-max-agedanstop-expiration-timeharus lebih baru daridelete-max-agedandelete-expiration-time.
Melihat setelan cluster Berhenti Terjadwal
gcloud CLI
Anda dapat menggunakan perintah gcloud dataproc clusters list untuk
mengonfirmasi bahwa penghentian terjadwal diaktifkan untuk cluster.
gcloud dataproc clusters list \ --region=REGION
Contoh output:
... NAME WORKER_COUNT ... SCHEDULED_STOP CLUSTER_ID NUMBER ... enabled ...
Anda dapat menggunakan perintah gcloud dataproc clusters describe untuk
memeriksa setelan penghentian terjadwal LifecycleConfig cluster.
gcloud dataproc clusters describe CLUSTER_NAME \ --region=REGION
Contoh output:
... lifecycleConfig: autoStopTime: '2018-11-28T19:33:48.146Z' idleStopTtl: 1800s idleStartTime: '2018-11-28T18:33:48.146Z' ...
Nilai autoStopTime dan idleStopTtl
ditetapkan oleh pengguna. Managed Service for Apache Spark menghasilkan nilai
idleStartTime, yang merupakan waktu mulai tidak ada aktivitas cluster terbaru.
Meskipun Managed Service for Apache Spark menghitung idleStartTime berdasarkan
penghentian aktivitas tugas, mekanisme untuk penghentian cluster terjadwal
mempertimbangkan idleStartTime dan waktu mulai terakhir cluster.
Secara khusus, jika cluster dihentikan oleh pengguna atau oleh Managed Service for Apache Spark,
perhitungan tidak ada aktivitas untuk fitur penghentian terjadwal akan direset. Artinya, hitung mundur ke perhentian terjadwal dimulai ulang saat cluster dimulai berikutnya. Namun,
idleStartTime itu sendiri tidak direset saat cluster yang dihentikan
dimulai ulang. Status ini terus mencerminkan kejadian terakhir tidak adanya aktivitas tugas sebelum
penghentian.
Oleh karena itu, dua kondisi harus dipenuhi agar Managed Service untuk Apache Spark
menghentikan cluster berdasarkan idleStopTtl:
- Cluster harus dalam kondisi tidak ada aktivitas selama durasi yang ditentukan oleh
idleStopTtlsejak terakhir kali dimulai. - Cluster harus dalam kondisi tidak ada aktivitas selama durasi yang ditentukan oleh
idleStopTtlsejak resetidleStartTimeterakhir.
REST API
Anda dapat membuat permintaan
clusters.list
untuk mengonfirmasi bahwa penghentian terjadwal diaktifkan untuk cluster.