Meningkatkan ketahanan Playbook dengan percobaan ulang otomatis

Didukung di:

Dokumen ini menjelaskan mengapa tindakan otomatis dalam playbook terkadang gagal karena masalah sementara seperti gangguan jaringan atau batas kecepatan API. Untuk memastikan playbook Anda lebih tangguh, Anda dapat mengonfigurasi setiap tindakan agar otomatis dicoba lagi jika mengalami kegagalan tersebut.

Percobaan ulang tindakan membantu playbook Anda pulih dari kegagalan sementara seperti masalah jaringan, batas kecepatan API, atau tidak tersedianya layanan. Upaya percobaan ulang ini berlaku untuk tindakan playbook standar, seperti pengayaan, pembatasan, atau notifikasi.

Mekanisme percobaan ulang dipicu oleh status eksekusi internal tindakan, bukan oleh kode error HTTP standar. Percobaan ulang tidak dilakukan untuk tindakan yang mengalami waktu tunggu habis atau tindakan yang digunakan untuk kontrol alur (seperti kondisi atau blok playbook), karena tindakan ini tidak dirancang untuk gagal dengan cara yang sama.

Kondisi mekanisme coba lagi tindakan

Mekanisme percobaan ulang dipicu hanya jika tindakan gagal dalam kondisi tertentu yang biasanya menunjukkan kegagalan sementara, infrastruktur, atau yang tidak tertangani. Tidak diaktifkan untuk kegagalan yang terkait dengan tindakan waktu tunggu atau kontrol alur.

Kondisi yang mengaktifkan percobaan ulang

Mekanisme coba lagi hanya diaktifkan jika tindakan gagal dalam keadaan berikut:

  • Error skrip yang tidak ditangani: Error atau pengecualian apa pun yang terjadi dalam skrip Python tindakan yang tidak Anda tangani secara eksplisit dalam skrip.
  • Status kegagalan eksplisit: Skrip tindakan secara eksplisit menampilkan status eksekusi EXECUTION_STATE_FAILED ke server.
  • Kegagalan infrastruktur: Kegagalan yang berasal dari infrastruktur yang mendasarinya, seperti masalah koneksi (misalnya, error koneksi Python) yang mencegah hasil yang berhasil.

Kondisi yang melewati percobaan ulang (tidak ada percobaan ulang)

Percobaan ulang dilewati dalam skenario kegagalan yang terkait dengan tindakan kontrol alur atau waktu tunggu:

  • Waktu tunggu eksekusi playbook: Tindakan gagal diselesaikan dan menampilkan hasil dalam batas waktu tunggu umum yang dikonfigurasi untuk langkah playbook tertentu.
  • Status waktu tunggu yang ditangani: Skrip tindakan secara eksplisit melaporkan waktu tunggu tindakan internal dengan menampilkan status EXECUTION_STATE_TIMEOUT. Server memperlakukan hal ini sebagai "Waktu Tunggu yang Ditangani", yang memungkinkan eksekusi playbook berlanjut tanpa percobaan ulang.

Mengonfigurasi percobaan ulang tindakan

Untuk mengonfigurasi percobaan ulang untuk tindakan, ikuti langkah-langkah berikut:

  1. Klik dua kali tindakan yang relevan di perancang playbook.
  2. Di sidebar, klik tab Setelan, lalu klik tombol Coba lagi jika gagal ke posisi aktif.
  3. Tentukan parameter berikut:
    • Jumlah percobaan ulang: Masukkan berapa kali tindakan harus dicoba dijalankan ulang jika gagal.
    • Penundaan antara upaya mencoba lagi: Tentukan penundaan dalam detik, menit, atau jam antara setiap upaya percobaan ulang.
  4. Di bagian Jika langkah gagal, pilih salah satu opsi berikut jika tindakan akhirnya gagal setelah semua upaya percobaan ulang:
    • Hentikan playbook: Eksekusi playbook berhenti.
    • Lewati langkah: Playbook akan melanjutkan ke langkah berikutnya.
  5. Klik Simpan.

Cara percobaan ulang muncul selama eksekusi playbook

Saat langkah playbook dengan percobaan ulang berjalan, Anda akan melihat status dan pesan tertentu yang menunjukkan progres upaya percobaan ulang:

  • Jika tindakan gagal dengan konfigurasi percobaan ulang, statusnya di tab Playbook akan berubah sementara menjadi Menunggu percobaan ulang berikutnya sebelum upaya berikutnya.
  • Jika tindakan berhasil setelah satu atau beberapa kali percobaan ulang, status akhirnya di tab Playbook menunjukkan keberhasilan, beserta jumlah percobaan ulang (misalnya, Selesai setelah dua kali percobaan ulang).
  • Jika tindakan gagal setelah semua upaya percobaan ulang, status akhirnya akan menunjukkan kegagalan, beserta jumlah percobaan ulang (misalnya, Gagal setelah 3 kali percobaan ulang).
  • Informasi yang relevan tentang upaya percobaan ulang juga muncul di Repositori Kasus.

Perlu bantuan lain? Dapatkan jawaban dari anggota Komunitas dan profesional Google SecOps.