Anda dapat membuat kebijakan pemberitahuan pada tujuan tingkat layanan (SLO) untuk mengetahui apakah Anda berisiko melanggar SLO. Anda memilih SLO yang ingin dipantau, lalu mengonfigurasi kebijakan pemberitahuan untuk memantau SLO tersebut. Kondisi biasanya dinyatakan dengan memilih nilai minimum yang merupakan pelanggaran, dan periode pelanggaran diizinkan. Jika ambang batas terlampaui selama lebih dari periode yang diizinkan, kebijakan pemberitahuan akan dipicu.
Halaman ini menjelaskan pemberitahuan tentang laju pengeluaran anggaran error Anda. Dokumen ini tidak membahas kebijakan pemberitahuan secara mendetail; dokumen ini mengasumsikan bahwa Anda sudah mengetahui konsep dasar kondisi dan saluran notifikasi.
Untuk mengetahui informasi umum tentang kebijakan pemberitahuan dan cara membuatnya, lihat Menggunakan kebijakan pemberitahuan.
Untuk mengetahui langkah-langkah spesifik dalam membuat kebijakan pemberitahuan berbasis SLO, lihat artikel berikut:
- Membuat kebijakan pemberitahuan menggunakan konsol Google Cloud .
- Membuat kebijakan pemberitahuan menggunakan Cloud Monitoring API.
Laju pengeluaran anggaran error
Anggaran error Anda untuk periode kepatuhan adalah (1 − sasaran SLO) × (peristiwa yang memenuhi syarat dalam periode kepatuhan). Jika target SLO Anda adalah 95%, maka 5% peristiwa yang diukur oleh SLI Anda dapat gagal sebelum target SLO Anda terlewat.
Laju pengeluaran memberi tahu seberapa cepat Anda menghabiskan anggaran error untuk periode kepatuhan. Rasio penggunaan bergantung pada jumlah peristiwa yang memenuhi syarat dan jumlah peristiwa error yang diterima dalam periode kepatuhan. Misalnya, jika tidak ada peristiwa error yang terjadi, maka anggaran error tidak digunakan dan laju pengeluaran adalah nol. Untuk contoh yang mengilustrasikan cara menghitung waktu nonaktif maksimum untuk layanan, lihat Pemberitahuan tentang Tingkat Pembakaran.
Metrik laju pengeluaran dinormalisasi sehingga laju pengeluaran yang lebih besar dari satu menunjukkan bahwa jika rasio error yang diukur dipertahankan selama periode kepatuhan mendatang, maka layanan akan berada di luar SLO untuk periode tersebut. Untuk mengetahui informasi selengkapnya, lihat Anggaran error.
Metrik laju pembakaran diambil oleh pemilih deret waktu
select_slo_burn_rate. Kebijakan pemberitahuan laju penggunaan akan memberi tahu Anda saat anggaran error Anda digunakan lebih cepat daripada nilai minimum yang Anda tentukan, yang diukur selama periode kepatuhan pemberitahuan. Ada pemilih deret waktu lainnya; lihat
Mengambil data SLO untuk mengetahui informasi selengkapnya.
Anda dapat membuat kebijakan pemberitahuan yang menggunakan beberapa pemilih deret waktu lainnya, tetapi Anda harus membuatnya menggunakan Cloud Monitoring API.
Ringkasan pembuatan kebijakan pemberitahuan pada SLO
Membuat kebijakan pemberitahuan untuk SLO serupa dengan membuat kebijakan pemberitahuan untuk metrik. Bagian ini meninjau langkah-langkah umum untuk membuat kebijakan pemberitahuan.
Untuk membuat kebijakan pemberitahuan untuk SLO, Anda harus melakukan langkah-langkah berikut:
Identifikasi SLO yang ingin Anda jadikan dasar kebijakan pemberitahuan.
Buat kondisi untuk kebijakan pemberitahuan yang menggunakan SLO yang dipilih. Dalam kondisi, Anda menentukan pemilih deret waktu yang akan digunakan dalam mengambil data SLO. Anda juga menentukan durasi, nilai minimum, dan perbandingan yang menentukan kapan SLO tidak mematuhi persyaratan.
Misalnya, jika Anda menggunakan pemilih deret waktu untuk laju pengeluaran, data yang diambil mencerminkan laju pengeluaran anggaran error untuk SLO yang dipilih.
Kondisi ini juga merupakan tempat Anda menentukan ambang batas dan durasi pelanggaran SLO sebelum memicu pemberitahuan. Misalnya, Anda ingin laju penggunaan melebihi laju yang diinginkan selama jangka waktu tertentu sebelum memicu pemberitahuan. Nilai untuk “jumlah tertentu di atas” adalah nilai minimum kondisi, dan nilai untuk “periode tertentu” adalah durasi kondisi.
Identifikasi atau buat saluran notifikasi untuk digunakan dalam kebijakan pemberitahuan Anda.
Berikan dokumentasi yang menjelaskan kepada pengguna apa yang memicu kebijakan pemberitahuan.
Untuk mengetahui informasi umum tentang kebijakan pemberitahuan dan cara membuatnya, lihat Menggunakan kebijakan pemberitahuan.
Kebijakan pemberitahuan dan periode lihat kembali
Saat mengambil data SLO untuk kebijakan pemberitahuan, Anda menentukan ID untuk SLO dan periode lihat ke belakang. Periode lihat balik menentukan seberapa jauh rentang waktu ke belakang untuk mengambil data. Yang penting, periode lihat kembali juga digunakan sebagai periode kepatuhan untuk menghitung performa SLO dan anggaran error.
Saat ini, pemberitahuan tidak dapat didasarkan pada laju penggunaan anggaran error SLO menggunakan periode kepatuhan lebih dari 24 jam. Dalam banyak kasus, perkiraan periode kepatuhan jangka panjang (misalnya, 28 atau 30 hari) dengan periode kurang dari 24 jam sudah cukup untuk tujuan mendeteksi gangguan dan mendorong respons operasional jangka pendek Anda terhadap gangguan tersebut.
Periode kepatuhan yang lebih singkat memberikan deteksi masalah yang lebih cepat, tetapi dengan catatan bahwa perubahan besar dalam traffic dan rasio error selama satu hari dapat menyebabkan pemberitahuan yang terlalu sensitif selama periode traffic rendah. Pertimbangkan untuk menggunakan nilai minimum laju pembakaran yang jauh lebih besar dari 1 untuk mengurangi sensitivitas pemberitahuan selama waktu ini.
Jenis pemberitahuan anggaran error
Saat menyiapkan kebijakan pemberitahuan untuk memantau anggaran error, sebaiknya siapkan dua kebijakan pemberitahuan terkait:
Pemberitahuan pembakaran cepat, yang memperingatkan Anda tentang perubahan besar yang tiba-tiba dalam konsumsi yang, jika tidak diperbaiki, akan menghabiskan anggaran error Anda dengan sangat cepat. “Dengan laju ini, kita akan menghabiskan seluruh anggaran error bulan ini dalam dua hari!”
Untuk pemberitahuan pembakaran cepat, gunakan periode lihat kembali yang lebih singkat sehingga Anda akan diberi tahu dengan cepat jika kondisi yang berpotensi menimbulkan bencana telah muncul dan berlanjut, meskipun hanya sebentar. Jika benar-benar merugikan, Anda tidak ingin menunggu lama untuk menyadarinya.
Ambang batas untuk laju konsumsi yang Anda berikan peringatan di sini jauh lebih tinggi daripada dasar yang ideal untuk periode lihat kembali.
Pemberitahuan Slow-burn, yang memperingatkan Anda tentang tingkat penggunaan yang, jika tidak diubah, akan menghabiskan anggaran error Anda sebelum akhir periode kepatuhan. Jenis kondisi ini tidak terlalu mendesak dibandingkan dengan kondisi pembakaran cepat. “Kami sedikit melampaui target yang kami inginkan pada saat ini, tetapi kami belum mengalami masalah besar.”
Untuk pemberitahuan yang lambat, gunakan periode lihat kembali yang lebih lama untuk memperlancar variasi dalam konsumsi jangka pendek.
Nilai minimum yang Anda gunakan untuk pemberitahuan pembakaran lambat lebih tinggi daripada performa ideal untuk periode lihat ke belakang, tetapi tidak jauh lebih tinggi. Kebijakan berdasarkan periode lihat kembali yang lebih pendek dengan nilai minimum yang tinggi mungkin menghasilkan terlalu banyak pemberitahuan, meskipun tingkat konsumsi jangka panjang berkurang. Namun, jika pemakaian tetap terlalu tinggi meskipun hanya sedikit dalam jangka waktu yang lebih lama, pada akhirnya akan menghabiskan seluruh anggaran error Anda.
Langkah berikutnya
- Untuk membuat kebijakan pemberitahuan berbasis SLO menggunakan konsol Google Cloud , lihat Membuat kebijakan pemberitahuan (konsolGoogle Cloud ).
- Untuk membuat kebijakan pemberitahuan berbasis SLO menggunakan Monitoring API, lihat Membuat kebijakan pemberitahuan (API).