Komunikasi insiden Google Cloud

Dokumen ini menguraikan pendekatan Google Cloud's dalam mengomunikasikan insiden, termasuk peran saluran komunikasi utama berikut: Personalized Service Health (PSH) dan dasbor Service Health (CSH) publik. Google Cloud

Tempat untuk mencari komunikasi insiden

Google Cloud menyediakan dua saluran untuk komunikasi insiden, masing-masing dengan tujuan yang berbeda:

  • Personalized Service Health (PSH): Ini adalah sumber utama Anda untuk mengetahui gangguan layanan yang relevan bagi Anda. Fitur ini memberikan tampilan yang dipersonalisasi dan disesuaikan dengan produk tertentu yang Anda gunakan. Google Cloud Sebaiknya integrasikan Personalized Service Health ke dalam proses respons insiden Anda sebagai sinyal pendukung yang penting.

    Untuk menghindari menghubungi engineer yang bertugas setiap kali ada peristiwa Personalized Service Health, integrasikan visibilitas insiden Personalized Service Health ke dasbor dan alat tim Anda. Praktik ini membantu operator dengan cepat menentukan apakah masalah yang dicurigai terkait dengan gangguan layanan Google Cloud . Pelajari PSH lebih lanjut.

  • Google Cloud Service Health (CSH): Ini adalah halaman status yang dapat diakses publik Google Cloud, yang tersedia di status.cloud.google.com. Google Cloud Service Health tidak memerlukan login dan berfungsi sebagai pemeriksaan kondisi sekilas untuk seluruh platform, dan digunakan untuk mengomunikasikan insiden berat yang luas atau saat PSH itu sendiri tidak tersedia.

Diagram yang membandingkan saluran komunikasi PSH dengan CSH. Diagram ini menunjukkan insiden yang muncul, insiden yang telah dikonfirmasi, dan insiden parah yang luas yang masuk ke Personalized Service Health.
Diagram ini menunjukkan insiden parah yang luas yang masuk ke Cloud Service Health. Yang tercantum di bagian Personalized Service Health adalah Dasbor, API, dan Cloud Logging. Di bagian Cloud Service Health, terdapat Dasbor dan Feed RSS.

Strategi dan rekomendasi pengungkapan kami

Menentukan apa yang akan dibagikan, dan di mana, bukanlah proses yang arbitrer. Ini adalah disiplin ilmu formal dan sistematis yang terutama didasarkan pada cakupan insiden. Tujuan dari saluran ini adalah untuk memberikan visibilitas maksimum untuk Insiden Berat Luas sekaligus mengurangi gangguan insiden yang tidak relevan.

  • Untuk Insiden Parah dengan Cakupan Luas: Insiden dengan cakupan luas—yang memengaruhi persentase besar project atau tersebar luas di beberapa region—dikomunikasikan menggunakan Google Cloud Service Health (CSH). Insiden ini juga dikomunikasikan kepada pelanggan yang terpengaruh menggunakan Personalized Service Health. Hal ini membantu memastikan pesan menjangkau audiens seluas mungkin untuk peristiwa yang paling penting.

  • Untuk Insiden Terkonfirmasi lainnya: Untuk masalah dengan cakupan yang lebih terbatas, seperti yang memengaruhi satu lokasi, zona, atau subkumpulan proyek yang lebih kecil, kami akan mengomunikasikan insiden yang relevan kepada pelanggan menggunakan Personalized Service Health. Kami berupaya untuk bersikap transparan secara komprehensif, yang berarti Kesehatan Layanan menyediakan semua peristiwa yang berpotensi relevan untuk layanan Anda. Jika Anda memerlukan feed peristiwa yang lebih terfokus, Kesehatan Layanan menawarkan alat untuk memfilter dan menyesuaikan peristiwa yang diteruskan melalui alur kerja otomatis dan pemberitahuan Anda.

    • Rekomendasi: Konfigurasi pemberitahuan agar hanya berfokus pada layanan dan lokasiGoogle Cloud yang paling penting, atau agar hanya dipicu pada peristiwa dengan relevansi "Terkait" atau "Terpengaruh". Lihat contoh cara memfilter dan menyesuaikan pemberitahuan.

Strategi Penggantian jika Personalized Service Health tidak tersedia

Service Health yang Dipersonalisasi bergantung pada layanan inti, seperti Identity and Access Management untuk autentikasi. Jika terjadi gangguan parah dan meluas, layanan yang Anda butuhkan untuk login mungkin terpengaruh.

Kami merekomendasikan strategi penggantian berikut:

  • Untuk proses manual: Runbook Anda harus mengarahkan operator ke dasborGoogle Cloud Service Health di status.cloud.google.com jika mereka tidak dapat mengakses dasbor Personalized Service Health.

  • Untuk sistem otomatis: Gunakan Service Health Status API untuk mendeteksi secara terprogram apakah Personalized Service Health mengalami masalah. Jika ya, sistem Anda dapat kembali menggunakan Feed RSS CSH publik untuk terus mendapatkan update terprogram.