Tanggung jawab bersama Google Distributed Cloud terhubung

Pemantauan dan pemeliharaan Google Distributed Cloud terhubung adalah tanggung jawab bersama antara Google dan pelanggan. Gunakan informasi dalam dokumen ini untuk menentukan cara terbaik men-deploy dan mengelola workload lokal Anda.

Tanggung jawab Google

Sebagai layanan hardware dan software terkelola, Google bertanggung jawab untuk mengelola dan memantau infrastruktur yang Anda gunakan untuk men-deploy aplikasi bisnis Anda.

Google bertanggung jawab atas aspek berikut dari sistem Distributed Cloud terhubung:

  • Google Cloud Bidang kontrol
  • Bidang kontrol Kubernetes, worker node, dan layanan sistem bawaan
  • Produk dan add-on software yang disediakan Google
  • Hardware yang disediakan, termasuk server

Google memantau fungsi yang menjadi tanggung jawab kami dan memberi tahu engineer Google jika masalah ditemukan sehingga mereka dapat menyelidikinya.

Tanggung jawab pelanggan

Anda bertanggung jawab atas aspek berikut dari sistem yang terhubung ke Distributed Cloud:

  • Jaringan lokal, termasuk switch yang disediakan pelanggan
  • Konektivitas internet
  • Daya
  • Lingkungan, seperti pendinginan
  • Aplikasi pelanggan dan add-on Google Distributed Cloud atau Kubernetes yang diinstal pelanggan
  • Instance host bastion milik pelanggan dan deployment proxy batas, jika menggunakan fitur ini

Google tidak secara langsung memantau masalah yang menjadi tanggung jawab Anda. Misalnya, Google tidak memantau apakah VM pelanggan tidak melakukan booting dengan benar atau apakah aplikasi pelanggan tidak berjalan. Jika Anda yakin bahwa perilaku tersebut disebabkan oleh masalah platform, Anda harus membuka Google Cloud tiket dukungan agar Google dapat menyelidikinya.

Tanggung jawab bersama

Terkadang, Google mendeteksi kegagalan situs, tetapi yakin bahwa penyebabnya adalah masalah khusus situs yang menjadi tanggung jawab Anda. Misalnya, kami mungkin melihat suhu yang meningkat dari waktu ke waktu di semua node di situs, diikuti dengan terputusnya koneksi, yang menunjukkan bahwa kegagalan pendinginan lokal adalah kemungkinan masalahnya. Dalam skenario ini, Google memulai pemecahan masalah kolaboratif dengan Anda untuk mengonfirmasi apakah masalah disebabkan oleh tanggung jawab pelanggan khusus situs dan untuk memverifikasi kegagalan hardware.

Untuk berhasil menyelesaikan masalah dan menentukan penyebab utamanya, Google mungkin perlu meminta dan menerima informasi dari Anda. Misalnya, Google mungkin perlu mengetahui waktu terjadinya gangguan listrik dan kapan listrik atau jaringan dipulihkan. Jika Anda tidak dapat memberikan informasi ini, Google mungkin tidak dapat melakukan analisis mendetail terhadap akar masalah.

Kegagalan konektivitas

Dalam kasus khusus kegagalan konektivitas internet, produk ini mendukung mode keberlanjutan hingga tujuh hari. Selama periode ini, akses lokal ke layanan tersedia. Namun, Google tidak dapat memantau, memitigasi, atau mendiagnosis masalah sistem di lokasi hingga konektivitas jaringan dipulihkan.

Meskipun Google memantau terputusnya koneksi situs dari sistem telemetri Google, kami tidak dapat menentukan dari jarak jauh apakah penyebab utamanya adalah listrik, konektivitas ISP, atau kegagalan situs yang parah, seperti kebakaran atau banjir.

Jika semua hardware di situs berhenti melaporkan data secara bersamaan, kemungkinan penyebabnya adalah masalah jaringan atau daya lokal. Untuk menghindari alarm palsu, Google mungkin tidak mengomunikasikan masalah tersebut hingga kami mengonfirmasi bahwa masalah tersebut tidak akan dapat diselesaikan sendiri, misalnya, karena pemeliharaan ISP, dan tidak dapat diselesaikan secara virtual. Jika demikian, pemecahan masalah lebih lanjut diperlukan.

Jika dikonfigurasi untuk host bastion dan proxy batas (BH/BP), Google akan memantau konektivitas menggunakan BH/BP dan perangkat yang terhubung ke Distributed Cloud melalui BH/BP menggunakan permintaan pengujian berkala. Google mengharapkan Anda memantau kondisi keseluruhan instance BH/BP mereka, misalnya dengan melacak penggunaan resource. Jika kami mendeteksi masalah konektivitas ke BH/BP atau ke perangkat yang terhubung ke Distributed Cloud dan mencurigai bahwa masalah tersebut mungkin berasal dari komponen milik pelanggan, kami dapat meminta Anda mendiagnosis dan men-debug masalah tersebut.

Proses Debug

Untuk membantu proses penelusuran bug, Google mungkin meminta data berikut:

  • Setiap perubahan konfigurasi yang diterapkan pada peralatan jaringan yang tidak dikelola Google, seperti switch, router, atau firewall, termasuk stempel waktu hingga detik terdekat
  • Log penolakan firewall, termasuk stempel waktu dan detailnya
  • Waktu dan alasan perangkat dimulai ulang. Alasannya dapat mencakup upgrade software, kegagalan daya, atau error software.
  • Waktu terjadinya kegagalan daya, yang mungkin diketahui, seperti dari pengelolaan gedung atau pusat data, atau disimpulkan dari pesan log terakhir peralatan lain
  • Waktu terjadinya gangguan jaringan, berdasarkan penyedia jaringan atau pesan log di router atau firewall

Untuk masalah interoperabilitas, Google juga mungkin memerlukan proses debug bersama dengan vendor, termasuk berbagi file log perangkat dan mengaktifkan opsi debug. Jika memungkinkan, kami mencoba mereproduksi masalah di lingkungan lab pelanggan.

Dalam beberapa kasus, Google dapat memperoleh informasi dari peralatan yang kami kelola, tetapi informasi tersebut mungkin tidak lengkap. Misalnya, setelah listrik padam, koneksi ISP dapat memerlukan waktu lebih lama untuk di-boot daripada server yang terhubung ke Distributed Cloud.

Pembagian tanggung jawab

Gunakan tabel berikut untuk menentukan siapa yang bertanggung jawab atas tugas umum.

Tugas Pelanggan Google
Mengidentifikasi masalah terputusnya deployment dan memberikan notifikasi kepada pelanggan untuk penyelidikan X
Menyelesaikan masalah daya X
Selesaikan masalah jaringan, termasuk switch yang disediakan pelanggan. X X
Menyelesaikan masalah lingkungan, seperti pendinginan X
Mengatasi instance host bastion milik pelanggan dan deployment proxy batas, jika di-deploy X
Memantau bidang pengelolaan API X
Memantau bidang kontrol Kubernetes, worker node, dan layanan sistem bawaan X
Memantau add-on dan produk software yang disediakan Google, seperti Symcloud Storage X
Memantau hardware yang disediakan, seperti server dan, untuk beberapa deployment, peralatan jaringan X
Memantau peralatan jaringan yang disediakan pelanggan X
Memantau konektivitas jaringan upstream X
Memberikan dukungan penelusuran kesalahan bersama untuk masalah jaringan atau lingkungan X
Kemampuan observasi platform, termasuk metrik dan log X
Kemampuan observasi aplikasi, termasuk metrik dan log X
Merespons permintaan untuk menyelidiki masalah yang diyakini menjadi tanggung jawab pelanggan X