Mode ketahanan

Cluster Distributed Cloud terhubung menggunakan bidang kontrol lokal yang di-deploy di hardware Distributed Cloud terhubung Anda. Jika koneksi ke Google Cloud terputus, cluster Anda akan memasuki mode kemampuan bertahan dan workload Anda akan terus berjalan hingga 7 hari. Jika workload tidak berfungsi saat cluster dalam mode kemampuan bertahan, caching image lokal akan memastikan workload tersebut berfungsi kembali saat koneksi Google Cloud dipulihkan.

Cluster dapat memasuki mode survivability karena kesalahan hardware atau software di luar kendali Google, atau karena kesalahan pada hardware atau software Distributed Cloud yang terhubung.

Contoh kesalahan di luar kendali Google:

  • Kegagalan konektivitas internet di situs deployment.
  • Kesalahan konfigurasi firewall atau jaringan, atau kerusakan hardware di situs deployment.
  • Instance proxy batas yang melayani cluster dinonaktifkan atau salah dikonfigurasi.

Jika cluster yang terhubung ke Distributed Cloud Anda beroperasi dalam mode survivability selama 7 hari atau kurang karena kegagalan hardware atau software di luar kendali Google, Dukungan Google akan bekerja sama dengan Anda untuk memulihkannya ke operasi normal hingga hari ke-7. Setelah 7 hari, dukungan lebih lanjut tidak dijamin.

Contoh kesalahan pada hardware atau software Google Distributed Cloud terhubung:

  • Update software Distributed Cloud terhubung yang rusak.
  • Kegagalan pada mesin yang terhubung ke Distributed Cloud atau hardware jaringan.
  • Kesalahan yang tidak terdiagnosis dalam software Distributed Cloud terhubung.

Jika cluster Distributed Cloud terhubung Anda memasuki mode survivabilitas karena kesalahan pada software atau hardware Distributed Cloud terhubung, Dukungan Google akan bekerja sama dengan Anda hingga cluster dipulihkan ke operasi normal.

Yang terjadi saat cluster memasuki mode survivabilitas

Saat cluster yang terhubung ke Distributed Cloud memasuki mode survivabilitas, hal berikut akan terjadi:

  • Google akan memberi tahu Anda melalui email bahwa cluster yang terpengaruh telah memasuki mode survivability. Email dikirim ke kategori teknis kontak penting yang ditentukan dalam project Google Cloud yang sesuai.
  • Jika Anda memerlukan bantuan untuk memulihkan operasi normal cluster, hubungi Dukungan Google.

Operasi cluster dalam mode ketahanan

Saat dalam mode ketahanan, cluster yang terhubung ke Distributed Cloud beroperasi sebagai berikut:

  • Jika koneksi ke Google Cloud terputus, Distributed Cloud yang terhubung akan terus mencoba terhubung kembali ke Google Cloud hingga koneksi terhubung kembali.
  • Kontrol atas workload melalui Google Cloud CLI, kubectl CLI, dan Distributed Cloud Edge Container API dinonaktifkan. Namun, Anda dapat membuat kredensial offline untuk mengakses cluster melalui koneksi internet alternatif seperti yang dijelaskan dalam Mendapatkan kredensial untuk cluster.
  • Update software, SLO, dan perbaikan hardware Distributed Cloud tidak tersedia.
  • Log dan metrik terbatas disinkronkan dengan Google Cloud setelah koneksi ke Google Cloud dibuat kembali:
    • Metrik sistem dibatasi hingga 6 GB atau 22 jam, mana saja yang tercapai lebih dulu.
    • Log beban kerja dibatasi hingga 4 jam.
    • Metrik workload dibatasi hingga 1 GB.
    • Log audit dibatasi hingga 10 GB.
  • Secara default, jika node dimulai ulang saat cluster terputus dari Google Cloud, node tersebut tidak dapat bergabung kembali ke clusternya hingga koneksi ke Google Cloud terhubung kembali karena kunci autentikasinya tidak dapat diperbarui. Anda memiliki opsi untuk menentukan periode mulai ulang offline saat node dapat bergabung kembali ke cluster setelah melakukan mulai ulang saat cluster berjalan dalam mode survivabilitas. Untuk mengetahui informasi selengkapnya, lihat Membuat cluster.

Hal yang harus dilakukan saat cluster keluar dari mode ketahanan

Saat cluster yang terhubung ke Distributed Cloud keluar dari mode survivabilitas, periksa hal berikut:

  • Versi software Distributed Cloud terhubung. Anda mungkin perlu mengupdate cluster yang terpengaruh ke software yang terhubung Distributed Cloud versi terbaru, kecuali jika Anda sengaja menyematkan cluster ke versi software tertentu. Untuk mengetahui informasi selengkapnya, lihat Mengupgrade versi software cluster.
  • Sertifikat pengelolaan armada. Anda mungkin perlu memperbarui sertifikat LOAS pengelolaan armada yang masa berlakunya telah berakhir. Untuk mengatasi masalah ini, hubungi Dukungan Google.

Memeriksa status koneksi cluster

Anda dapat memeriksa status cluster Distributed Cloud dengan menyelesaikan langkah-langkah di Mendapatkan informasi tentang cluster. Google Cloud Perintah ini menampilkan nilai untuk kolom connectionState. Kolom ini dapat memiliki salah satu nilai berikut:

  • CONNECTED: Cluster terhubung dan sepenuhnya disinkronkan dengan Google Cloud.
  • DISCONNECTED: Cluster tidak terhubung ke Google Cloud.
  • CONNECTED_AND_SYNCING: Cluster telah terhubung kembali ke Google Cloud dan menyinkronkan data offline dengan Google Cloud. Jangan putuskan koneksi cluster ini dari Google Cloud hingga sinkronisasi selesai.

Langkah berikutnya