Praktik terbaik ketersediaan

Halaman ini menjelaskan praktik terbaik untuk memastikan ketersediaan tinggi bagi penginstalan Google Distributed Cloud Anda. Distributed Cloud tidak menawarkan perjanjian tingkat layanan (SLA) dan hanya menyediakan tujuan tingkat layanan (SLO) yang dijelaskan di halaman ini.

Memilih dan menerapkan tingkat ketersediaan

Anda harus memilih tingkat ketersediaan untuk workload Distributed Cloud yang paling sesuai dengan persyaratan bisnis Anda. Misalnya, aplikasi pembayaran mandiri di toko retail memiliki risiko ketersediaan yang jauh lebih rendah daripada deployment RAN edge operator jaringan seluler.

Ketersediaan target berbanding lurus dengan kapasitas resource cadangan Distributed Cloud yang Anda pesan untuk keadaan darurat. Tabel berikut menjelaskan hubungan ini. Perkiraan ini tidak mencakup waktu non-operasional yang dijadwalkan dengan masa pemeliharaan.

Software Distributed Cloud terhubung menggunakan beberapa resource di setiap mesin fisik. Jumlahnya bervariasi bergantung pada konfigurasi spesifik deployment Distributed Cloud yang terhubung. Google merekomendasikan agar Anda melakukan benchmark pada deployment Distributed Cloud terhubung untuk mengukur jumlah ini dan memperhitungkannya saat merencanakan distribusi workload Anda.

Faktor bentuk GDC Edge Kapasitas yang digunakan Kapasitas yang dicadangkan Ketersediaan target
GDC Edge Rack
(cluster 6 mesin tunggal)
83,33% 16,67% 99,9%
GDC Edge Rack
(cluster 6 mesin tunggal)
100% 0% 93,5%
Server GDC Edge
(cluster 3 mesin tunggal)
66,6% 33,3% 99,9%

Anda mungkin mengalami penurunan kapasitas secara tiba-tiba karena kegagalan hardware atau node yang memerlukan mulai ulang. Untuk mempersiapkannya, Anda harus merancang workload dengan mempertimbangkan kuota resource sehingga Anda selalu memiliki kapasitas yang tersedia di setiap node Distributed Cloud yang memenuhi tingkat ketersediaan yang Anda pilih.

Misalnya, untuk mencapai target ketersediaan 99,9% pada deployment Distributed Cloud Rack, Anda harus mengonfigurasi beban kerja sehingga salah satu dari enam mesin fisik di setiap cluster Distributed Cloud tersedia sebagai cadangan.

Menggunakan mode ketahanan

Distributed Cloud memungkinkan Anda membuat cluster yang menggunakan bidang kontrol lokal yang berjalan di hardware Distributed Cloud Anda. Cluster tersebut memungkinkan workload terus berjalan saat koneksi ke Google Cloud terputus. Untuk mengetahui informasi selengkapnya, lihat Mode survivabilitas Distributed Cloud.

Memahami update software dan masa pemeliharaan

Google mengupdate software Distributed Cloud secara berkala. Update software ini bersifat wajib dan Anda tidak dapat memilih untuk tidak menggunakannya. Distributed Cloud memungkinkan Anda menentukan periode pemeliharaan individual untuk setiap cluster Distributed Cloud.

Untuk memitigasi potensi gangguan sementara pada workload, masa pemeliharaan memungkinkan Anda mengontrol kapan upgrade otomatis bidang kontrol dan node dapat terjadi. Periode pemeliharaan berguna untuk jenis skenario berikut, antara lain:

  • Di luar jam sibuk: Anda ingin meminimalkan peluang periode nonaktif dengan menjadwalkan upgrade otomatis di luar jam sibuk saat traffic sedang turun.
  • Jam kerja: Anda ingin memastikan bahwa upgrade terjadi selama jam kerja agar ada orang yang dapat memantau upgrade dan mengelola masalah yang tidak terduga.
  • Upgrade multi-cluster: Anda ingin meluncurkan upgrade di beberapa cluster di region yang berbeda satu per satu pada interval yang ditentukan.

Selain upgrade otomatis, terkadang Google mungkin perlu melakukan tugas pemeliharaan lainnya. Dalam kasus tersebut, jika memungkinkan, cluster akan mematuhi masa pemeliharaan.

Jika tugas berjalan melebihi masa pemeliharaan, Distributed Cloud akan mencoba menjeda tugas tersebut. Kemudian, GKE akan mencoba melanjutkan tugas tersebut selama masa pemeliharaan berikutnya.

Distributed Cloud berhak meluncurkan upgrade darurat yang tidak direncanakan di luar masa pemeliharaan. Selain itu, upgrade wajib dari software yang tidak digunakan lagi atau yang sudah usang dapat otomatis terjadi di luar masa pemeliharaan.

Anda juga dapat mengupgrade cluster secara manual kapan saja. Upgrade yang dilakukan secara manual akan segera dimulai dan mengabaikan masa pemeliharaan apa pun.

Guna mempelajari cara menyiapkan masa pemeliharaan untuk cluster baru atau yang sudah ada, lihat Mengonfigurasi masa pemeliharaan.

Pembatasan

Periode pemeliharaan memiliki batasan berikut:

  • Satu masa pemeliharaan per cluster. Anda hanya dapat mengonfigurasi satu periode pemeliharaan per cluster. Mengonfigurasi masa pemeliharaan baru akan menimpa masa pemeliharaan sebelumnya.

  • Zona waktu untuk masa pemeliharaan. Saat mengonfigurasi dan melihat masa pemeliharaan, waktu ditampilkan secara berbeda bergantung pada alat yang Anda gunakan, seperti yang dijelaskan di bagian berikut.

Saat mengonfigurasi masa pemeliharaan

Saat menggunakan flag --maintenance-window yang lebih umum untuk mengonfigurasi periode pemeliharaan, Anda tidak dapat menentukan zona waktu. Saat Anda menggunakan Google Cloud CLI atau API, UTC digunakan untuk menampilkan waktu. KonsolGoogle Cloud menggunakan zona waktu lokal untuk menampilkan waktu.

Saat menggunakan flag yang lebih terperinci, seperti --maintenance-window-start, Anda dapat menentukan zona waktu sebagai bagian dari nilai. Jika Anda tidak mencantumkan zona waktu, zona waktu lokal Anda akan digunakan. Waktu selalu disimpan dalam UTC.

Saat melihat masa pemeliharaan

Saat Anda melihat informasi tentang cluster, stempel waktu untuk periode pemeliharaan dapat ditampilkan dalam UTC atau zona waktu setempat, bergantung pada cara Anda melihat informasi tersebut:

  • Saat Anda menggunakan Google Cloud konsol untuk melihat informasi tentang cluster Anda, waktu selalu ditampilkan dalam zona waktu lokal Anda.
  • Saat Anda menggunakan gcloud CLI untuk melihat informasi tentang cluster Anda, waktu selalu ditampilkan dalam UTC.

Dalam kedua kasus tersebut, RRULE selalu ditampilkan dalam UTC. Artinya, jika Anda menentukan, misalnya, hari, maka hari tersebut akan ditampilkan dalam UTC.

Mengonfigurasi masa pemeliharaan cluster

Distributed Cloud memungkinkan Anda menentukan masa pemeliharaan untuk setiap cluster Distributed Cloud. Jendela ini memberi tahu Google untuk hanya mengupdate software Distributed Cloud selama waktu dan pada frekuensi yang Anda tentukan.

Aturan berikut mengatur periode pemeliharaan cluster Distributed Cloud:

  • Jika Anda menentukan masa pemeliharaan untuk cluster Distributed Cloud, Google akan mengupdate software Distributed Cloud Anda 48 jam setelah update diumumkan melalui catatan rilis Distributed Cloud. Di halaman catatan rilis, Anda dapat berlangganan feed RSS catatan rilis Distributed Cloud agar terus mendapatkan informasi tentang update software saat dirilis.
  • Panjang minimum masa pemeliharaan adalah enam jam. Anda dapat menentukan jangka waktu yang lebih lama berdasarkan kompleksitas penginstalan Distributed Cloud dan persyaratan bisnis Anda.
  • Frekuensi minimum update software adalah seminggu sekali. Anda dapat menentukan masa pemeliharaan mingguan atau harian. Anda dapat menyertakan dan mengecualikan hari tertentu.
  • Anda dapat mengubah jadwal masa pemeliharaan untuk cluster kapan saja, kecuali jika masa pemeliharaan telah dijadwalkan atau sedang berlangsung.
  • Jika update software tidak selesai dalam jangka waktu yang ditentukan, update akan dijeda, lalu dilanjutkan selama periode pemeliharaan terjadwal berikutnya.

Untuk mengetahui petunjuk mendetail, lihat Mengonfigurasi masa pemeliharaan untuk cluster.

Reparasi hardware yang gagal

Jika Google mendeteksi kegagalan hardware Distributed Cloud, Google akan mencoba menjadwalkan kunjungan ke lokasi dalam waktu tiga hari kerja. Agar teknisi resmi Google dapat melakukan diagnosis dan perbaikan yang diperlukan, Anda harus memberi mereka akses ke hardware Distributed Cloud.

Jika terjadi kegagalan hardware Distributed Cloud, salah satu skenario berikut berlaku, bergantung pada apakah hardware Distributed Cloud Anda menggunakan penyimpanan Disk Self-Encrypting (SED):

  • Distributed Cloud Racks menyimpan data di drive non-SED. Saat Google melakukan reparasi di tempat, semua disk drive akan dikeluarkan dari mesin Distributed Cloud yang terpengaruh sebelum servis dimulai dan akan diserahkan kepada Anda selama reparasi berlangsung.

  • Distributed Cloud Servers menyimpan data di drive SED. Jika mesin gagal, Google akan mengganti seluruh mesin. Sebelum mesin dikeluarkan dari lokasi Anda, Google memastikan bahwa data Anda telah dihapus dengan aman dari semua drive-nya.

Titik kegagalan lainnya

Anda bertanggung jawab untuk memelihara aspek berikut dari penginstalan Distributed Cloud yang berada di luar kontrol Google dan dapat memengaruhi ketersediaan Distributed Cloud:

  • Semua data yang Anda pilih untuk disimpan di hardware Distributed Cloud. Hal ini mencakup pencadangan redundan yang berfungsi dan ekspor data Anda sebelum mengembalikan hardware Distributed Cloud ke Google.
  • Catu daya listrik.
  • Suhu sekitar, kelembapan, dan pendinginan.
  • Keamanan hardware fisik.
  • Keamanan jaringan lokal.
  • Konektivitas internet dan jaringan lokal:
    • Untuk cluster bidang kontrol cloud, Distributed Cloud memerlukan koneksi yang konstan ke Google Cloud dan tidak dapat berfungsi tanpa koneksi tersebut.
    • Untuk cluster bidang kontrol lokal, Distributed Cloud harus terhubung kembali setiap 7 hari untuk memperbarui token keamanan, kunci enkripsi, dan menyinkronkan data logging dan pengelolaan. Google Cloud

Langkah berikutnya