Halaman ini menjelaskan praktik terbaik untuk memastikan ketersediaan tinggi bagi instalasi Google Distributed Cloud terhubung Anda. Distributed Cloud terhubung tidak menawarkan perjanjian tingkat layanan (SLA) dan hanya memberikan sasaran tingkat layanan (SLO) yang dijelaskan di halaman ini.
Memilih dan menerapkan tingkat ketersediaan
Anda harus memilih tingkat ketersediaan untuk workload Distributed Cloud terhubung yang paling sesuai dengan persyaratan bisnis Anda. Misalnya, aplikasi pembayaran mandiri di toko retail memiliki risiko ketersediaan yang jauh lebih rendah daripada deployment RAN edge operator jaringan seluler.
Target ketersediaan berbanding lurus dengan kapasitas resource cadangan Distributed Cloud yang Anda cadangkan untuk keadaan darurat. Tabel berikut menjelaskan hubungan ini. Perkiraan ini tidak mencakup waktu non-operasional yang dijadwalkan dengan masa pemeliharaan.
Software Distributed Cloud terhubung menggunakan beberapa resource di setiap mesin fisik. Jumlahnya bervariasi bergantung pada konfigurasi spesifik deployment Distributed Cloud terhubung Anda. Google merekomendasikan agar Anda melakukan benchmark deployment Distributed Cloud terhubung untuk mengukur jumlah ini dan memperhitungkannya saat merencanakan distribusi workload Anda.
| Faktor bentuk GDC terhubung | Kapasitas yang digunakan | Kapasitas yang dicadangkan | Target ketersediaan |
|---|---|---|---|
| Rak GDC terhubung (cluster 6 mesin tunggal) |
83,33% | 16,67% | 99,9% |
| Rak GDC terhubung (cluster 6 mesin tunggal) |
100% | 0% | 93,5% |
| Server GDC terhubung (cluster 3 mesin tunggal) |
66,6% | 33,3% | 99,9% |
Anda mungkin mengalami kehilangan kapasitas secara tiba-tiba karena kegagalan hardware atau node yang memerlukan memulai ulang. Untuk mempersiapkan hal ini, Anda harus membuat arsitektur workload dengan mempertimbangkan kuota resource sehingga Anda selalu memiliki kapasitas yang tersedia di setiap node Distributed Cloud terhubung yang memenuhi tingkat ketersediaan yang Anda pilih.
Misalnya, untuk mencapai target ketersediaan 99,9% pada deployment rak Distributed Cloud terhubung, Anda harus mengonfigurasi workload sehingga salah satu dari enam mesin fisik di setiap cluster Distributed Cloud terhubung tersedia sebagai cadangan.
Mendiversifikasi zona Distributed Cloud secara geografis
Untuk meminimalkan dampak potensi kesalahan bidang pengelolaan, sebaiknya distribusikan zona Distributed Cloud Anda di beberapa region tetangga.
Menggunakan mode ketahanan
Cluster Distributed Cloud menggunakan bidang kontrol lokal yang berjalan di hardware Distributed Cloud terhubung Anda. Workload Anda akan terus berjalan saat koneksi ke Google Cloud terputus. Untuk mengetahui informasi selengkapnya, lihat Mode ketahanan Distributed Cloud terhubung.
Memahami update software dan masa pemeliharaan
Google secara rutin mengupdate software Distributed Cloud terhubung. Update software ini wajib dan Anda tidak dapat menonaktifkannya. Distributed Cloud terhubung memungkinkan Anda menentukan masa pemeliharaan individual untuk setiap cluster Distributed Cloud terhubung.
Untuk mengurangi potensi gangguan sementara pada workload Anda, masa pemeliharaan memungkinkan Anda mengontrol kapan upgrade otomatis bidang kontrol dan node dapat terjadi. Masa pemeliharaan berguna untuk jenis skenario berikut, antara lain:
- Di luar jam sibuk: Anda ingin meminimalkan peluang periode nonaktif dengan menjadwalkan upgrade otomatis di luar jam sibuk saat traffic sedang turun.
- Jam kerja: Anda ingin memastikan bahwa upgrade terjadi selama jam kerja agar ada orang yang dapat memantau upgrade dan mengelola masalah yang tidak terduga.
- Upgrade multi-cluster: Anda ingin meluncurkan upgrade di beberapa cluster di berbagai region satu per satu pada interval yang ditentukan.
Distributed Cloud terhubung mendukung jenis masa pemeliharaan berikut:
- Masa pemeliharaan. Menentukan jangka waktu saat Google dapat melakukan pemeliharaan dan upgrade software pada cluster Distributed Cloud terhubung Anda.
- Periode pengecualian pemeliharaan. Menentukan jangka waktu saat Google tidak dapat melakukan pemeliharaan atau upgrade software pada cluster Distributed Cloud terhubung Anda. Untuk mengonfigurasi periode pengecualian pemeliharaan, Anda harus mengonfigurasi masa pemeliharaan terlebih dahulu. Periode pengecualian pemeliharaan lebih diutamakan daripada masa pemeliharaan cluster.
Selain upgrade otomatis, terkadang Google mungkin perlu melakukan tugas pemeliharaan lainnya. Dalam kasus tersebut, Google akan mematuhi masa pemeliharaan cluster jika memungkinkan.
Jika tugas berjalan melebihi masa pemeliharaan, Distributed Cloud terhubung akan mencoba menjeda tugas. Kemudian, Distributed Cloud terhubung akan mencoba melanjutkan tugas tersebut selama masa pemeliharaan berikutnya.
Distributed Cloud terhubung berhak meluncurkan upgrade darurat yang tidak direncanakan di luar masa pemeliharaan. Selain itu, upgrade wajib dari software yang tidak digunakan lagi atau yang sudah usang dapat otomatis terjadi di luar masa pemeliharaan.
Anda juga dapat mengupgrade cluster secara manual kapan saja. Upgrade yang dilakukan secara manual akan segera dimulai dan mengabaikan masa pemeliharaan apa pun.
Guna mempelajari cara menyiapkan masa pemeliharaan untuk cluster baru atau yang sudah ada, lihat Mengonfigurasi masa pemeliharaan.
Pengaturan update software secara bertahap
Untuk mengurangi waktu non-operasional workload, update software Distributed Cloud terhubung dilakukan secara bertahap. Dengan kata lain, Google mengupgrade node pekerja di setiap cluster Distributed Cloud terhubung secara bertahap. Semua node pekerja dalam tahap upgrade software akan nonaktif secara bersamaan.
Jumlah node dalam tahap upgrade software ditentukan sebagai berikut:
- Deployment hingga 3 rak: Setiap tahap adalah jumlah total mesin di semua rak dibagi 6 dan dibulatkan ke atas ke bilangan bulat berikutnya.
- Deployment 4 rak atau lebih: Setiap tahap adalah jumlah total mesin di semua rak dalam deployment dibagi dengan jumlah rak dalam deployment.
Anda juga memiliki opsi untuk menetapkan ukuran tahap upgrade software Anda sendiri. Dengan kata lain, Anda dapat menentukan jumlah node yang dapat nonaktif untuk upgrade software secara bersamaan dalam cluster Distributed Cloud terhubung. Untuk mengetahui petunjuknya, lihat Mengelola waktu non-operasional node selama upgrade software.
Pembatasan
Masa pemeliharaan memiliki batasan berikut:
Satu masa pemeliharaan per cluster. Anda hanya dapat mengonfigurasi satu masa pemeliharaan per cluster. Mengonfigurasi masa pemeliharaan baru akan menimpa masa pemeliharaan sebelumnya.
Zona waktu untuk masa pemeliharaan. Saat mengonfigurasi dan melihat masa pemeliharaan, waktu ditampilkan secara berbeda bergantung pada alat yang Anda gunakan, seperti yang dijelaskan di bagian berikut.
Saat mengonfigurasi masa pemeliharaan
Saat menggunakan flag --maintenance-window yang lebih umum untuk mengonfigurasi masa pemeliharaan, Anda tidak dapat menentukan zona waktu. Saat Anda menggunakan Google Cloud CLI atau API, UTC digunakan untuk menampilkan waktu. Konsol menggunakan zona waktu lokal untuk menampilkan waktu.Google Cloud
Saat menggunakan flag yang lebih terperinci, seperti --maintenance-window-start, Anda dapat menentukan zona waktu sebagai bagian dari nilai. Jika Anda menghapus zona waktu, zona waktu lokal Anda akan digunakan. Waktu selalu disimpan dalam UTC.
Saat melihat masa pemeliharaan
Saat Anda melihat informasi tentang cluster, stempel waktu untuk masa pemeliharaan dapat ditampilkan dalam UTC atau dalam zona waktu lokal Anda, bergantung pada cara Anda melihat informasi:
- Saat Anda menggunakan Google Cloud konsol untuk melihat informasi tentang cluster Anda, waktu selalu ditampilkan dalam zona waktu lokal Anda.
- Saat Anda menggunakan gcloud CLI untuk melihat informasi tentang cluster Anda, waktu selalu ditampilkan dalam UTC.
Dalam kedua kasus tersebut, RRULE selalu ditampilkan dalam UTC. Artinya, jika Anda menentukan, misalnya, hari, maka hari tersebut akan ditampilkan dalam UTC.
Mengonfigurasi masa pemeliharaan cluster
Distributed Cloud terhubung memungkinkan Anda menentukan masa pemeliharaan untuk setiap cluster Distributed Cloud terhubung. Periode ini memberi tahu Google untuk hanya mengupdate software Distributed Cloud selama waktu dan pada frekuensi yang Anda tentukan.
Aturan berikut mengatur masa pemeliharaan cluster Distributed Cloud terhubung:
- Jika Anda menentukan masa pemeliharaan untuk cluster Distributed Cloud terhubung, Google akan mengupdate software Distributed Cloud terhubung Anda 48 jam setelah update diumumkan melalui catatan rilis Distributed Cloud terhubung. Di halaman catatan rilis, Anda dapat berlangganan feed RSS catatan rilis Distributed Cloud terhubung untuk terus mendapatkan informasi tentang update software saat dirilis.
- Durasi minimum masa pemeliharaan adalah lima jam. Anda dapat menentukan periode yang lebih lama berdasarkan kompleksitas instalasi Distributed Cloud terhubung dan persyaratan bisnis Anda.
- Frekuensi minimum update software adalah seminggu sekali. Anda dapat menentukan masa pemeliharaan mingguan atau harian. Anda dapat menyertakan dan mengecualikan hari tertentu.
- Anda dapat mengubah jadwal masa pemeliharaan untuk cluster kapan saja, kecuali jika masa pemeliharaan telah dijadwalkan atau saat masa pemeliharaan sedang berlangsung.
- Jika update software tidak selesai dalam jangka waktu yang ditentukan, update akan dijeda, lalu dilanjutkan selama masa pemeliharaan terjadwal berikutnya.
Untuk mengetahui petunjuk mendetail, lihat Mengonfigurasi masa pemeliharaan untuk cluster.
Perbaikan hardware yang gagal
Saat Google mendeteksi kegagalan hardware Distributed Cloud terhubung, kami akan melakukan salah satu hal berikut:
Untuk hardware Distributed Cloud milik Google, Google akan mencoba menjadwalkan kunjungan ke lokasi dalam waktu tiga hari kerja. Agar teknisi yang diizinkan Google dapat melakukan diagnosis dan perbaikan yang diperlukan, Anda harus memberikan akses ke hardware Distributed Cloud terhubung.
Untuk hardware Distributed Cloud milik pelanggan, Google akan memberi tahu Anda dan SI bersertifikasi Google tentang masalah tersebut. Anda harus bekerja sama dengan SI yang mengirimkan hardware Distributed Cloud terhubung Anda untuk menjadwalkan kunjungan teknisi dan melakukan diagnosis serta perbaikan yang diperlukan.
Jika terjadi kegagalan hardware Distributed Cloud terhubung, salah satu skenario berikut akan berlaku, bergantung pada apakah hardware Distributed Cloud terhubung Anda menggunakan penyimpanan Disk yang Melakukan Enkripsi Sendiri (SED):
Rak Distributed Cloud terhubung menyimpan data di drive non-SED. Saat Google atau SI bersertifikasi Google melakukan perbaikan di lokasi, semua drive disk akan dihapus dari mesin Distributed Cloud terhubung yang terpengaruh sebelum layanan dimulai dan ditempatkan dalam penyimpanan Anda selama perbaikan.
Server Distributed Cloud terhubung menyimpan data di drive SED. Jika mesin gagal, Google atau SI bersertifikasi Google akan mengganti seluruh mesin. Sebelum mesin dihapus dari lokasi Anda, Google akan memastikan bahwa data Anda telah dihapus dengan aman dari semua drive-nya.
Poin kegagalan lainnya
Anda bertanggung jawab untuk mempertahankan aspek berikut dari instalasi Distributed Cloud Anda yang berada di luar kontrol Google dan dapat memengaruhi ketersediaan Distributed Cloud terhubung:
- Semua data yang Anda pilih untuk disimpan di hardware Distributed Cloud terhubung. Hal ini mencakup cadangan redundan yang berfungsi dan ekspor data Anda sebelum mengembalikan hardware Distributed Cloud terhubung ke Google.
- Catu daya listrik.
- Suhu sekitar, kelembapan, dan pendinginan.
- Keamanan hardware fisik.
- Keamanan jaringan lokal.
- Konektivitas internet dan jaringan lokal. Distributed Cloud terhubung harus terhubung kembali ke Google Cloud setiap 7 hari untuk memperbarui token keamanan, kunci enkripsi, dan menyinkronkan data logging dan pengelolaan.