Halaman ini menjelaskan praktik terbaik untuk memastikan ketersediaan tinggi bagi penginstalan yang terhubung ke Google Distributed Cloud Anda. Distributed Cloud Connected tidak menawarkan perjanjian tingkat layanan (SLA) dan hanya menyediakan tujuan tingkat layanan (SLO) yang dijelaskan di halaman ini.
Memilih dan menerapkan tingkat ketersediaan
Anda harus memilih tingkat ketersediaan untuk beban kerja yang terhubung ke Distributed Cloud yang paling sesuai dengan persyaratan bisnis Anda. Misalnya, aplikasi pembayaran mandiri di toko retail memiliki risiko ketersediaan yang jauh lebih rendah daripada deployment RAN edge operator jaringan seluler.
Ketersediaan target berbanding lurus dengan kapasitas resource cadangan Distributed Cloud yang Anda pesan untuk keadaan darurat. Tabel berikut menjelaskan hubungan ini. Estimasi ini tidak mencakup waktu non-operasional yang dijadwalkan dengan masa pemeliharaan.
Software Distributed Cloud terhubung menggunakan beberapa resource di setiap mesin fisik. Jumlahnya bervariasi bergantung pada konfigurasi spesifik deployment Distributed Cloud yang terhubung. Google merekomendasikan agar Anda melakukan benchmark pada deployment Distributed Cloud terhubung untuk mengukur jumlah ini dan memperhitungkannya saat merencanakan distribusi workload Anda.
| Faktor bentuk yang terhubung dengan GDC | Kapasitas yang digunakan | Kapasitas yang dicadangkan | Ketersediaan target |
|---|---|---|---|
| Rak GDC terhubung (cluster 6 mesin tunggal) |
83,33% | 16,67% | 99,9% |
| Rak GDC terhubung (cluster 6 mesin tunggal) |
100% | 0% | 93,5% |
| Server yang terhubung ke GDC (cluster 3 komputer tunggal) |
66,6% | 33,3% | 99,9% |
Anda mungkin mengalami penurunan kapasitas secara tiba-tiba karena kegagalan hardware atau node yang memerlukan mulai ulang. Untuk mempersiapkannya, Anda harus merancang workload dengan mempertimbangkan kuota resource sehingga Anda selalu memiliki kapasitas yang tersedia di setiap node yang terhubung ke Distributed Cloud yang memenuhi tingkat ketersediaan yang Anda pilih.
Misalnya, untuk mencapai target ketersediaan 99,9% pada deployment rak yang terhubung ke Distributed Cloud, Anda harus mengonfigurasi beban kerja sehingga salah satu dari enam mesin fisik di setiap cluster yang terhubung ke Distributed Cloud tersedia sebagai cadangan.
Mendiversifikasi zona Distributed Cloud secara geografis
Untuk meminimalkan dampak potensi kesalahan bidang pengelolaan, sebaiknya distribusikan zona Distributed Cloud Anda di beberapa region tetangga.
Menggunakan mode ketahanan
Cluster Distributed Cloud menggunakan bidang kontrol lokal yang berjalan di hardware Distributed Cloud terhubung Anda. Workload Anda akan terus berjalan saat koneksi ke Google Cloud terputus. Untuk mengetahui informasi selengkapnya, lihat Mode survivabilitas terhubung Distributed Cloud.
Memahami update software dan masa pemeliharaan
Google secara rutin mengupdate software Distributed Cloud terhubung. Update software ini bersifat wajib dan Anda tidak dapat memilih untuk tidak menggunakannya. Distributed Cloud terhubung memungkinkan Anda menentukan periode pemeliharaan individual untuk setiap cluster Distributed Cloud terhubung.
Untuk memitigasi potensi gangguan sementara pada workload, masa pemeliharaan memungkinkan Anda mengontrol kapan upgrade otomatis bidang kontrol dan node dapat terjadi. Periode pemeliharaan berguna untuk jenis skenario berikut, antara lain:
- Di luar jam sibuk: Anda ingin meminimalkan peluang periode nonaktif dengan menjadwalkan upgrade otomatis di luar jam sibuk saat traffic sedang turun.
- Jam kerja: Anda ingin memastikan bahwa upgrade terjadi selama jam kerja agar ada orang yang dapat memantau upgrade dan mengelola masalah yang tidak terduga.
- Upgrade multi-cluster: Anda ingin meluncurkan upgrade di beberapa cluster di region yang berbeda satu per satu pada interval yang ditentukan.
Distributed Cloud Connected mendukung jenis jendela pemeliharaan berikut:
- Masa pemeliharaan. Menentukan periode waktu saat Google dapat melakukan pemeliharaan dan upgrade software pada cluster yang terhubung ke Distributed Cloud Anda.
- Jangka waktu pengecualian pemeliharaan. Menentukan periode waktu saat Google tidak dapat melakukan pemeliharaan atau upgrade software pada cluster Distributed Cloud yang terhubung. Untuk mengonfigurasi periode pengecualian pemeliharaan, Anda harus mengonfigurasi periode pemeliharaan terlebih dahulu. Periode pengecualian pemeliharaan lebih diprioritaskan daripada periode pemeliharaan cluster.
Selain upgrade otomatis, terkadang Google mungkin perlu melakukan tugas pemeliharaan lainnya. Dalam kasus tersebut, jika memungkinkan, cluster akan mematuhi masa pemeliharaan.
Jika upgrade software atau tugas pemeliharaan tidak selesai sebelum akhir masa pemeliharaan, Distributed Cloud yang terhubung akan menjeda upgrade atau tugas dan melanjutkannya selama masa pemeliharaan terjadwal berikutnya. Jika upgrade software gagal, Distributed Cloud yang terhubung akan menghentikan upgrade. Dalam kasus tersebut, Anda harus menghubungi Dukungan Google untuk memperbaiki penginstalan software Anda.
Distributed Cloud connected berhak meluncurkan upgrade darurat yang tidak direncanakan di luar masa pemeliharaan. Selain itu, upgrade wajib dari software yang tidak digunakan lagi atau yang sudah usang dapat otomatis terjadi di luar masa pemeliharaan.
Anda juga dapat mengupgrade cluster secara manual kapan saja. Upgrade yang dilakukan secara manual akan segera dimulai dan mengabaikan masa pemeliharaan apa pun.
Guna mempelajari cara menyiapkan masa pemeliharaan untuk cluster baru atau yang sudah ada, lihat Mengonfigurasi masa pemeliharaan.
Penyebaran update software
Untuk mengurangi periode nonaktif workload, update software Distributed Cloud terhubung dilakukan secara bertahap. Dengan kata lain, Google mengupgrade node pekerja di setiap cluster yang terhubung Distributed Cloud secara bertahap. Semua node pekerja dalam tahap upgrade software akan nonaktif secara bersamaan.
Jumlah node dalam tahap upgrade software ditentukan sebagai berikut:
- Deployment hingga 3 rak: Setiap tahap adalah jumlah total mesin di semua rak dibagi 6 dan dibulatkan ke bilangan bulat berikutnya.
- Deployment 4 rak atau lebih: Setiap tahap adalah total jumlah mesin di semua rak dalam deployment dibagi dengan jumlah rak dalam deployment.
Anda juga memiliki opsi untuk menetapkan ukuran tahap upgrade software Anda sendiri. Dengan kata lain, Anda dapat menentukan jumlah node yang dapat nonaktif untuk upgrade software secara bersamaan di cluster yang terhubung ke Distributed Cloud. Untuk mengetahui petunjuknya, lihat Mengelola periode nonaktif node selama upgrade software.
Pembatasan
Periode pemeliharaan memiliki batasan berikut:
Satu masa pemeliharaan per cluster. Anda hanya dapat mengonfigurasi satu periode pemeliharaan per cluster. Mengonfigurasi masa pemeliharaan baru akan menimpa masa pemeliharaan sebelumnya.
Zona waktu untuk masa pemeliharaan. Saat mengonfigurasi dan melihat masa pemeliharaan, waktu ditampilkan secara berbeda bergantung pada alat yang Anda gunakan, seperti yang dijelaskan di bagian berikut.
Saat mengonfigurasi masa pemeliharaan
Saat menggunakan flag --maintenance-window yang lebih umum untuk mengonfigurasi
periode pemeliharaan, Anda tidak dapat menentukan zona waktu. Saat Anda menggunakan
Google Cloud CLI atau API, UTC digunakan untuk menampilkan waktu. KonsolGoogle Cloud menggunakan zona waktu lokal untuk menampilkan waktu.
Saat menggunakan flag yang lebih terperinci, seperti --maintenance-window-start, Anda
dapat menentukan zona waktu sebagai bagian dari nilai. Jika Anda tidak mencantumkan zona waktu, zona waktu lokal Anda akan digunakan. Waktu selalu disimpan dalam UTC.
Saat melihat masa pemeliharaan
Saat Anda melihat informasi tentang cluster, stempel waktu untuk periode pemeliharaan dapat ditampilkan dalam UTC atau zona waktu setempat, bergantung pada cara Anda melihat informasi tersebut:
- Saat Anda menggunakan Google Cloud konsol untuk melihat informasi tentang cluster Anda, waktu selalu ditampilkan dalam zona waktu lokal Anda.
- Saat Anda menggunakan gcloud CLI untuk melihat informasi tentang cluster Anda, waktu selalu ditampilkan dalam UTC.
Dalam kedua kasus tersebut, RRULE selalu ditampilkan dalam UTC. Artinya, jika Anda menentukan, misalnya, hari, maka hari tersebut akan ditampilkan dalam UTC.
Mengonfigurasi masa pemeliharaan cluster
Distributed Cloud connected memungkinkan Anda menentukan periode pemeliharaan untuk setiap cluster Distributed Cloud connected. Jendela ini memberi tahu Google untuk hanya mengupdate software Distributed Cloud selama waktu dan pada frekuensi yang Anda tentukan.
Aturan berikut mengatur periode pemeliharaan cluster yang terhubung ke Distributed Cloud:
- Jika Anda menentukan periode pemeliharaan untuk cluster Distributed Cloud terhubung, Google akan memperbarui software Distributed Cloud terhubung Anda 48 jam setelah update diumumkan melalui catatan rilis Distributed Cloud terhubung. Di halaman catatan rilis, Anda dapat berlangganan feed RSS catatan rilis yang terhubung dengan Distributed Cloud untuk terus mendapatkan informasi tentang update software saat dirilis.
- Panjang minimum masa pemeliharaan adalah lima jam. Anda dapat menentukan jangka waktu yang lebih lama berdasarkan kompleksitas penginstalan yang terhubung ke Distributed Cloud dan persyaratan bisnis Anda.
- Frekuensi minimum update software adalah seminggu sekali. Anda dapat menentukan masa pemeliharaan mingguan atau harian. Anda dapat menyertakan dan mengecualikan hari tertentu.
- Anda dapat mengubah jadwal masa pemeliharaan untuk cluster kapan saja, kecuali jika masa pemeliharaan telah dijadwalkan atau sedang berlangsung.
- Jika update software tidak selesai dalam jangka waktu yang ditentukan, update akan dijeda, lalu dilanjutkan selama periode pemeliharaan terjadwal berikutnya.
Untuk mengetahui petunjuk mendetail, lihat Mengonfigurasi masa pemeliharaan untuk cluster.
Reparasi hardware yang gagal
Saat Google mendeteksi kegagalan hardware yang terhubung ke Distributed Cloud, kami akan melakukan salah satu hal berikut:
Untuk hardware Distributed Cloud milik Google, Google akan mencoba menjadwalkan kunjungan ke lokasi dalam waktu tiga hari kerja. Agar teknisi resmi Google dapat melakukan diagnosis dan perbaikan yang diperlukan, Anda harus memberi mereka akses ke hardware yang terhubung ke Distributed Cloud.
Untuk hardware Distributed Cloud milik pelanggan, Google akan memberi tahu Anda dan SI bersertifikasi Google tentang masalah tersebut. Anda harus bekerja sama dengan SI yang mengirimkan hardware Distributed Cloud terhubung Anda untuk menjadwalkan kunjungan teknisi dan melakukan diagnosis serta perbaikan yang diperlukan.
Jika terjadi kegagalan hardware yang terhubung ke Distributed Cloud, salah satu skenario berikut akan berlaku, bergantung pada apakah hardware yang terhubung ke Distributed Cloud Anda menggunakan penyimpanan Disk Enkripsi Mandiri (SED):
Rak yang terhubung ke Distributed Cloud menyimpan data di drive non-SED. Saat Google atau SI bersertifikasi Google melakukan reparasi di tempat, semua disk drive akan dikeluarkan dari mesin Distributed Cloud terhubung yang terpengaruh sebelum servis dimulai dan ditempatkan dalam pengawasan Anda selama reparasi berlangsung.
Server yang terhubung ke Distributed Cloud menyimpan data di drive SED. Jika mesin gagal, Google atau SI bersertifikasi Google akan mengganti seluruh mesin. Sebelum mesin tersebut dikeluarkan dari lokasi Anda, Google memastikan bahwa data Anda telah dihapus secara aman dari semua drive-nya.
Titik kegagalan lainnya
Anda bertanggung jawab untuk memelihara aspek berikut dari penginstalan Distributed Cloud yang berada di luar kontrol Google dan dapat memengaruhi ketersediaan Distributed Cloud yang terhubung:
- Semua data yang Anda pilih untuk disimpan di hardware yang terhubung ke Distributed Cloud. Hal ini mencakup cadangan redundan yang berfungsi dan ekspor data Anda sebelum mengembalikan hardware yang terhubung ke Distributed Cloud Anda ke Google.
- Catu daya listrik.
- Suhu sekitar, kelembapan, dan pendinginan.
- Keamanan hardware fisik.
- Keamanan jaringan lokal.
- Konektivitas internet dan jaringan lokal. Distributed Cloud yang terhubung harus terhubung kembali setiap 7 hari untuk memperbarui token keamanan, kunci enkripsi, dan menyinkronkan data logging dan pengelolaan. Google Cloud