本頁說明確保 Google Distributed Cloud Connected 安裝作業高可用性的最佳做法。Distributed Cloud Connected 不提供服務水準協議 (SLA),僅提供本頁所述的服務等級目標 (SLO)。
選擇並實作可用性層級
您必須為 Distributed Cloud connected 工作負載選擇最符合業務需求的可用性等級。舉例來說,零售商店的自助結帳應用程式可用性風險,遠低於行動網路電信業者邊緣 RAN 部署作業。
目標可用性與您為緊急情況預留的 Distributed Cloud 備用資源容量成正比。下表說明這項關係。這些預估值不包含維護期間排定的停機時間。
Distributed Cloud connected 軟體會耗用每部實體機器的部分資源。具體金額取決於 Distributed Cloud connected 部署作業的特定設定。Google 建議您對 Distributed Cloud connected 部署作業進行基準測試,以評估這項金額,並在規劃工作負載分配時將其納入考量。
| GDC connected 板型規格 | 使用中的容量 | 預留容量 | 目標適用情形 |
|---|---|---|---|
| GDC connected 機架 (單一 6 部機器的叢集) |
83.33% | 16.67% | 99.9% |
| GDC connected 機架 (單一 6 部機器的叢集) |
100% | 0% | 93.5% |
| GDC connected 伺服器 (單一 3 部電腦叢集) |
66.6% | 33.3% | 99.9% |
硬體故障或需要重新啟動的節點可能會導致容量突然減少。為此,您必須在設計工作負載時考量資源配額,確保每個 Distributed Cloud 連線節點一律有足夠的可用容量,符合您選擇的可用性等級。
舉例來說,如要在 Distributed Cloud 連線機架部署作業中達到 99.9% 的目標可用性,您必須設定工作負載,讓每個 Distributed Cloud 連線叢集中的六部實體機器,其中一部可做為備份。
分散式雲端區域的地理位置多樣化
為盡量降低潛在管理平面故障的影響,強烈建議您在多個相鄰區域中分配 Distributed Cloud 區域。
使用存活模式
Distributed Cloud 叢集使用在本機 Distributed Cloud connected 硬體上執行的本機控制層。與 Google Cloud 的連線中斷時,工作負載仍會繼續執行。詳情請參閱「Distributed Cloud connected 存續模式」。
瞭解軟體更新和維護期間
Google 會定期更新 Distributed Cloud connected 軟體。 這些軟體更新為必要更新,您無法拒絕。 使用 Distributed Cloud connected,您可以為每個 Distributed Cloud connected 叢集指定個別維護時段。
如要降低工作負載短暫中斷服務的可能性,您可以透過維護期間控管控制層和節點的自動升級時間。維護期間適用於下列類型的情境:
- 離峰時段:安排在流量較小的離峰時段自動升級,盡可能降低停機機率。
- 值班待命:一定要在工作時間內進行升級,以利相關人員監控升級作業並管理突發狀況。
- 多叢集升級:按照指定的間隔,逐一升級分佈在不同地區的多個叢集。
Distributed Cloud Connected 支援下列類型的維護時段:
- 維護期間。指定時間範圍,讓 Google 可以在 Distributed Cloud 連線叢集上執行維護作業和軟體升級。
- 維護作業排除時段。指定時間範圍,Google 無法在這段期間對 Distributed Cloud 連結網路叢集執行維護作業或軟體升級。如要設定維護排除期間,請先設定維護期間。 維護作業排除時段的優先順序高於叢集的維護期間。
除了自動升級,Google 有時也需要執行其他維護工作。在這種情況下,如果可以,系統會遵守叢集的維護時段。
如果執行工作的時間超出維護期間,Distributed Cloud Connected 會嘗試暫停工作。並在下一個維護期間嘗試繼續執行這些工作。
Distributed Cloud Connected 保留在維護期間之外,導入非預定、緊急升級的權利。此外,系統可能會在維護期間之外自動強制升級已淘汰或過舊的軟體。
您也可以隨時手動升級叢集。手動升級會立即開始,並忽略所有的維護期間。
如要瞭解如何為新的或現有叢集設定維護期間,請參閱「設定維護期間」。
軟體更新錯開時間
為減少工作負載停機時間,Distributed Cloud connected 軟體更新會分階段進行。換句話說,Google 會分階段升級每個 Distributed Cloud 連線叢集中的工作站節點。軟體升級階段的所有工作站節點會同時停止運作。
軟體升級階段的節點數取決於下列因素:
- 最多 3 個機架的部署作業:每個階段的機器總數為所有機架的機器總數除以 6,並無條件進位至下一個整數。
- 部署 4 個以上的機架:每個階段都是部署中所有機架的機器總數,除以部署中的機架數。
您也可以選擇自行設定軟體升級階段大小。換句話說,您可以指定 Distributed Cloud 連結叢集中可同時進行軟體升級的節點數量。如需操作說明,請參閱「管理軟體升級期間的節點停機時間」。
限制
維護期間有下列限制:
每個叢集只能有一個維護期間。每個叢集只能設定一個維護時段。設定新的維護期間會覆寫先前的設定。
維護期間的時區。設定及查看維護時段時,時間的顯示方式會因使用的工具而異,詳情請參閱下列章節。
設定維護期間時
使用較通用的 --maintenance-window 旗標設定維護時段時,無法指定時區。使用 Google Cloud CLI 或 API 時,系統會以世界標準時間顯示時間。Google Cloud 控制台會使用當地時區顯示時間。
使用更精細的旗標 (例如 --maintenance-window-start) 時,您可以將時區指定為值的一部分。如果省略時區,系統會使用你當地的時區。時間一律以世界標準時間儲存。
查看維護期間時
查看叢集相關資訊時,維護時段的時間戳記會以世界標準時間或當地時區顯示,視您查看資訊的方式而定:
- 使用 Google Cloud 控制台查看叢集相關資訊時,時間一律會以您所在時區為準。
- 使用 gcloud CLI 查看叢集相關資訊時,時間一律會以 UTC 顯示。
無論是哪種情況,RRULE一律以世界標準時間為準。也就是說,如果指定星期幾,則這些日期會以世界標準時間為準。
設定叢集維護期間
使用 Distributed Cloud connected 時,您可以為每個 Distributed Cloud connected 叢集指定維護時段。這個時間範圍會告知 Google,只能在您指定的時間和頻率更新 Distributed Cloud 軟體。
下列規則適用於 Distributed Cloud 連線叢集的維護時段:
- 如果您為 Distributed Cloud 連線叢集指定維護時段,Google 會在透過 Distributed Cloud 連線版本資訊公告更新後 48 小時,更新 Distributed Cloud 連線軟體。在版本資訊頁面,您可以訂閱 Distributed Cloud Connected 版本資訊 RSS 動態消息,隨時掌握軟體更新資訊。
- 維護期間最短為五小時。您可以根據 Distributed Cloud 連線安裝的複雜程度和業務需求,指定較長的時間範圍。
- 軟體更新頻率至少為每週一次。您可以指定每週或每日維護期間。您可以納入和排除特定日期。
- 您可以隨時變更叢集的維護期間排程,但如果已排定維護期間或維護期間正在進行中,則無法變更。
- 如果軟體更新作業未在指定時間內完成,系統會暫停更新,並在下一個排定的維護期間繼續更新。
如需詳細的操作說明,請參閱「為叢集設定維護時段」。
維修故障硬體
當 Google 偵測到 Distributed Cloud 連結網路硬體故障時,我們會採取下列其中一項行動:
如果是 Google 擁有的 Distributed Cloud 硬體,Google 會盡量在三個工作天內安排現場訪視。如要請 Google 授權技術人員進行必要的診斷和維修,您必須授予他們 Distributed Cloud 連線硬體的存取權。
如果是客戶擁有的 Distributed Cloud 硬體,Google 會通知您和 Google 認證的系統整合商問題所在。您必須與提供 Distributed Cloud 連結硬體的系統整合商合作,安排技術人員到府,進行必要的診斷和維修。
如果 Distributed Cloud connected 硬體發生故障,視 Distributed Cloud connected 硬體是否使用自加密磁碟 (SED) 儲存空間,適用下列其中一種情況:
Distributed Cloud 連結網路機架會將資料儲存在非 SED 磁碟機。如果 Google 或 Google 認證的系統整合商執行現場維修,維修開始前,所有硬碟都會從受影響的 Distributed Cloud 連線裝置中移除,並在維修期間交由您保管。
Distributed Cloud 連線伺服器會將資料儲存在 SED 磁碟機中。 如果機器故障,Google 或 Google 認證的系統整合商會更換整部機器。在從您的場所移除機器前,Google 會確保所有硬碟中的資料都已安全清除。
其他故障點
您必須負責維護 Distributed Cloud 安裝作業的下列層面,這些層面不在 Google 的控管範圍內,但可能會影響 Distributed Cloud 連線的可用性:
- 您選擇儲存在 Distributed Cloud connected 硬體上的所有資料。包括在將 Distributed Cloud 連線硬體退還給 Google 前,備妥可用的備援備份,並匯出資料。
- 電力供應。
- 環境溫度、濕度和冷卻。
- 實體硬體安全。
- 區域網路安全。
- 區域網路和網際網路連線。Distributed Cloud Connected 必須每 7 天重新連線一次 Google Cloud ,才能重新整理安全權杖、加密金鑰,並同步處理記錄和管理資料。