可用性最佳做法

本頁說明確保 Google Distributed Cloud Connected 安裝作業高可用性的最佳做法。Distributed Cloud Connected 不提供服務水準協議 (SLA),僅提供本頁所述的服務等級目標 (SLO)。

選擇並實作可用性層級

您必須為 Distributed Cloud connected 工作負載選擇最符合業務需求的可用性等級。舉例來說,零售商店的自助結帳應用程式可用性風險,遠低於行動網路電信業者邊緣 RAN 部署作業。

目標可用性與您為緊急情況預留的 Distributed Cloud 備用資源容量成正比。下表說明這項關係。這些預估值不包含透過維護期間排定的停機時間。

Distributed Cloud connected 軟體會耗用每部實體機器的部分資源。具體金額取決於 Distributed Cloud connected 部署作業的特定設定。Google 建議您對 Distributed Cloud connected 部署作業進行基準測試,以評估這項金額,並在規劃工作負載分配時將其納入考量。

GDC connected 板型規格 使用中的容量 預留容量 目標適用情形
GDC connected 機架
(單一 6 部機器的叢集)
83.33% 16.67% 99.9%
GDC connected 機架
(單一 6 部機器的叢集)
100% 0% 93.5%
GDC connected 伺服器
(單一 3 部電腦叢集)
66.6% 33.3% 99.9%

硬體故障或需要重新啟動的節點可能會導致容量突然減少。為此,您必須在設計工作負載時考量資源配額,確保每個 Distributed Cloud 連線節點一律有足夠的可用容量,符合您選擇的可用性等級。

舉例來說,如要在 Distributed Cloud 連線機架部署作業中達到 99.9% 的目標可用性,您必須設定工作負載,讓每個 Distributed Cloud 連線叢集中的六部實體機器,其中一部可做為備份。

使用存活模式

您可以透過 Distributed Cloud 建立叢集,使用在 Distributed Cloud 連線硬體上執行的本機控制層。這類叢集可在與 Google Cloud 的連線中斷時,讓工作負載繼續執行。詳情請參閱「Distributed Cloud connected 存續模式」。

瞭解軟體更新和維護期間

Google 會定期更新 Distributed Cloud connected 軟體。 這些軟體更新為必要更新,您無法拒絕。 使用 Distributed Cloud connected,您可以為每個 Distributed Cloud connected 叢集指定個別維護時段。

如要降低工作負載短暫中斷服務的可能性,您可以透過維護期間控管控制層和節點的自動升級時間。維護期間適用於下列類型的情境:

  • 離峰時段:安排在流量較小的離峰時段自動升級,盡可能降低停機機率。
  • 值班待命:一定要在工作時間內進行升級,以利相關人員監控升級作業並管理突發狀況。
  • 多叢集升級:按照指定的間隔,逐一升級分佈在不同地區的多個叢集。

除了自動升級,Google 有時也需要執行其他維護工作。在這種情況下,如果可以,系統會遵守叢集的維護時段。

如果執行工作的時間超出維護期間,Distributed Cloud Connected 會嘗試暫停工作。並在下一個維護期間嘗試繼續執行這些工作。

Distributed Cloud Connected 保留在維護期間之外,導入非預定、緊急升級的權利。此外,系統可能會在維護期間之外自動強制升級已淘汰或過舊的軟體。

您也可以隨時手動升級叢集。手動升級會立即開始,並忽略所有的維護期間。

如要瞭解如何為新的或現有叢集設定維護期間,請參閱「設定維護期間」。

限制

維護期間有下列限制:

  • 每個叢集只能有一個維護期間。每個叢集只能設定一個維護時段。設定新的維護期間會覆寫先前的設定。

  • 維護期間的時區。設定及查看維護時段時,時間的顯示方式會因使用的工具而異,詳情請參閱下列章節。

設定維護期間時

使用較通用的 --maintenance-window 旗標設定維護時段時,無法指定時區。使用 Google Cloud CLI 或 API 時,系統會以世界標準時間顯示時間。Google Cloud 控制台會使用當地時區顯示時間。

使用更精細的旗標 (例如 --maintenance-window-start) 時,您可以將時區指定為值的一部分。如果省略時區,系統會使用你當地的時區。時間一律以世界標準時間儲存。

查看維護期間時

查看叢集相關資訊時,維護時段的時間戳記會以世界標準時間或當地時區顯示,視您查看資訊的方式而定:

  • 使用 Google Cloud 控制台查看叢集相關資訊時,時間一律會以您所在時區為準。
  • 使用 gcloud CLI 查看叢集相關資訊時,時間一律會以 UTC 顯示。

無論是哪種情況,RRULE一律以世界標準時間為準。也就是說,如果指定星期幾,則這些日期會以世界標準時間為準。

設定叢集維護期間

透過 Distributed Cloud connected,您可以為每個 Distributed Cloud connected 叢集指定維護時段。這個時間範圍會告知 Google,只能在您指定的時間和頻率更新 Distributed Cloud 軟體。

下列規則適用於 Distributed Cloud 連線叢集的維護時段:

  • 如果您為 Distributed Cloud 連線叢集指定維護期,Google 會在透過 Distributed Cloud 連線版本資訊公告更新後 48 小時,更新 Distributed Cloud 連線軟體。在版本資訊頁面,您可以訂閱 Distributed Cloud Connected 版本資訊 RSS 動態消息,隨時掌握軟體更新資訊。
  • 維護期間最短為六小時。您可以根據 Distributed Cloud 連線安裝的複雜程度和業務需求,指定較長的時間範圍。
  • 軟體更新頻率至少為每週一次。您可以指定每週或每日維護期間。您可以納入和排除特定日期。
  • 您可以隨時變更叢集的維護期間排程,但如果已排定維護期間或維護期間正在進行中,則無法變更。
  • 如果軟體更新作業未在指定時間內完成,系統會暫停更新,並在下一個排定的維護期間繼續更新。

如需詳細的操作說明,請參閱「為叢集設定維護時段」。

維修故障硬體

Google 偵測到 Distributed Cloud 連線硬體故障時,會嘗試在三個工作天內安排現場服務。如要請 Google 授權技術人員進行必要的診斷和維修,您必須授予他們 Distributed Cloud connected 硬體存取權。

如果 Distributed Cloud connected 硬體發生故障,視 Distributed Cloud connected 硬體是否使用自加密磁碟 (SED) 儲存空間,適用下列其中一種情況:

  • Distributed Cloud 連結網路機架會將資料儲存在非 SED 磁碟機。如果 Google 執行現場維修,維修人員會在開始維修前,從受影響的 Distributed Cloud 連線裝置中移除所有硬碟,並在維修期間交由您保管。

  • Distributed Cloud 連線伺服器會將資料儲存在 SED 磁碟機中。 如果機器故障,Google 會更換整部機器。在從您的場所移除裝置前,Google 會確保所有硬碟中的資料都已安全清除。

其他故障點

您必須負責維護 Distributed Cloud 安裝作業的下列層面,這些層面不在 Google 的控管範圍內,但可能會影響 Distributed Cloud 連線的可用性:

  • 您選擇儲存在 Distributed Cloud connected 硬體上的所有資料。包括在將 Distributed Cloud 連線硬體退還給 Google 前,備妥可用的備援備份,並匯出資料。
  • 電力供應
  • 環境溫度、濕度和冷卻
  • 實體硬體安全
  • 區域網路安全
  • 區域網路和網際網路連線:
    • 對於雲端控制層叢集,Distributed Cloud connected 需要持續連線至 Google Cloud ,否則無法運作。
    • 如果是本機控制層叢集,Distributed Cloud Connected 必須每 7 天重新連線一次 Google Cloud ,才能重新整理安全權杖、加密金鑰,並同步處理記錄和管理資料。

後續步驟