找出資源配置不足和過多的工作負載

本文說明如何使用洞察和建議,找出在 Google Kubernetes Engine (GKE) 叢集上執行的資源配置不足和過度配置工作負載。確認建議的擴大或縮減規模措施可提升工作負載效益後,即可進行建議的變更,以節省費用或提高工作負載的可靠性。如果可以,建議會包含預估每月可省下的費用或成本。詳情請參閱「瞭解費用或節省金額預估值」。

GKE 會提供在 Autopilot 和 Standard 叢集上執行的工作負載相關洞察資訊。GKE 也會提供類似的叢集建議。詳情請參閱「找出資源配置不足和過多的 GKE 叢集」。

GKE 會監控叢集,並透過 Active Assist 提供最佳化使用量的指引。這項服務會提供建議,產生在 Google Cloud上使用資源的深入分析和建議。如要進一步瞭解如何管理洞察資料和建議,請參閱「透過洞察資料和建議,最佳化 GKE 用量」。

取得資源不足和資源過度配置工作負載的洞察資料和建議

觀察到下一節討論的特定行為後,GKE 會在 Google Cloud 控制台的下列位置顯示這些深入分析和建議:

「工作負載」頁面會顯示下列建議標題:

  • 資源過度佈建的工作負載:「調降資源要求,以便減少費用」
  • 資源不足的工作負載:「提高資源要求,增加可靠性」

您也可以透過 Google Cloud CLI 或 Recommender API 取得所有類型的深入分析和建議。如要找出這類問題,請按照操作說明查看洞察資料和建議,並使用 WORKLOAD_UNDERPROVISIONEDWORKLOAD_OVERPROVISIONED 子類型進行篩選。

找出資源配置不足或過度的工作負載後,請參閱工作負載適當調整大小時的注意事項

GKE 如何識別資源不足和資源過度佈建的工作負載

下表說明 GKE 用於識別資源不足和資源過度供應的工作負載 (可向上或向下擴充) 的信號,以及每個信號的門檻。此外,這份表格也會顯示我們建議您在此情況下採取的行動。

子類型 信號 觀察期間 詳細資料 建議
WORKLOAD_UNDERPROVISIONED CPU 或記憶體使用率偏高 最近 15 天 如果工作負載的 CPU 或記憶體使用率在過去 15 天內,有至少 10% 的時間超過 150%,即為佈建不足。 擴充工作負載,提高可靠性
WORKLOAD_OVERPROVISIONED CPU 或記憶體用量偏低 最近 15 天 如果工作負載在過去 15 天內,至少有 90% 的時間 CPU 或記憶體使用率低於 50%,即為超額佈建。 縮減工作負載,節省費用

GKE 也會根據下列指南,判斷何時提供洞察資料和建議:

  • GKE 不會為水平 Pod 自動調度 (HPA) 的目標指標產生建議,因為使用這項指標可能會造成干擾。
  • 如果啟用垂直 Pod 自動調度資源 (VPA),系統會自動管理要求值,GKE 就不需要產生建議。
  • GKE 最多可能需要等待三天,才會為新工作負載產生建議。

瞭解預估費用或節省金額

如果可以,GKE 的建議會提供估算值,預測工作負載適當調整大小後,每月費用或節省的金額。這項預估值是根據工作負載費用計算而得,計算方式為加權平均要求值,再加上過去 30 天的工作負載 CPU 和記憶體費用。

預估費用或省下費用的預測依據是先前的支出,不保證等於未來的費用或省下的金額。

如要查看這些預估值,請確認下列事項:

如要進一步瞭解所有 GKE 叢集的費用,包括依命名空間和工作負載劃分的更精細明細,請參閱「取得 GKE 資源分配和叢集費用的重要支出洞察」。

如要進一步瞭解執行 GKE 叢集的費用,請參閱 GKE 定價

調整工作負載大小時的注意事項

按照建議調升或調降工作負載之前,請先考量下列事項:

  • 查看工作負載的資源用量,瞭解工作負載的執行情況,以及 CPU 和記憶體用量是否超出或低於預期。如需操作說明,請參閱「分析資源要求」。
  • 批次處理工作負載可能會為了提高成本效益,而刻意維持高用量。如果分配的資源足以應付批次工作,您就不需要擴充資源使用率偏高的工作負載 (系統已判定資源不足)。
  • GKE 對於以 Java 虛擬機器 (JVM) 為基礎的工作負載,實際記憶體用量的瀏覽權限有限。針對這類工作負載套用建議前,請務必仔細檢查。

根據建議調整工作負載規模

您可以透過下列任一方式調整工作負載大小,以便更符合工作負載的資源用量:

  • 為工作負載啟用垂直 Pod 自動調度資源功能。詳情請參閱「自動設定 Pod 資源要求」。
  • 根據建議手動變更要求和限制:

    • 資源不足的工作負載:如要實作最佳化建議,為資源不足的工作負載進行最適規模調整,請提高工作負載的資源要求和限制。實作這項建議有助於確保工作負載的可靠性,因為應用程式可獲得適當的資源量。
    • 資源過度佈建的工作負載:如要實作最適規模調整建議,請減少工作負載的資源要求和限制。依照自身的工作負載需求,調整叢集 CPU 和記憶體配置。實作這項最佳化建議後,您就能確保只使用執行工作負載所需的資源。

後續步驟