找出資源配置不足和過多的工作負載

本文說明如何使用洞察和建議,找出在 Google Kubernetes Engine (GKE) 叢集上執行的資源配置不足和過度配置工作負載。確認建議的擴大或縮減規模措施可提升工作負載效益後,您就可以進行建議的變更,以節省成本或提高工作負載的可靠性。如果可以,建議會包含預估每月可節省的費用或成本。詳情請參閱「瞭解費用或節省金額預估值」。

GKE 會提供在 Autopilot 和 Standard 叢集上執行的工作負載相關洞察資訊。GKE 也會提供類似的叢集建議。詳情請參閱「找出資源配置不足和過多的 GKE 叢集」。

GKE 會監控叢集,並透過 Active Assist 提供最佳化使用量的指引。這項服務會提供建議,產生在 Google Cloud上使用資源的深入分析和建議。如要進一步瞭解如何管理洞察資料和建議,請參閱「透過洞察資料和建議,最佳化 GKE 用量」。

取得資源配置不足和過度配置的工作負載洞察資料和建議

您可以透過 Google Cloud CLI 或 Recommender API 取得這些洞察和建議。按照相關操作說明查看洞察資料和最佳化建議,並使用 WORKLOAD_UNDERPROVISIONEDWORKLOAD_OVERPROVISIONED 子類型進行篩選。

找出資源配置不足或過度的工作負載後,請參閱工作負載適當調整大小時的注意事項

GKE 如何識別資源配置不足和過度配置的工作負載

下表說明 GKE 用於識別資源不足和資源過度供應的工作負載 (可向上或向下擴充) 的信號,以及每個信號的門檻。此外,這個表格也會顯示我們建議您在此情境中採取的行動。

子類型 信號 觀察期間 詳細資料 建議
WORKLOAD_UNDERPROVISIONED CPU 或記憶體用量偏高 最近 15 天 如果工作負載的 CPU 或記憶體使用率在過去 15 天內,至少有 10% 的時間超過 150%,就表示佈建不足。 擴充工作負載,提高可靠性
WORKLOAD_OVERPROVISIONED CPU 或記憶體用量偏低 最近 15 天 如果工作負載在過去 15 天內,至少有 90% 的時間 CPU 或記憶體使用率低於 50%,即為超額佈建。 縮減工作負載,節省費用

GKE 也會根據下列指南,判斷何時提供洞察資料和建議:

  • GKE 不會為水平自動調度 Pod 資源 (HPA) 的目標指標產生建議,因為使用這項指標可能會造成干擾。
  • 如果啟用垂直自動調度 Pod 資源 (VPA),系統會自動管理要求值,GKE 就不需要產生建議。
  • GKE 最多可能要等待三天,才會為新的工作負載產生建議。

瞭解預估費用或節省金額

如果可以,GKE 的建議會提供估算值,預測工作負載適當調整大小後,每月可節省的費用或支出。這項預估值是根據工作負載費用計算而得,計算方式為加權平均要求值,再加上過去 30 天的工作負載 CPU 和記憶體費用。

預估費用或省下費用的預測依據是先前的支出,不保證等於未來的費用或省下的金額。

如要查看這些預估值,請確認下列事項:

  • 您具備必要的「billing.accounts.getSpendingInformation」權限,可取得支出資訊。詳情請參閱「Cloud Billing 存取權」。
  • 叢集已啟用 GKE 費用分配功能。詳情請參閱「啟用 GKE 費用分配」。

如要進一步瞭解所有 GKE 叢集的費用,包括依命名空間和工作負載劃分的更精細明細,請參閱「取得 GKE 資源分配和叢集費用的重要支出深入分析」。

如要進一步瞭解執行 GKE 叢集的費用,請參閱 GKE 定價

調整工作負載大小時的注意事項

在按照建議調升或調降工作負載規模之前,請先考量下列事項:

  • 查看工作負載的資源用量,瞭解工作負載的效能,以及 CPU 和記憶體用量是否超出或低於預期。如需操作說明,請參閱「分析資源要求」。
  • 批次處理工作負載可能會為了提高成本效益,刻意維持高用量。如果分配的資源足以應付批次工作,您就不需要擴充資源不足的高用量工作負載。
  • GKE 對於以 Java 虛擬機器 (JVM) 為基礎的工作負載,實際記憶體用量的瀏覽權限有限。針對這類工作負載套用建議前,請務必仔細檢查。

實作建議,調整工作負載大小

您可以透過下列任一方式調整工作負載大小,以便更符合工作負載的資源用量:

  • 為工作負載啟用垂直 Pod 自動調度資源功能。詳情請參閱「自動設定 Pod 資源要求」。
  • 根據建議手動變更要求和限制:

    • 資源不足的工作負載:如要實作最佳化建議,為資源不足的工作負載進行最適規模調整,請提高工作負載的資源要求和限制。實作這項建議有助於確保工作負載的可靠性,因為應用程式可獲得適當的資源量。
    • 資源過度佈建的工作負載:如要實作建議,針對資源過度佈建的工作負載進行最適規模調整,請減少工作負載的資源要求和限制。依照自身的工作負載需求,調整叢集 CPU 和記憶體配置。實作這項最佳化建議後,您就能確保只使用執行工作負載所需的資源。

後續步驟