GKE 最佳做法

本文彙整了在 Google Kubernetes Engine (GKE) 設計、建構及運作應用程式的最佳做法。按照這些建議操作,有助於提升成本效益、效能、安全性及可靠性。每個項目都會連結至特定主題的詳細說明文件。

選取 GKE 類別:

或者,搜尋最佳做法:

類別 最佳做法 摘要
AI 和機器學習工作負載 提升 AI/機器學習工作負載效率 在 GKE 上,以最高效率運用資源執行 AI/機器學習工作。
AI 和機器學習工作負載 推論工作負載 在 GKE 上執行機器學習推論工作負載。
AI 和機器學習工作負載 自動調度資源 使用 GPU 進行 LLM 推論 在 GKE 上使用 GPU 自動調整大型語言模型 (LLM) 推論作業的資源配置。
AI 和機器學習工作負載 使用 TPU 自動調整 LLM 推論規模 在 GKE 上使用 TPU,自動調整大型語言模型 (LLM) 推論工作的資源配置。
AI 和機器學習工作負載 使用 GPU 最佳化 LLM 推論 在 GKE 上使用 GPU 最佳化 LLM 推論。
AI 和機器學習工作負載 批次處理平台 在 GKE 上建構及運作批次處理平台。
成本最佳化 以經濟實惠的方式執行 Kubernetes 應用程式 降低 GKE 上 Kubernetes 應用程式的營運成本。
資料庫 資料庫選項 為 GKE 應用程式選擇及管理資料庫解決方案。
網路 網路 設定及管理 GKE 的網路連線。
作業 升級叢集 瞭解如何順利且可靠地升級 GKE 叢集。
作業 GKE 的持續整合/持續推送軟體更新 為 GKE 應用程式導入持續整合和持續推送軟體更新管道。
可靠性和擴充性 擴充性 瞭解在 GKE 上調度應用程式資源的原則和技術。
可靠性和擴充性 規劃擴充性 瞭解如何設計可擴充的 GKE 環境。
可靠性和擴充性 規劃大型 GKE 叢集 瞭解如何架構及管理大規模 GKE 叢集。
可靠性和擴充性 執行 HPC 工作負載的最佳做法 在 GKE 上執行高效能運算 (HPC) 工作負載的最佳做法。
可靠性和擴充性 規劃大型工作負載 部署及管理耗用大量資源的應用程式。
安全性 強化 GKE 叢集 提升 GKE 叢集的安全防護機制。
安全性 規劃 RBAC 政策 定義角色型存取權控管,管理權限。
安全性 企業多用戶群架構 在單一 GKE 叢集上安全地執行多個租戶。