本文彙整了在 Google Kubernetes Engine (GKE) 設計、建構及運作應用程式的最佳做法。按照這些建議操作,有助於提升成本效益、效能、安全性及可靠性。每個項目都會連結至特定主題的詳細說明文件。
選取 GKE 類別:
或者,搜尋最佳做法:
| 類別 | 最佳做法 | 摘要 |
|---|---|---|
| AI 和機器學習工作負載 | 提升 AI/機器學習工作負載效率 | 在 GKE 上,以最高效率運用資源執行 AI/機器學習工作。 |
| AI 和機器學習工作負載 | 推論工作負載 | 在 GKE 上執行機器學習推論工作負載。 |
| AI 和機器學習工作負載 | 自動調度資源 使用 GPU 進行 LLM 推論 | 在 GKE 上使用 GPU 自動調整大型語言模型 (LLM) 推論作業的資源配置。 |
| AI 和機器學習工作負載 | 使用 TPU 自動調整 LLM 推論規模 | 在 GKE 上使用 TPU,自動調整大型語言模型 (LLM) 推論工作的資源配置。 |
| AI 和機器學習工作負載 | 使用 GPU 最佳化 LLM 推論 | 在 GKE 上使用 GPU 最佳化 LLM 推論。 |
| AI 和機器學習工作負載 | 批次處理平台 | 在 GKE 上建構及運作批次處理平台。 |
| 成本最佳化 | 以經濟實惠的方式執行 Kubernetes 應用程式 | 降低 GKE 上 Kubernetes 應用程式的營運成本。 |
| 資料庫 | 資料庫選項 | 為 GKE 應用程式選擇及管理資料庫解決方案。 |
| 網路 | 網路 | 設定及管理 GKE 的網路連線。 |
| 作業 | 升級叢集 | 瞭解如何順利且可靠地升級 GKE 叢集。 |
| 作業 | GKE 的持續整合/持續推送軟體更新 | 為 GKE 應用程式導入持續整合和持續推送軟體更新管道。 |
| 可靠性和擴充性 | 擴充性 | 瞭解在 GKE 上調度應用程式資源的原則和技術。 |
| 可靠性和擴充性 | 規劃擴充性 | 瞭解如何設計可擴充的 GKE 環境。 |
| 可靠性和擴充性 | 規劃大型 GKE 叢集 | 瞭解如何架構及管理大規模 GKE 叢集。 |
| 可靠性和擴充性 | 執行 HPC 工作負載的最佳做法 | 在 GKE 上執行高效能運算 (HPC) 工作負載的最佳做法。 |
| 可靠性和擴充性 | 規劃大型工作負載 | 部署及管理耗用大量資源的應用程式。 |
| 安全性 | 強化 GKE 叢集 | 提升 GKE 叢集的安全防護機制。 |
| 安全性 | 規劃 RBAC 政策 | 定義角色型存取權控管,管理權限。 |
| 安全性 | 企業多用戶群架構 | 在單一 GKE 叢集上安全地執行多個租戶。 |