GKE 提供豐富的生態系統功能和產品,可協助您大規模部署、執行及管理容器化應用程式。不過,這也代表說明文件數量龐大。GKE 系列的每份說明文件都包含指南、教學課程、參考資料、版本說明、範例等。這份快速指南將協助您瞭解如何操作。
如果您是 GKE 新手,建議先參閱「開始瞭解 GKE」一文。
縱觀全局
GKE 說明文件分為多個說明文件集,反映了更廣泛的 GKE 生態系統和功能系列結構。大多數使用者不需要閱讀核心 GKE 說明文件以外的內容。平台管理員和營運人員可能需要更廣泛地探索說明文件。
- 核心 GKE 說明文件 (本說明文件集):介紹 GKE,並涵蓋所有 GKE 使用者都能使用的核心功能。
- GKE 網路說明文件,適合網路管理員或任何需要深入瞭解 GKE 和 Kubernetes 網路的人員。
- GKE 安全性文件:適合想設定安全性功能及維護平台安全性的安全防護從業人員。
- GKE 中的 AI/機器學習工作負載說明文件,適合想訓練、提供及管理 AI/機器學習模型的資料科學家、機器學習工程師和應用程式開發人員。
- 機群管理說明文件:當您想將 GKE 叢集群組集中管理為機群時,可參考這份文件。
- Config Sync 說明文件:適合將設定檔集中存放在單一可靠資料來源 (例如 Git 存放區) 的情況。
- Policy Controller 說明文件:如果您想對 Kubernetes 叢集套用並強制執行可設定的政策,請參閱這份文件。
- Config Controller 說明文件:適用於想使用 Kubernetes 宣告式模型建立及管理 Google Cloud 資源的情況。
- GKE outside Google Cloud 說明文件集,適用於想在地端或其他公有雲使用 GKE 的使用者。
如要進一步瞭解這些說明文件集,請參閱下列各節。
核心 GKE 說明文件
從這裡開始。這組說明文件涵蓋所有 GKE 使用者都能使用的核心概念和功能,內容適用於 IT 管理員和開發人員。內容涵蓋下列主題:
- 瞭解基本概念:為新使用者介紹 Kubernetes 和 GKE 的基本概念。如果您是 Kubernetes 或 GKE 的新手,本節將協助您瞭解基本概念。Google Cloud
- 開始使用:準備好建立第一個叢集了嗎?請詳閱以下重要須知。
- 設定 GKE 叢集:建立及設定 Autopilot 和 Standard 叢集的詳細操作說明。
- 降低及最佳化成本:瞭解如何在 GKE 中使用成本最佳化功能,以及使用這些功能的原因。
- 佈建儲存空間: 瞭解 GKE 支援的儲存空間選項,以及如何使用這些選項。
- 設定叢集安全性: GKE 提供多種保護工作負載的方法。本節將介紹 GKE 安全功能和使用方式。
- 部署工作負載:瞭解如何在 GKE 上部署不同類型的工作負載,從簡單的無狀態應用程式到資料庫、快取和資料串流工作負載。
- 管理及最佳化叢集:瞭解如何管理叢集,包括升級、通知和建議,以及 Standard 叢集的節點集區管理。
- GKE 觀測功能:使用 Managed Prometheus、Cloud Monitoring 和 Cloud Logging 觀察叢集和工作負載。
- 疑難排解:查看所有核心功能的疑難排解指南和已知問題。
這組說明文件也包含 Kubernetes Engine (GKE) API 的參考資料。
GKE 網路
網路管理員 (或任何需要深入瞭解 GKE 和 Kubernetes 網路的人) 可以參閱 GKE 網路說明文件,瞭解如何設定及使用叢集的網路和流量管理功能。主題涵蓋從規劃 Google Cloud 上的網路基礎架構,到設定負載平衡器、將工作負載公開為服務,以及設定叢集隔離。這組說明文件包含下列 GKE 主題 (以及更多內容),並提供虛擬私有雲和 Compute Engine 網路說明文件中實用部分的連結。 Google Cloud
- 網路總覽:概略瞭解網路功能,包括 GKE 如何管理叢集內外的網路。
- GKE 網路最佳做法:遵循最佳做法和明確的指引,規劃及設計網路。
- 網路隔離: 瞭解如何控管叢集控制層和節點的網路存取權。
- GKE 中的服務: 將叢集上執行的應用程式公開為服務,包括設定負載平衡器和使用多叢集服務。
- 透過網路政策提升網路安全。
- 可觀測性: 取得網路流量的指標和洞察資料。
GKE 安全性
安全性文件提供 GKE 叢集和 Kubernetes 工作負載中各種安全控管機制的相關資訊。安全防護文件說明如何執行工作,例如從工作負載向 API 進行驗證、控管叢集和 Kubernetes 資源的存取權,以及監控一段時間內的安全防護機制。 Google Cloud
如要探索 GKE 安全性說明文件,請參閱 GKE 安全性總覽。
GKE 中的 AI/機器學習工作負載
AI/ML 工作負載說明文件提供在 GKE 上訓練、提供及管理 AI/ML 模型的相關資訊。主題包括:提供模型以進行推論、大規模訓練模型、部署 AI 代理程式、使用 Ray 處理分散式 AI/機器學習應用程式、管理 AI 基礎架構和加速器 (如 GPU 和 TPU)、管理 AI/機器學習工作負載的資料和儲存空間,以及監控工作負載。
如要查看 GKE 上的 AI/機器學習工作負載說明文件,請參閱「GKE 上的 AI/機器學習工作負載簡介」。
GKE 機群管理
如果您是平台或叢集管理員,需要處理多個 GKE 叢集 (可能跨多個 Google Cloud專案),GKE 會使用機群的概念,簡化多個叢集的管理作業,無論這些叢集位於哪個專案,以及執行哪些工作負載。機群管理文件包含下列資訊:
- 規劃機群: 瞭解機群的運作方式,並取得實用指南,將貴機構的叢集分組到機群中,以及啟用機群功能。
- 建立機群:瞭解如何將叢集新增至機群。
- 使用機群功能:瞭解如何為叢集和工作負載採用、設定及管理支援機群的功能。
- 機群團隊管理:簡化多個叢集中多個團隊的 GKE 資源佈建和管理作業。
- 監控機群: 概略查看整個機群,並查看機群範圍內的記錄和指標。
這組說明文件也包含 GKE Hub (Fleet) API 的參考資料。
Config Sync
Config Sync 提供一致的方式來管理 GKE 叢集設定, 並從單一可靠來源自動套用設定。這組文件包含下列主題:
- 開始使用 Config Sync。
- 瞭解 GitOps 最佳做法。
- 使用預設設定安裝 Config Sync。
- 排解常見問題。
Policy Controller
Policy Controller 可讓您在 GKE 叢集上套用並強制執行一致的政策。這組文件包含下列主題:
Config Controller
設定控制器 會使用 Kubernetes 宣告式模型建立及管理 Google Cloud 資源。Config Controller 是 Config Connector 的代管版本,可簡化安裝和維護作業。這組文件包含下列主題:
Google Cloud外部的 GKE
許多使用 Google Cloud 的機構也想或需要自行在資料中心、工廠、零售商店,甚至是其他公有雲中執行工作負載,但他們不想在所有這些位置自行建構新的容器平台,也不想根據工作負載的執行位置,重新思考如何設定、保護、監控及最佳化容器工作負載。GKE Multi-Cloud 和 Google Distributed Cloud 都會擴充 GKE,供您在外部使用Google Cloud,讓您建立及管理混合式或完全在本機的部署作業。
GKE Multi-cloud
- GKE on AWS:使用在 AWS 基礎架構上執行的 GKE 叢集。
- GKE on Azure:使用在 Azure 基礎架構上執行的 GKE 叢集。
- GKE 附加叢集: 將符合 CNCF 標準的 Kubernetes 叢集新增至機群,即可與 GKE 叢集一併查看及管理,並提供 EKS、AKS 和其他符合標準叢集類型的操作說明。
Google Distributed Cloud (地端)
- 適用於 VMware 的 Google Distributed Cloud (僅限軟體):在 VMware vSphere 環境中執行 GKE 叢集。
- 裸機適用的 Google Distributed Cloud (僅限軟體):直接在自有硬體上執行 GKE 叢集。
- Google Distributed Cloud 連結網路方案部署作業:在 Google 提供及維護的專用硬體上,於內部部署環境執行 GKE 叢集。