创建 Google Distributed Cloud (GDC) 空气隔离 Kubernetes 集群时,您指定的节点数和节点类型将用于创建集群的第一个节点池。随着现有集群的计算需求发生变化,您可以执行以下节点池任务:
添加新节点池:随着集群工作负载需求的增加,添加新的节点池。
查看节点池:查看现有节点池的特征和状态。
调整节点池的大小:手动扩缩节点池,以适应工作负载流量波动。
删除节点池:如果集群工作负载的需求减少,或者您想删除不再适合容器操作的机器类型,请移除节点池。
如需详细了解集群中的节点池,请参阅节点简介。
本文档适用于应用运维人员群组中的应用开发者,以及平台管理员群组中的 IT 管理员,他们负责管理组织内的 Kubernetes 集群。如需了解详情,请参阅 GDC 气隙环境文档的受众群体。
准备工作
如需完成本文档中的任务,您必须拥有以下资源和角色:
如需查看和管理共享 Kubernetes 集群中的节点池,请让组织 IAM 管理员为您授予以下角色:
- User Cluster Admin (
user-cluster-admin) - 用户集群节点查看器 (
user-cluster-node-viewer)
这些角色未绑定到命名空间。
- User Cluster Admin (
如需查看和管理标准 Kubernetes 集群中的节点池,请让组织 IAM 管理员为您授予 Standard Cluster Admin (
standard-cluster-admin) 角色。此角色与您的项目命名空间绑定。如需针对 Kubernetes 集群运行命令,请确保您拥有以下资源:
找到 Kubernetes 集群名称,或向平台管理员群组的成员询问集群名称。
登录并生成 Kubernetes 集群的 kubeconfig 文件(如果您还没有)。
使用 Kubernetes 集群的 kubeconfig 路径替换这些说明中的
KUBERNETES_CLUSTER_KUBECONFIG。
添加节点池
如需将节点池添加到现有 Kubernetes 集群,请完成以下步骤:
控制台
- 在导航菜单中,依次选择 Kubernetes Engine > 集群。
- 在集群列表中点击相应集群。系统会显示集群详情页面。
- 依次选择节点池 > 添加节点池。
- 为节点池分配名称。创建节点池后,您无法修改其名称。
- 指定要在节点池中创建的工作器节点数。
- 选择最符合您的工作负载要求的机器类。机器类显示在以下设置中:
- 机器类型
- vCPU
- 内存
- 点击保存。
API
使用
kubectlCLI 通过交互式编辑器打开Cluster自定义资源规范:kubectl edit clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \ -n KUBERNETES_CLUSTER_NAMESPACE \ --kubeconfig MANAGEMENT_API_SERVER替换以下内容:
KUBERNETES_CLUSTER_NAME:集群的名称。KUBERNETES_CLUSTER_NAMESPACE:集群的命名空间。对于共享集群,请使用platform命名空间。对于标准集群,请使用集群的项目命名空间。MANAGEMENT_API_SERVER:托管 Kubernetes 集群的区域 API 服务器的 kubeconfig 路径。如果您尚未为目标可用区中的 API 服务器生成 kubeconfig 文件,请参阅登录了解详情。
在
nodePools部分中添加新条目:nodePools: ... - machineTypeName: MACHINE_TYPE name: NODE_POOL_NAME nodeCount: NUMBER_OF_WORKER_NODES taints: TAINTS labels: LABELS acceleratorOptions: gpuPartitionScheme: GPU_PARTITION_SCHEME替换以下内容:
MACHINE_TYPE:节点池的工作器节点的机器类型。查看可用机器类型,了解可配置的资源。NODE_POOL_NAME:节点池的名称。NUMBER_OF_WORKER_NODES:要在节点池中预配的工作器节点数。TAINTS:要应用于此节点池的节点的污点。这是一个可选字段。LABELS:要应用于此节点池的节点的标签。它包含一个键值对列表。此字段为选填字段。GPU_PARTITION_SCHEME:GPU 分区方案(如果您要运行 GPU 工作负载)。例如mixed-2。如果未设置此字段,则 GPU 不会进行分区。如需了解可用的多实例 GPU (MIG) 配置文件,请参阅支持的 MIG 配置文件。
保存文件并退出编辑器。
查看节点池
如需查看 Kubernetes 集群中的现有节点池,请完成以下步骤:
控制台
- 在导航菜单中,依次选择 Kubernetes Engine > 集群。
- 在集群列表中点击相应集群。系统会显示集群详情页面。
- 选择节点池。
系统会显示集群中运行的节点池列表。您可以在此页面中管理集群的节点池。
API
查看特定 Kubernetes 集群的节点池:
kubectl get clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \ -n KUBERNETES_CLUSTER_NAMESPACE \ -o json --kubeconfig MANAGEMENT_API_SERVER | \ jq .status.workerNodePoolStatuses替换以下内容:
KUBERNETES_CLUSTER_NAME:集群的名称。KUBERNETES_CLUSTER_NAMESPACE:集群的命名空间。对于共享集群,请使用platform命名空间。对于标准集群,请使用集群的项目命名空间。
输出类似于以下内容:
[ { "conditions": [ { "lastTransitionTime": "2023-08-31T22:16:17Z", "message": "", "observedGeneration": 2, "reason": "NodepoolReady", "status": "True", "type": "Ready" }, { "lastTransitionTime": "2023-08-31T22:16:17Z", "message": "", "observedGeneration": 2, "reason": "ReconciliationCompleted", "status": "False", "type": "Reconciling" } ], "name": "worker-node-pool", "readyNodes": 3, "readyTimestamp": "2023-08-31T18:59:46Z", "reconcilingNodes": 0, "stalledNodes": 0, "unknownNodes": 0 } ]
调整节点池的大小
您可以通过扩大或缩小节点池来手动调整 Kubernetes 集群中的节点池大小。在缩减节点池时,您无法选择要移除的特定节点。
如需扩缩现有集群中的节点池,请完成以下步骤:
控制台
- 在信息中心内,选择要修改的集群所在的项目。
- 在导航菜单中,依次选择 Kubernetes Engine > 集群。
- 选择节点池关联的集群名称。系统会显示集群详情页面。
- 点击节点池标签页。
- 选择要调整大小的节点池对应的edit 修改图标。系统会显示修改节点池提示。
更新节点数字段,以反映节点池中所需的新节点数量。您可以根据工作负载要求增加或减少节点数量。
点击保存。
返回到集群的节点池标签页,确认调整大小后的节点池处于
Ready状态,并且节点数量正确。节点池可能需要几分钟时间才能扩缩到您指定的规模。
API
使用交互式编辑器通过 kubectl CLI 打开
Cluster自定义资源规范:kubectl edit clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \ -n KUBERNETES_CLUSTER_NAMESPACE \ --kubeconfig MANAGEMENT_API_SERVER替换以下内容:
KUBERNETES_CLUSTER_NAME:托管节点池的集群的名称。KUBERNETES_CLUSTER_NAMESPACE:集群的命名空间。对于共享集群,请使用platform命名空间。对于标准集群,请使用集群的项目命名空间。MANAGEMENT_API_SERVER:托管 Kubernetes 集群的区域 API 服务器的 kubeconfig 路径。如果您尚未为目标可用区中的 API 服务器生成 kubeconfig 文件,请参阅可用区级管理 API 服务器资源。
更新要调整大小的节点池的
nodeCount字段:nodePools: # Several lines of code are omitted here. - machineTypeName: n2-standard-2-gdc name: nodepool-1 nodeCount: NUMBER_OF_WORKER_NODES将
NUMBER_OF_WORKER_NODES替换为要在节点池中预配的更新后的工作器节点数量。保存文件并退出编辑器。
通过检查节点池的配置来验证节点伸缩是否已完成:
kubectl get clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \ -n KUBERNETES_CLUSTER_NAMESPACE -o json \ --kubeconfig MANAGEMENT_API_SERVER | jq .status.workerNodePoolStatuses确认
readyNodes数量反映了您为节点池设置的节点数量。节点池可能需要几分钟时间才能扩缩到您指定的规模。
删除节点池
如果删除节点池,则节点及指向节点的路由也将随之删除。这些节点会逐出并重新调度其上运行的任何 pod。如果 Pod 具有特定的节点选择器,且集群中的其他节点均不符合条件,则这些 Pod 可能仍处于无法调度的状态。
在删除节点池之前,请确保您至少有 3 个工作器节点,以确保集群有足够的计算空间来有效运行。
如需删除节点池,请完成以下步骤:
控制台
在导航菜单中,依次选择 Kubernetes Engine > 集群。
点击托管要删除的节点池的集群。
选择节点池。
点击要删除的节点池旁边的 delete 删除。
API
使用交互式编辑器通过 kubectl CLI 打开
Cluster自定义资源规范:kubectl edit clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \ -n KUBERNETES_CLUSTER_NAMESPACE \ --kubeconfig MANAGEMENT_API_SERVER替换以下内容:
KUBERNETES_CLUSTER_NAME:集群的名称。KUBERNETES_CLUSTER_NAMESPACE:集群的命名空间。对于共享集群,请使用platform命名空间。对于标准集群,请使用集群的项目命名空间。MANAGEMENT_API_SERVER:托管 Kubernetes 集群的区域 API 服务器的 kubeconfig 路径。如果您尚未为目标可用区中的 API 服务器生成 kubeconfig 文件,请参阅可用区级管理 API 服务器资源。
从
nodePools部分中移除节点池条目。例如,在以下代码段中,您必须移除machineTypeName、name和nodeCount字段:nodePools: # Several lines of code are omitted here. - machineTypeName: n2-standard-2-gdc name: nodepool-1 nodeCount: 3请务必移除要删除的节点池的所有字段。
保存文件并退出编辑器。