管理节点池

创建 Google Distributed Cloud (GDC) 空气隔离 Kubernetes 集群时,您指定的节点数和节点类型将用于创建集群的第一个节点池。随着现有集群的计算需求发生变化,您可以执行以下节点池任务:

  • 添加新节点池:随着集群工作负载需求的增加,添加新的节点池。

  • 查看节点池:查看现有节点池的特征和状态。

  • 调整节点池的大小:手动扩缩节点池,以适应工作负载流量波动。

  • 删除节点池:如果集群工作负载的需求减少,或者您想删除不再适合容器操作的机器类型,请移除节点池。

如需详细了解集群中的节点池,请参阅节点简介

本文档适用于应用运维人员群组中的应用开发者,以及平台管理员群组中的 IT 管理员,他们负责管理组织内的 Kubernetes 集群。如需了解详情,请参阅 GDC 气隙环境文档的受众群体

准备工作

如需完成本文档中的任务,您必须拥有以下资源和角色:

  • 如需查看和管理共享 Kubernetes 集群中的节点池,请让组织 IAM 管理员为您授予以下角色:

    • User Cluster Admin (user-cluster-admin)
    • 用户集群节点查看器 (user-cluster-node-viewer)

    这些角色未绑定到命名空间。

  • 如需查看和管理标准 Kubernetes 集群中的节点池,请让组织 IAM 管理员为您授予 Standard Cluster Admin (standard-cluster-admin) 角色。此角色与您的项目命名空间绑定。

  • 如需针对 Kubernetes 集群运行命令,请确保您拥有以下资源:

    • 找到 Kubernetes 集群名称,或向平台管理员群组的成员询问集群名称。

    • 登录并生成 Kubernetes 集群的 kubeconfig 文件(如果您还没有)。

    • 使用 Kubernetes 集群的 kubeconfig 路径替换这些说明中的 KUBERNETES_CLUSTER_KUBECONFIG

添加节点池

如需将节点池添加到现有 Kubernetes 集群,请完成以下步骤:

控制台

  1. 在导航菜单中,依次选择 Kubernetes Engine > 集群
  2. 在集群列表中点击相应集群。系统会显示集群详情页面。
  3. 依次选择节点池 > 添加节点池
  4. 为节点池分配名称。创建节点池后,您无法修改其名称。
  5. 指定要在节点池中创建的工作器节点数。
  6. 选择最符合您的工作负载要求的机器类。机器类显示在以下设置中:
    • 机器类型
    • vCPU
    • 内存
  7. 点击保存

API

  1. 使用 kubectl CLI 通过交互式编辑器打开 Cluster 自定义资源规范:

    kubectl edit clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \
        -n KUBERNETES_CLUSTER_NAMESPACE \
        --kubeconfig MANAGEMENT_API_SERVER
    

    替换以下内容:

    • KUBERNETES_CLUSTER_NAME:集群的名称。
    • KUBERNETES_CLUSTER_NAMESPACE:集群的命名空间。对于共享集群,请使用 platform 命名空间。对于标准集群,请使用集群的项目命名空间。
    • MANAGEMENT_API_SERVER:托管 Kubernetes 集群的区域 API 服务器的 kubeconfig 路径。如果您尚未为目标可用区中的 API 服务器生成 kubeconfig 文件,请参阅登录了解详情。
  2. nodePools 部分中添加新条目:

    nodePools:
    ...
    - machineTypeName: MACHINE_TYPE
      name: NODE_POOL_NAME
      nodeCount: NUMBER_OF_WORKER_NODES
      taints: TAINTS
      labels: LABELS
      acceleratorOptions:
        gpuPartitionScheme: GPU_PARTITION_SCHEME
    

    替换以下内容:

    • MACHINE_TYPE:节点池的工作器节点的机器类型。查看可用机器类型,了解可配置的资源。
    • NODE_POOL_NAME:节点池的名称。
    • NUMBER_OF_WORKER_NODES:要在节点池中预配的工作器节点数。
    • TAINTS:要应用于此节点池的节点的污点。这是一个可选字段。
    • LABELS:要应用于此节点池的节点的标签。它包含一个键值对列表。此字段为选填字段。
    • GPU_PARTITION_SCHEME:GPU 分区方案(如果您要运行 GPU 工作负载)。例如 mixed-2。如果未设置此字段,则 GPU 不会进行分区。如需了解可用的多实例 GPU (MIG) 配置文件,请参阅支持的 MIG 配置文件
  3. 保存文件并退出编辑器。

查看节点池

如需查看 Kubernetes 集群中的现有节点池,请完成以下步骤:

控制台

  1. 在导航菜单中,依次选择 Kubernetes Engine > 集群
  2. 在集群列表中点击相应集群。系统会显示集群详情页面。
  3. 选择节点池

系统会显示集群中运行的节点池列表。您可以在此页面中管理集群的节点池。

API

  • 查看特定 Kubernetes 集群的节点池:

    kubectl get clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \
        -n KUBERNETES_CLUSTER_NAMESPACE \
        -o json --kubeconfig MANAGEMENT_API_SERVER | \
        jq .status.workerNodePoolStatuses
    

    替换以下内容:

    • KUBERNETES_CLUSTER_NAME:集群的名称。
    • KUBERNETES_CLUSTER_NAMESPACE:集群的命名空间。对于共享集群,请使用 platform 命名空间。对于标准集群,请使用集群的项目命名空间。

    输出类似于以下内容:

    [
      {
        "conditions": [
          {
            "lastTransitionTime": "2023-08-31T22:16:17Z",
            "message": "",
            "observedGeneration": 2,
            "reason": "NodepoolReady",
            "status": "True",
            "type": "Ready"
          },
          {
            "lastTransitionTime": "2023-08-31T22:16:17Z",
            "message": "",
            "observedGeneration": 2,
            "reason": "ReconciliationCompleted",
            "status": "False",
            "type": "Reconciling"
          }
        ],
        "name": "worker-node-pool",
        "readyNodes": 3,
        "readyTimestamp": "2023-08-31T18:59:46Z",
        "reconcilingNodes": 0,
        "stalledNodes": 0,
        "unknownNodes": 0
      }
    ]
    

调整节点池的大小

您可以通过扩大或缩小节点池来手动调整 Kubernetes 集群中的节点池大小。在缩减节点池时,您无法选择要移除的特定节点。

如需扩缩现有集群中的节点池,请完成以下步骤:

控制台

  1. 在信息中心内,选择要修改的集群所在的项目。
  2. 在导航菜单中,依次选择 Kubernetes Engine > 集群
  3. 选择节点池关联的集群名称。系统会显示集群详情页面。
  4. 点击节点池标签页。
  5. 选择要调整大小的节点池对应的 修改图标。系统会显示修改节点池提示。
  6. 更新节点数字段,以反映节点池中所需的新节点数量。您可以根据工作负载要求增加或减少节点数量。

  7. 点击保存

  8. 返回到集群的节点池标签页,确认调整大小后的节点池处于 Ready 状态,并且节点数量正确。节点池可能需要几分钟时间才能扩缩到您指定的规模。

    使用控制台确认节点池已准备就绪。

API

  1. 使用交互式编辑器通过 kubectl CLI 打开 Cluster 自定义资源规范:

    kubectl edit clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \
        -n KUBERNETES_CLUSTER_NAMESPACE \
        --kubeconfig MANAGEMENT_API_SERVER
    

    替换以下内容:

    • KUBERNETES_CLUSTER_NAME:托管节点池的集群的名称。
    • KUBERNETES_CLUSTER_NAMESPACE:集群的命名空间。对于共享集群,请使用 platform 命名空间。对于标准集群,请使用集群的项目命名空间。
    • MANAGEMENT_API_SERVER:托管 Kubernetes 集群的区域 API 服务器的 kubeconfig 路径。如果您尚未为目标可用区中的 API 服务器生成 kubeconfig 文件,请参阅可用区级管理 API 服务器资源
  2. 更新要调整大小的节点池的 nodeCount 字段:

    nodePools:
    # Several lines of code are omitted here.
    - machineTypeName: n2-standard-2-gdc
      name: nodepool-1
      nodeCount: NUMBER_OF_WORKER_NODES
    

    NUMBER_OF_WORKER_NODES 替换为要在节点池中预配的更新后的工作器节点数量。

  3. 保存文件并退出编辑器。

  4. 通过检查节点池的配置来验证节点伸缩是否已完成:

    kubectl get clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \
        -n KUBERNETES_CLUSTER_NAMESPACE -o json \
        --kubeconfig MANAGEMENT_API_SERVER | jq .status.workerNodePoolStatuses
    

    确认 readyNodes 数量反映了您为节点池设置的节点数量。节点池可能需要几分钟时间才能扩缩到您指定的规模。

删除节点池

如果删除节点池,则节点及指向节点的路由也将随之删除。这些节点会逐出并重新调度其上运行的任何 pod。如果 Pod 具有特定的节点选择器,且集群中的其他节点均不符合条件,则这些 Pod 可能仍处于无法调度的状态。

在删除节点池之前,请确保您至少有 3 个工作器节点,以确保集群有足够的计算空间来有效运行。

如需删除节点池,请完成以下步骤:

控制台

  1. 在导航菜单中,依次选择 Kubernetes Engine > 集群

  2. 点击托管要删除的节点池的集群。

  3. 选择节点池

  4. 点击要删除的节点池旁边的 删除

API

  1. 使用交互式编辑器通过 kubectl CLI 打开 Cluster 自定义资源规范:

    kubectl edit clusters.cluster.gdc.goog/KUBERNETES_CLUSTER_NAME \
        -n KUBERNETES_CLUSTER_NAMESPACE \
        --kubeconfig MANAGEMENT_API_SERVER
    

    替换以下内容:

    • KUBERNETES_CLUSTER_NAME:集群的名称。
    • KUBERNETES_CLUSTER_NAMESPACE:集群的命名空间。对于共享集群,请使用 platform 命名空间。对于标准集群,请使用集群的项目命名空间。
    • MANAGEMENT_API_SERVER:托管 Kubernetes 集群的区域 API 服务器的 kubeconfig 路径。如果您尚未为目标可用区中的 API 服务器生成 kubeconfig 文件,请参阅可用区级管理 API 服务器资源
  2. nodePools 部分中移除节点池条目。例如,在以下代码段中,您必须移除 machineTypeNamenamenodeCount 字段:

    nodePools:
    # Several lines of code are omitted here.
    - machineTypeName: n2-standard-2-gdc
      name: nodepool-1
      nodeCount: 3
    

    请务必移除要删除的节点池的所有字段。

  3. 保存文件并退出编辑器。