扩缩无状态工作负载

本文档介绍了如何扩缩在 Google Distributed Cloud (GDC) 气隙 Kubernetes 集群中运行的现有无状态工作负载。您必须根据容器工作负载要求的变化,扩缩无状态工作负载中运行的 pod。

本文档适用于应用运维人员群组中的开发者,他们负责管理组织的应用工作负载。如需了解详情,请参阅 GDC 气隙环境的受众群体文档

准备工作

如需完成本文档中的任务,您必须拥有以下资源和角色:

  • 如需针对 Kubernetes 集群运行命令,请确保您拥有以下资源:

    • 找到 Kubernetes 集群名称,或向平台管理员群组的成员询问集群名称。

    • 登录并生成 Kubernetes 集群的 kubeconfig 文件(如果您还没有)。

    • 使用 Kubernetes 集群的 kubeconfig 路径替换这些说明中的 KUBERNETES_CLUSTER_KUBECONFIG

  • 如需获得在共享集群中扩缩无状态工作负载所需的权限,请让您的组织 IAM 管理员在项目命名空间中向您授予命名空间管理员角色 (namespace-admin)。

  • 如需获得在标准集群中扩缩无状态工作负载所需的权限,请让组织 IAM 管理员为您授予标准集群中的集群开发者角色 (cluster-developer)。

扩缩 Deployment

使用 Kubernetes 的伸缩功能来适当伸缩部署中运行的 pod 数量。

自动扩缩部署的 Pod

Kubernetes 提供自动扩缩功能,因此您无需在需求变化时手动更新部署。完成以下步骤,以自动扩缩部署的 pod:

  1. 为确保 Pod 横向自动扩缩器能够正确衡量 CPU 百分比,请在部署中设置 CPU 资源请求

  2. 在部署中设置 Pod 横向自动扩缩器:

    kubectl --kubeconfig KUBERNETES_CLUSTER_KUBECONFIG \
        -n NAMESPACE \
        autoscale deployment DEPLOYMENT_NAME \
        --cpu-percent=CPU_PERCENT \
        --min=MIN_NUMBER_REPLICAS \
        --max=MAX_NUMBER_REPLICAS
    

    替换以下内容:

    • KUBERNETES_CLUSTER_KUBECONFIG:集群的 kubeconfig 文件。

    • NAMESPACE:命名空间。对于共享集群,这必须是项目命名空间。对于标准集群,它可以是任何命名空间。

    • DEPLOYMENT_NAME:要自动扩缩的部署的名称。

    • CPU_PERCENT:要请求的目标平均 CPU 利用率,以百分比表示,适用于所有 pod。

    • MIN_NUMBER_REPLICAS:自动扩缩器可预配的 pod 数下限。

    • MAX_NUMBER_REPLICAS:自动扩缩器可预配的 Pod 数量上限。

  3. 运行下面的命令,查看 Pod 横向自动扩缩器的当前状态:

    kubectl get hpa
    

    输出类似于以下内容:

    NAME              REFERENCE                          TARGET    MINPODS   MAXPODS   REPLICAS   AGE
    DEPLOYMENT_NAME   Deployment/DEPLOYMENT_NAME/scale   0% / 50%  1         10        1          18s
    

手动扩缩部署的 Pod

如果您希望手动扩缩部署,请运行以下命令:

kubectl --kubeconfig KUBERNETES_CLUSTER_KUBECONFIG \
    -n NAMESPACE \
    scale deployment DEPLOYMENT_NAME \
    --replicas NUMBER_OF_REPLICAS

替换以下内容:

  • KUBERNETES_CLUSTER_KUBECONFIG:集群的 kubeconfig 文件。

  • NAMESPACE:命名空间。对于共享集群,这必须是项目命名空间。对于标准集群,它可以是任何命名空间。

  • DEPLOYMENT_NAME:要自动扩缩的部署的名称。

  • DEPLOYMENT_NAME:部署中的复制 Pod 对象数。

后续步骤