扩缩无状态工作负载

本文档介绍了如何扩缩在 Google Distributed Cloud (GDC) 气隙 Kubernetes 集群中运行的现有无状态工作负载。您必须根据容器工作负载要求的变化,扩缩无状态工作负载中运行的 pod。

本文档适用于应用运营者群组中的开发者,他们负责管理组织的应用工作负载。如需了解详情,请参阅 GDC 气隙环境文档的受众群体

准备工作

如需针对 Kubernetes 集群运行命令,请确保您拥有以下资源:

  1. 找到 Kubernetes 集群名称,或向平台管理员询问集群名称。

  2. 登录并生成 Kubernetes 集群的 kubeconfig 文件(如果您还没有)。

  3. 使用 Kubernetes 集群的 kubeconfig 路径替换这些说明中的 KUBERNETES_CLUSTER_KUBECONFIG

如需获得扩缩无状态工作负载所需的权限,请让您的组织 IAM 管理员向您授予项目命名空间中的 Namespace Admin 角色 (namespace-admin)。

扩缩 Deployment

利用 Kubernetes 的伸缩功能,适当伸缩部署中运行的 pod 数量。

自动扩缩部署的 Pod

Kubernetes 提供自动扩缩功能,让您无需在需求变化时手动更新部署。在部署中设置 Pod 横向自动扩缩器,以启用此功能:

kubectl --kubeconfig KUBERNETES_CLUSTER_KUBECONFIG \
    -n NAMESPACE \
    autoscale deployment DEPLOYMENT_NAME \
    --cpu-percent=CPU_PERCENT \
    --min=MIN_NUMBER_REPLICAS \
    --max=MAX_NUMBER_REPLICAS

替换以下内容:

  • KUBERNETES_CLUSTER_KUBECONFIG:集群的 kubeconfig 文件。

  • NAMESPACE:项目命名空间。

  • DEPLOYMENT_NAME:要自动扩缩的部署的名称。

  • CPU_PERCENT:要请求的目标平均 CPU 利用率,以百分比表示,适用于所有 pod。

  • MIN_NUMBER_REPLICAS:自动扩缩器可预配的 pod 数下限。

  • MAX_NUMBER_REPLICAS:自动扩缩器可预配的 pod 数量上限。

如需检查新建的 Pod 横向自动扩缩器的当前状态,请运行以下命令:

kubectl get hpa

输出类似于以下内容:

NAME              REFERENCE                          TARGET    MINPODS   MAXPODS   REPLICAS   AGE
DEPLOYMENT_NAME   Deployment/DEPLOYMENT_NAME/scale   0% / 50%  1         10        1          18s

手动扩缩部署的 Pod

如果您希望手动扩缩部署,请运行以下命令:

kubectl --kubeconfig KUBERNETES_CLUSTER_KUBECONFIG \
    -n NAMESPACE \
    scale deployment DEPLOYMENT_NAME \
    --replicas NUMBER_OF_REPLICAS

替换以下内容:

  • KUBERNETES_CLUSTER_KUBECONFIG:集群的 kubeconfig 文件。

  • NAMESPACE:项目命名空间。

  • DEPLOYMENT_NAME:要自动扩缩的部署的名称。

  • DEPLOYMENT_NAME:部署中所需的复制 Pod 对象数量。