创建单租户节点模板

本文档介绍了如何创建和删除单租户节点模板。在创建单租户节点模板之前,请先查看单租户节点概览,了解重要概念和术语。

单租户节点模板是指定单租户节点组属性的区域性资源。您必须先创建节点模板,然后才能创建节点组。

创建单租户节点模板

如果您使用 gcloud CLI 或 REST,则可以创建节点模板资源,以便日后使用该资源创建一个或多个节点组。如果您使用 Google Cloud 控制台,则必须在创建节点组时创建节点模板。

如需创建单租户节点模板,请使用以下方法之一:

控制台

  1. 在 Google Cloud 控制台中,前往单租户节点页面。

    转到“单租户节点”

  2. 点击创建节点组。 在控制台中创建节点组的流程包括创建或选择节点模板。

  3. 为节点组指定一个名称

  4. 指定要在其中创建节点模板的地区。您可以使用节点模板在此地区的任何区域中创建节点组。

  5. 指定可用区,然后点击继续

  6. 节点模板列表中,点击创建节点模板以开始创建单租户节点模板。

  7. 为节点模板指定一个名称

  8. 为要基于此节点模板创建的节点组中的每个单租户节点指定节点类型

  9. 您还可以选择为节点模板指定以下属性:

    • 添加本地 SSDGPU 加速器
    • 选择启用 CPU 过度使用功能以控制节点上调度的每个虚拟机的 CPU 过度使用水平
    • 添加节点亲和性标签。借助亲和性标签,您可以对节点和节点组进行逻辑分组,然后在供应虚拟机时,您可以为虚拟机指定亲和性标签,以便将虚拟机调度到一组特定节点或节点组上。如需了解详情,请参阅节点亲和性和反亲和性
  10. 点击创建以完成节点模板的创建。

  11. 可选:如需在其他区域中添加新的单租户节点模板,请重复上述步骤。

如需查看节点模板,请点击单租户节点页面中的节点模板

gcloud

使用 gcloud compute sole-tenancy node-templates create 命令创建节点模板:

gcloud compute sole-tenancy node-templates create TEMPLATE_NAME \
  --node-type=NODE_TYPE \
  [--region=REGION \]
  [--node-affinity-labels=AFFINITY_LABELS \]
  [--accelerator type=GPU_TYPE,count=GPU_COUNT \]
  [--disk type=local-ssd,count=DISK_COUNT,size=DISK_SIZE \]
  [--cpu-overcommit-type=CPU_OVERCOMMIT_TYPE]

请替换以下内容:

  • TEMPLATE_NAME:新节点模板的名称。

  • NODE_TYPE:基于此模板创建的单租户节点的节点类型。使用 gcloud compute sole-tenancy node-types list 命令获取每个区域中可用节点类型的列表。

  • REGION:要在其中创建节点模板的区域。您可以使用该模板在此地区的任何区域中创建节点组。

  • AFFINITY_LABELS:亲和性标签的键和值 ([KEY=VALUE,...])。借助亲和性标签,您可以对节点和节点组进行逻辑分组,然后在供应虚拟机时,您可以为虚拟机指定亲和性标签,以便将虚拟机调度到一组特定节点或节点组上。如需了解详情,请参阅节点亲和性和反亲和性

  • GPU_TYPE:基于此节点模板创建的每个单租户节点的 GPU 类型。如需了解 GPU 的可用区级可用性,请使用 gcloud compute accelerator-types list 命令,然后选择 n1g2a3-highgpua3-megagpu 单租户节点类型可用的可用区。根据可用区可用性,设置为以下其中一项:

    • 对于 A3 High:nvidia-h100-80gb
    • 对于 A3 Mega:nvidia-h100-mega-80gb
    • 对于 G2:nvidia-l4
    • 对于 N1:
      • nvidia-tesla-p100
      • nvidia-tesla-p4
      • nvidia-tesla-t4
      • nvidia-tesla-v100
  • GPU_COUNT:要指定的 GPU 数量,具体取决于 GPU 的类型。设置为 GPU 类型指定的值,如下表所示:

    GPU_TYPE GPU_COUNT
    nvidia-h100-80gb 8
    nvidia-h100-mega-80gb 8
    nvidia-l4 8
    nvidia-tesla-p100 4
    nvidia-tesla-p4 4
    nvidia-tesla-t4 4
    nvidia-tesla-v100 8
  • DISK_COUNT:本地 SSD 磁盘数量。设置为 1624。对于 A3 High 和 A3 Mega 节点类型,此参数不是必需的,因为它们包含固定数量的本地 SSD 磁盘。

  • DISK_SIZE:本地 SSD 分区大小的可选值(以 GB 为单位)。唯一支持的分区大小为 375,如果您未设置此值,则默认为 375

  • CPU_OVERCOMMIT_TYPE:虚拟机上 CPU 的过度使用类型。设置为 enablednone

REST

使用 nodeTemplates.insert 方法创建节点模板:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/nodeTemplates

{
  "name": "TEMPLATE_NAME",
  "nodeType": "NODE_TYPE",
  "nodeAffinityLabels": {
    "KEY": "VALUE",
    ...
  },
  "accelerators": [
    {
      "acceleratorType": "GPU_TYPE",
      "acceleratorCount": GPU_COUNT
    }
  ],
  "disks": [
    {
      "diskType": "local-ssd",
      "diskSizeGb": DISK_SIZE,
      "diskCount": DISK_COUNT
    }
  ],
  "cpuOvercommitType": CPU_OVERCOMMIT_TYPE
}

请替换以下内容:

  • PROJECT_ID:项目 ID。

  • REGION:要在其中创建节点模板的区域。您可以使用该模板在此地区的任何区域中创建节点组。

  • TEMPLATE_NAME:新节点模板的名称。

  • NODE_TYPE:基于此模板创建的单租户节点的节点类型。使用 nodeTypes.list 方法获取每个区域中可用节点类型的列表。

  • KEYnodeAffinityLabels 值,用于指定以键值对形式表示的节点亲和性标签的键部分。借助亲和性标签,您可以对节点和节点组进行逻辑分组,然后在供应虚拟机时,您可以为虚拟机指定亲和性标签,以便将虚拟机调度到一组特定节点或节点组上。如需了解详情,请参阅节点亲和性和反亲和性

  • VALUEnodeAffinityLabels 值,用于指定节点亲和性标签键值对的值部分。

  • GPU_TYPE:基于此节点模板创建的每个单租户节点的 GPU 类型。如需了解 GPU 的可用区级可用性,请使用 gcloud compute accelerator-types list 命令,然后选择 n1g2a3-highgpua3-megagpu 单租户节点类型可用的可用区。根据可用区可用性,设置为以下其中一项:

    • 对于 A3 High:nvidia-h100-80gb
    • 对于 A3 Mega:nvidia-h100-mega-80gb
    • 对于 G2:nvidia-l4
    • 对于 N1:
      • nvidia-tesla-p100
      • nvidia-tesla-p4
      • nvidia-tesla-t4
      • nvidia-tesla-v100
  • GPU_COUNT:基于此节点模板创建的每个单租户节点的 GPU 数量。设置为 GPU 类型指定的值,如下表所示:

    GPU_TYPE GPU_COUNT
    nvidia-h100-80gb 8
    nvidia-h100-mega-80gb 8
    nvidia-l4 8
    nvidia-tesla-p100 4
    nvidia-tesla-p4 4
    nvidia-tesla-t4 4
    nvidia-tesla-v100 8
  • DISK_SIZE:本地 SSD 分区大小的可选值(以 GB 为单位)。唯一支持的分区大小为 375,如果您未设置此值,则默认为 375

  • DISK_COUNT:本地 SSD 磁盘数量。设置为 1624。 对于 A3 High 和 A3 Mega 节点类型,此参数不是必需的,因为它们包含固定数量的本地 SSD 磁盘。

  • CPU_OVERCOMMIT_TYPE:CPU 过度使用类型。设置为 enablednoneCPU_OVERCOMMIT_TYPE_UNSPECIFIED

删除节点模板

您可以在删除使用某个节点模板的所有节点组后删除该模板。

控制台

  1. 在 Google Cloud 控制台中,前往单租户节点页面。

    转到“单租户节点”

  2. 点击节点模板

  3. 选择某个未使用的节点模板的名称。

  4. 点击删除

gcloud

使用 gcloud compute sole-tenancy node-templates delete 命令删除未使用的节点模板:

gcloud compute sole-tenancy node-templates delete TEMPLATE_NAME \
  --region=REGION

请替换以下内容:

  • TEMPLATE_NAME:要删除的节点模板的名称

  • REGION:节点模板的区域

REST

使用 compute.nodeTemplates.delete 方法删除未使用的节点模板:

 DELETE https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/nodeTemplates/TEMPLATE_NAME
 

替换以下内容:

  • PROJECT_ID:您的项目 ID

  • REGION:包含节点模板的 Google Cloud 区域

  • TEMPLATE_NAME:要删除的节点模板的名称

后续步骤