本文档介绍如何为具有 A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(8 个 GPU)或 H4D Compute Engine 实例的托管式实例组 (MIG) 创建政策。如需详细了解在创建工作负载政策时遵循的要求和限制 ,请参阅 关于工作负载政策。
借助工作负载政策,您可以为 MIG 中的 Compute Engine 实例指定布置或拓扑。例如,您可以使用工作负载政策将计算实例布置得彼此靠近,从而最大限度地缩短人工智能 (AI)、机器学习 (ML) 或高性能计算 (HPC) 工作负载的网络延迟时间。
准备工作
-
如果您尚未设置身份验证,请进行设置。身份验证用于验证您的身份,以便访问 Google Cloud 服务和 API。如需从本地开发环境运行
代码或示例,您可以通过选择以下选项之一向
Compute Engine 进行身份验证:
{1
选择标签页以了解您打算如何使用本页面上的示例:
gcloud
-
安装 Google Cloud CLI。 安装完成后, 初始化 Google Cloud CLI,方法是运行以下命令:
gcloud init如果您使用的是外部身份提供方 (IdP),则必须先 使用联合身份登录 gcloud CLI。
-
- 设置默认区域和可用区。
REST
如需在本地开发环境中使用本页面上的 REST API 示例,请使用您提供给 gcloud CLI 的 凭证。
安装 Google Cloud CLI。
如果您使用的是外部身份提供方 (IdP),则必须先 使用联合身份登录 gcloud CLI。
如需了解详情,请参阅 身份验证文档中的使用 REST 时进行身份验证 。 Google Cloud
所需角色
如需获得创建工作负载政策并将其应用于 MIG 所需的权限,请让您的管理员为您授予项目的Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) IAM 角色。如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
此预定义角色包含 创建工作负载政策并将其应用于 MIG 所需的权限。如需查看所需的确切权限,请展开所需权限部分:
所需权限
若要创建工作负载政策并将其应用于 MIG,您需要以下权限:
-
如需创建工作负载政策:
compute.resourcePolicies.create项目的
创建工作负载政策
如需创建工作负载政策,请根据 MIG 中计算实例使用的机器系列,使用以下方法之一:
为 A4X Max 或 A4X 实例创建工作负载政策
如果您将工作负载政策应用于 MIG 中的 A4X Max 或 A4X 实例,则您 必须在创建政策时指定 加速器拓扑值 。此操作有助于您的工作负载实现大规模、无阻塞的网络性能。
如需为 A4X Max 或 A4X 实例创建工作负载政策,请选择以下选项之一:
gcloud
如需为 A4X Max 或 A4X 实例创建工作负载政策,请使用
gcloud compute resource-policies create workload-policy 命令
并使用 --accelerator-topology=1x72 标志:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
替换以下内容:
WORKLOAD_POLICY_NAME:工作负载政策的名称。REGION:用于创建工作负载政策的区域。指定您要在其中创建 MIG 的区域,以及提供您要使用的机器类型的区域。如需查看提供 A4X Max 或 A4X 机器类型的 区域,请参阅 可用区域和可用区。
REST
如需为 A4X Max 或 A4X 实例创建工作负载政策,请向 POST
方法发出
resourcePolicies.insert请求。
在请求正文中,添加设置为 1x72 的 acceleratorTopology 字段:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
替换以下内容:
PROJECT_ID:用于创建工作负载政策的项目的 ID。REGION:用于创建工作负载政策的区域。指定您要在其中创建 MIG 的区域,以及提供您要使用的机器类型的区域。如需查看提供 A4X Max 或 A4X 机器类型的 区域,请参阅 可用区域和可用区。WORKLOAD_POLICY_NAME:工作负载政策的名称。
为 A4、A3 Ultra、A3 Mega、A3 High(8 个 GPU)或 H4D 实例创建工作负载政策
如果您要将工作负载政策应用于 MIG 中的 A4、A3 Ultra、A3 Mega、A3 High(8 个 GPU)或 H4D 实例,建议您在创建政策时指定 最大拓扑距离值 。此操作有助于确保计算实例之间的布置更靠近。不过,您指定的布置越紧凑,您要在其中创建计算实例的可用区中可用的资源就越少。
如需为 A4、A3 Ultra、A3 Mega 或 A3 High(8 个 GPU)实例创建工作负载政策,请选择以下选项之一:
gcloud
如需创建工作负载政策,请使用
gcloud compute resource-policies create workload-policy 命令。根据您希望 MIG 中的计算实例布置得有多靠近,在命令中添加以下标志:
如需尽力将计算实例布置得彼此靠近,请添加
--type=high-throughput标志:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGION如需进一步控制计算实例的布置,请添加
--max-topology-distance和--type=high-throughput标志:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
替换以下内容:
WORKLOAD_POLICY_NAME:工作负载政策的名称。REGION:用于创建工作负载政策的区域。指定您要在其中创建 MIG 的区域,以及提供您要使用的机器类型的区域。如需查看提供 GPU 机器类型的 区域,请参阅 可用区域和可用区。TOPOLOGY_DISTANCE:最大拓扑距离。较短的最大距离可能会降低实现虚拟机可用性的可能性。 请指定以下某个值:如需将 A4 或 H4D 实例布置在同一集群中:
CLUSTER如需将 A4、A3 Ultra、A3 Mega、A3 High(8 个 GPU)或 H4D 实例布置在同一区块中:
BLOCK如需将 A4、A3 Ultra 或 H4D 实例布置在同一子区块中:
SUBBLOCK
REST
如需创建工作负载政策,请向
resourcePolicies.insert方法发出POST请求。根据您希望 MIG 中的计算实例布置得有多靠近,在请求正文中添加以下字段:
如需尽力将计算实例布置得彼此靠近,请在请求正文中添加
type字段:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }如需进一步控制计算实例的布置,请在请求正文中添加
maxTopologyDistance和type字段:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
替换以下内容:
PROJECT_ID:用于创建工作负载政策的项目的 ID。REGION:用于创建工作负载政策的区域。指定您要在其中创建 MIG 的区域,以及提供您要使用的机器类型的区域。如需查看提供 GPU 机器类型的 区域,请参阅 可用区域和可用区。WORKLOAD_POLICY_NAME:工作负载政策的名称。TOPOLOGY_DISTANCE:最大拓扑距离。较短的最大距离可能会降低实现虚拟机可用性的可能性。 请指定以下某个值:如需将 A4 或 H4D 实例布置在同一集群中:
CLUSTER如需将 A4、A3 Ultra、A3 Mega、A3 High(8 个 GPU)或 H4D 实例布置在同一区块中:
BLOCK如需将 A4、A3 Ultra 或 H4D 实例布置在同一子区块中:
SUBBLOCK
后续步骤
创建工作负载政策后,了解如何将其应用于 MIG:
了解如何 查看计算实例拓扑。
了解如何 查看工作负载政策。
了解如何 替换、移除或删除工作负载政策。