MIG 用のワークロード ポリシーを作成する

このドキュメントでは、A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D Compute Engine インスタンスを使用するマネージド インスタンス グループ(MIG)のポリシーを作成する方法について説明します。ワークロード ポリシーを作成するときに適用する要件と制限事項の詳細については、 ワークロード ポリシーについて をご覧ください。

ワークロード ポリシーを使用すると、MIG 内の Compute Engine インスタンスの配置またはトポロジを指定できます。たとえば、ワークロード ポリシーを使用して、コンピューティング インスタンスを互いに近い場所に配置し、AI、ML、HPC ワークロードのネットワーク レイテンシを最小限に抑えることができます。

始める前に

必要なロール

ワークロード ポリシーを作成して MIG に適用するために必要な権限を取得するには、プロジェクトに対するCompute インスタンス管理者(v1) roles/compute.instanceAdmin.v1)IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールには ワークロード ポリシーを作成して MIG に適用するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

ワークロード ポリシーを作成して MIG に適用するには、次の権限が必要です。

  • ワークロード ポリシーを作成するには: compute.resourcePolicies.create プロジェクトに対する

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

ワークロード ポリシーの作成

ワークロード ポリシーを作成するには、MIG 内のコンピューティング インスタンスが使用するマシンシリーズに応じて、次のいずれかの方法を使用します。

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成する

ワークロード ポリシーを MIG 内の A4X Max インスタンスまたは A4X インスタンスに適用する場合は、ポリシーの作成時に アクセラレータ トポロジ値 を指定する必要があります。このアクションにより、ワークロードで大規模なノンブロッキング ネットワーク パフォーマンスを実現できます。

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、 gcloud compute resource-policies create workload-policy コマンド--accelerator-topology=1x72 フラグを使用します。

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --accelerator-topology=1x72 \
    --type=high-throughput \
    --region=REGION

次のように置き換えます。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。A4X Max マシンタイプまたは A4X マシンタイプを使用できる リージョンを確認するには、 使用可能なリージョンとゾーンをご覧ください。

REST

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、POST request to the resourcePolicies.insert method を作成します。 リクエストの本文に、1x72 に設定された acceleratorTopology フィールドを含めます。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies

{
  "name": "WORKLOAD_POLICY_NAME",
  "workloadPolicy": {
    "acceleratorTopology": "1x72",
    "type": "HIGH_THROUGHPUT"
  }
}

次のように置き換えます。

  • PROJECT_ID: ワークロード ポリシーを作成するプロジェクトの ID。

  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。A4X Max マシンタイプまたは A4X マシンタイプを使用できる リージョンを確認するには、 使用可能なリージョンとゾーンをご覧ください。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスのワークロード ポリシーを作成する

ワークロード ポリシーを MIG 内の A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスに適用する場合は、ポリシーの作成時に 最大トポロジ距離値 を指定することをおすすめします。このアクションにより、コンピューティング インスタンス間の配置が近くなります。ただし、指定する配置がコンパクトになるほど、コンピューティング インスタンスを作成するゾーンで使用できるリソースが少なくなる可能性があります。

A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)インスタンスのワークロード ポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

ワークロード ポリシーを作成するには、 gcloud compute resource-policies create workload-policy コマンドを使用します。MIG 内のコンピューティング インスタンスを配置する距離に応じて、コマンドに次のフラグを含めます。

  • コンピューティング インスタンスを互いに近い場所にベスト エフォートで配置するには、--type=high-throughput フラグを含めます。

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --type=high-throughput \
        --region=REGION
    
  • コンピューティング インスタンスの配置をさらに制御するには、--max-topology-distance フラグと --type=high-throughput フラグを含めます。

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --max-topology-distance=TOPOLOGY_DISTANCE \
        --type=high-throughput \
        --region=REGION
    

次のように置き換えます。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。GPU マシンタイプを使用できる リージョンを確認するには、 使用可能なリージョンとゾーンをご覧ください。

  • TOPOLOGY_DISTANCE: 最大トポロジ距離。最大距離を短くすると、VM の可用性が低下する可能性があります。 次のいずれかの値を指定します。

    • A4 インスタンスまたは H4D インスタンスを同じクラスタに配置するには: CLUSTER

    • A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスを同じブロックに配置するには: BLOCK

    • A4、A3 Ultra、H4D インスタンスを同じサブブロックに配置するには: SUBBLOCK

REST

ワークロード ポリシーを作成するには、POST リクエストを resourcePolicies.insert メソッドに送信します。MIG 内のコンピューティング インスタンスを配置する距離に応じて、リクエスト本文に次のフィールドを含めます。

  • コンピューティング インスタンスを互いに近い場所にベスト エフォートで配置するには、リクエスト本文に type フィールドを含めます。

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
    
    {
      "name": "WORKLOAD_POLICY_NAME",
      "workloadPolicy": {
        "type": "HIGH_THROUGHPUT"
      }
    }
    
  • コンピューティング インスタンスの配置をさらに制御するには、リクエスト本文に maxTopologyDistance フィールドと type フィールドを含めます。

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
    
    {
      "name": "WORKLOAD_POLICY_NAME",
      "workloadPolicy": {
        "maxTopologyDistance": "TOPOLOGY_DISTANCE",
        "type": "HIGH_THROUGHPUT"
      }
    }
    

次のように置き換えます。

  • PROJECT_ID: ワークロード ポリシーを作成するプロジェクトの ID。

  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。GPU マシンタイプを使用できる リージョンを確認するには、 使用可能なリージョンとゾーンをご覧ください。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

  • TOPOLOGY_DISTANCE: 最大トポロジ距離。最大距離を短くすると、VM の可用性が低下する可能性があります。 次のいずれかの値を指定します。

    • A4 インスタンスまたは H4D インスタンスを同じクラスタに配置するには: CLUSTER

    • A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスを同じブロックに配置するには: BLOCK

    • A4、A3 Ultra、H4D インスタンスを同じサブブロックに配置するには: SUBBLOCK

次のステップ