A4X を使用して AI 最適化 MIG を作成する

このドキュメントでは、A4X マシンタイプを使用するマネージド インスタンス グループ(MIG)の作成方法について説明します。このアクセラレータ最適化マシンタイプの詳細については、 A4X をご覧ください。

複数の仮想マシン(VM)を単一のエンティティとして管理する場合は、MIG を作成します。MIG の詳細については、Compute Engine のドキュメントの マネージド インスタンス グループ をご覧ください。

VM またはクラスタを作成する他の方法については、 デプロイ オプションの概要をご覧ください。

制限事項

A4X VM を使用して MIG を作成する場合は、マシンタイプと MIG の両方の制限事項を考慮してください。

A4X VM の制限事項

次のマシン固有の制限が適用されます。

MIG の制限事項

A4X マシンタイプを使用して MIG を作成する場合、次の制限が適用されます。

  • RDMA ネットワーキングを使用するリージョン MIG を作成する場合、MIG は RDMA のネットワーク プロファイルを設定したゾーンにのみ A4X インスタンスを 作成できます

  • MIG で インスタンスの柔軟性 を構成することはできません。

  • ワークロード ポリシーを MIG に適用すると、グループに A4X インスタンスが含まれている場合、MIG でポリシーを変更できません。ポリシーを変更するには、まず MIG のサイズを 0 に変更 する必要があります。

  • プレースメント ポリシーを指定するインスタンス テンプレートを使用して、ワークロード ポリシーを使用する MIG を作成することはできません。

  • 予約にバインドされた プロビジョニング モデルを使用する必要があります。他のプロビジョニング モデルは対象外です。

  • サイズ変更リクエストを使用して A4X インスタンスを MIG に追加することはできません。インスタンスを追加するには、MIG のターゲット サイズを設定する必要があります。

始める前に

MIG を作成する前に、次の手順を完了します(まだ完了していない場合)。

  1. 使用オプションを選択する: 選択した使用オプションによって、GPU リソースの取得方法 と使用方法が決まります。詳細については、 使用オプションを選択するをご覧ください。
  2. 容量を取得する: 容量を取得するプロセスは、使用オプションごとに異なります。選択した使用オプションの容量を取得するプロセスについては、容量の概要をご覧ください。

必要なロール

MIG を作成するために必要な権限を取得するには、プロジェクトに対するCompute インスタンス管理者(v1) roles/compute.instanceAdmin.v1)IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールには MIG の作成に必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

MIG を作成するには、次の権限が必要です。

  • MIG を作成する: compute.instanceGroupManagers.create プロジェクトに対する

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

A4X の基礎

A4X クラスタは、大規模でノンブロッキングのネットワーク パフォーマンスを実現するために、ブロックとサブブロックの階層に編成されています。このトポロジを理解することは、容量を予約してワークロードをデプロイするうえで重要です。

A4X インスタンス
A4X インスタンスは、4 つの GPU が接続された単一の A4X マシンタイプです。
サブブロック
サブブロックは、A4X 容量の基本単位です。A4X の場合、サブブロックは 18 個の A4X インスタンス(72 個の GPU)で構成されます。これらのインスタンスは NVLink ドメインを形成し、 マルチノード NVLink システムを使用して接続されます。1x72 トポロジを指定するワークロード ポリシーを適用して、A4X サブブロックを作成します。
ブロック
A4X ブロックは 25 個のサブブロック(NVLink ドメイン)で構成され、合計で最大 450 個の A4X インスタンス(1,800 個の GPU)になります。サブブロックは、効率的なスケーリングのためにレール整列型です。各サブブロックには MIG が必要です。 したがって、単一の A4X ブロックに対して 25 個の MIG を作成できます。

次の表に、A4X インスタンスでサポートされているトポロジ オプションを示します。

トポロジ(acceleratorTopology GPU の数 インスタンス数
1x72 72 18

概要

A4X マシンタイプを使用して MIG を作成する手順は次のとおりです。

  1. VPC ネットワークを作成する。
  2. ワークロード ポリシーを作成する。
  3. インスタンス テンプレートの作成
  4. MIG を作成する

VPC ネットワークを作成する。

A4X マシンタイプのネットワークを設定するには、次のネットワーク インターフェース用に 3 つの VPC ネットワークを作成します。

  • gVNIC ネットワーク インターフェース(NIC)用の 2 つの標準 VPC ネットワーク。ホスト間通信に使用されます。
  • 複数の A4X サブブロックを作成する場合は、CX-7 NIC 用の RoCE ネットワーク プロファイル を持つ 1 つの VPC ネットワーク。 RoCE VPC ネットワークには、4 個のサブネット( CX-7 NIC ごとに 1 個のサブネット)が必要です。これらの NIC は RDMA over Converged Ethernet(RoCE)を使用し、 複数の A4X サブブロックへの スケールアウトに不可欠な高帯域幅で低レイテンシの通信を提供します。単一の A4X サブブロックの場合、 単一のサブブロック内で GPU 間通信がマルチノード NVLink によって処理されるため、この VPC ネットワークをスキップできます。

NIC の配置の詳細については、 ネットワーク帯域幅と NIC の配置を確認するをご覧ください。

手順ガイドに沿って、手動または自動(提供されたスクリプト)でネットワークを作成します。

手順ガイド

ネットワークを作成するには、次の操作を行います。

これらの VPC ネットワークでは、 最大伝送単位(MTU)をより大きい値に設定することをおすすめします。 A4X マシンタイプの場合、推奨される MTU は 8896 バイトです。 他の GPU マシンタイプの推奨 MTU 設定を確認するには、 GPU マシンタイプの MTU 設定をご覧ください。

スクリプト

ネットワークを作成する手順は次のとおりです。

これらの VPC ネットワークでは、 最大伝送単位(MTU)をより大きい値に設定することをおすすめします。 A4X マシンタイプの場合、推奨される MTU は 8896 バイトです。 他の GPU マシンタイプの推奨 MTU 設定を確認するには、 GPU マシンタイプの MTU 設定をご覧ください。

  1. 次のスクリプトを使用して、gVNIC の標準 VPC ネットワークを作成します。

      
        #!/bin/bash
    
        # Create regular VPC networks and subnets for the gVNICs
        for N in $(seq 0 1); do
          gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \
            --subnet-mode=custom \
            --mtu=8896
    
          gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \
            --network=GVNIC_NAME_PREFIX-net-$N \
            --region=REGION \
            --range=192.168.$N.0/24
    
          gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \
            --network=GVNIC_NAME_PREFIX-net-$N \
            --action=ALLOW \
            --rules=tcp:0-65535,udp:0-65535,icmp \
            --source-ranges=192.168.0.0/16
        done
    
        # Create SSH firewall rules
        gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \
          --network=GVNIC_NAME_PREFIX-net-0 \
          --action=ALLOW \
          --rules=tcp:22 \
          --source-ranges=IP_RANGE
    
        # Assumes that an external IP is only created for vNIC 0
        gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \
          --network=GVNIC_NAME_PREFIX-net-0 \
          --action=ALLOW \
          --rules=icmp \
          --source-ranges=IP_RANGE
    
      
  2. 複数の A4X サブブロックが必要な場合は、次のスクリプトを使用して、各 A4X インスタンスの 4 つの CX-7 NIC の RoCE VPC ネットワークとサブネットを作成します。

      
        #!/bin/bash
    
        # List and make sure network profiles exist in the machine type's zone
        gcloud compute network-profiles list --filter "location.name=ZONE"
    
        # Create network for RDMA NICs
        gcloud compute networks create RDMA_NAME_PREFIX-mrdma \
          --network-profile=ZONE-vpc-roce \
          --subnet-mode custom \
          --mtu=8896
    
        # Create subnets
        for N in $(seq 0 3); do
          gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \
            --network=RDMA_NAME_PREFIX-mrdma \
            --region=REGION \
            --range=192.168.$((N+2)).0/24 # offset to avoid overlap with gVNICs
        done
    
      

    次のように置き換えます。

    • GVNIC_NAME_PREFIX: gVNIC の標準 VPC ネットワークとサブネットに使用するカスタム名の接頭辞。
    • RDMA_NAME_PREFIX: CX-7 NIC の RoCE VPC ネットワークとサブネットに使用するカスタム名の接頭辞。
    • ZONE: 使用するマシンタイプが使用可能なゾーン(us-central1-a など)を指定します。リージョンの詳細については、リージョンおよびゾーン別の GPU の可用性をご覧ください。
    • REGION: サブネットを作成するリージョン。このリージョンは、指定したゾーンに対応している必要があります。たとえば、ゾーンが us-central1-a の場合、リージョンは us-central1 です。
    • IP_RANGE: SSH ファイアウォール ルールに使用する IP 範囲。
  3. 省略可: VPC ネットワーク リソースが正常に作成されたことを確認するには、 Google Cloud コンソールでネットワーク設定を確認します。
    1. Google Cloud コンソールで、[VPC ネットワーク] ページに移動します。

      [VPC ネットワーク] に移動

    2. リストで、前の手順で作成したネットワークを検索します。
    3. サブネット、ファイアウォール ルール、その他のネットワーク設定を表示するには、ネットワークの名前をクリックします。

ワークロード ポリシーの作成

テスト用に MIG に単一の A4X インスタンスを作成する場合は、この手順をスキップします。それ以外の場合は、ワークロード ポリシー を作成して、A4X インスタンスを含む MIG を作成する必要があります。

ワークロード ポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

ワークロード ポリシーを作成するには、 gcloud compute resource-policies create workload-policy コマンドを使用します。

アクセラレータ間ネットワーク構成の場合は、コマンドで --accelerator-topology フラグを指定します。

A4X マシンタイプには次のコマンドを使用します。1x72 のアクセラレータ トポロジは、72 個の GPU がブロック内の NVLink を介して接続されていることを示します。

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --type=high-throughput \
    --accelerator-topology=1x72 \
    --region=REGION

次のように置き換えます。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。
  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。リージョンの詳細については、 リージョンおよびゾーン別の GPU の可用性をご覧ください。

REST

ワークロード ポリシーを作成するには、POST リクエストを resourcePolicies.insert メソッドに送信します。

アクセラレータ間ネットワーク構成の場合は、リクエストで acceleratorTopology フィールドを指定します。

A4X マシンタイプには次のリクエストを行います。1x72 のアクセラレータ トポロジは、72 個の GPU がブロック内の NVLink を介して接続されていることを示します。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
  {
    "name": "WORKLOAD_POLICY_NAME"
    "workloadPolicy": {
      "type": "HIGH_THROUGHPUT",
      "acceleratorTopology": "1x72"
    }
  }

次のように置き換えます。

  • PROJECT_ID: プロジェクト ID
  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。リージョンの詳細については、 リージョンおよびゾーン別の GPU の可用性をご覧ください。
  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

インスタンス テンプレートの作成

インスタンス テンプレートを作成して、MIG の VM プロパティを指定します。

インスタンス テンプレートを作成するには、次のいずれかのオプションを選択します。

次のコマンドは、インスタンスのアクセス スコープも設定します。権限管理を簡素化するには、インスタンスのアクセス スコープを cloud-platform アクセスに設定し、IAM ロールを使用してインスタンスがアクセスできるサービスを定義することをおすすめします。詳細については、スコープのベスト プラクティスをご覧ください。

gcloud

リージョン インスタンス テンプレートを作成するには、 gcloud compute instance-templates create コマンドを使用します。

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=a4x-highgpu-4g \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --instance-template-region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address 
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE \
    --restart-on-failure

次のように置き換えます。

  • INSTANCE_TEMPLATE_NAME: インスタンス テンプレートの名前。
  • IMAGE_FAMILY: 使用する OS イメージのイメージ ファミリー。 サポート対象のオペレーティング システムの一覧については、サポートされているオペレーティング システムをご覧ください。
  • IMAGE_PROJECT: OS イメージのプロジェクト ID。
  • REGION: インスタンス テンプレートを作成するリージョン。 使用するマシンタイプが利用可能なリージョンを指定します。 リージョンの詳細については、 リージョンおよびゾーン別の GPU の可用性をご覧ください。
  • DISK_SIZE: ブートディスクのサイズ(GB)。
  • GVNIC_NAME_PREFIX: gVNIC NIC を使用する標準の VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
  • RDMA_NAME_PREFIX: RDMA NIC を使用する VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
  • RESERVATION: 予約名、ブロック、または 予約内のサブブロック。予約名または使用可能なブロックを取得するには、予約容量を表示するをご覧ください。インスタンスの配置の要件に基づいて、次のいずれかを選択します。
    • 任意の単一ブロックに A4X インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
          
    • 特定のブロックに A4X インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
          
    • 特定のサブブロックに A4X インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
          

REST

リージョン インスタンス テンプレートを作成するには、POST リクエストを regionInstanceTemplates.insert メソッドに送信します。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
  "name":"INSTANCE_TEMPLATE_NAME",
  "properties":{
    "machineType":"a4x-highgpu-4g",
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "serviceAccounts": [
      {
        "email": "default",
        "scopes": [
          "https://www.googleapis.com/auth/cloud-platform"
        ]
      }
    ],
    "networkInterfaces": [
      {
        "accessConfigs": [
          {
            "name": "external-nat",
            "type": "ONE_TO_ONE_NAT"
          }
        ],
        "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
        "nicType": "GVNIC",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
        "nicType": "GVNIC",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
      }
    ],
    "reservationAffinity":{
        "consumeReservationType":"SPECIFIC_RESERVATION",
        "key":"compute.googleapis.com/reservation-name",
        "values":[
          "RESERVATION"
        ]
      },
    "scheduling":{
        "provisioningModel":"RESERVATION_BOUND",
        "instanceTerminationAction":"DELETE",
        "onHostMaintenance": "TERMINATE",
        "automaticRestart":true
      }
  }
}

次のように置き換えます。

  • INSTANCE_TEMPLATE_NAME: インスタンス テンプレートの名前。
  • IMAGE_FAMILY: 使用する OS イメージのイメージ ファミリー。 サポート対象のオペレーティング システムの一覧については、サポートされているオペレーティング システムをご覧ください。
  • IMAGE_PROJECT: OS イメージのプロジェクト ID。
  • REGION: インスタンス テンプレートを作成するリージョン。 使用するマシンタイプが利用可能なリージョンを指定します。 リージョンの詳細については、 リージョンおよびゾーン別の GPU の可用性をご覧ください。
  • DISK_SIZE: ブートディスクのサイズ(GB)。
  • NETWORK_PROJECT_ID: ネットワークのプロジェクト ID。
  • GVNIC_NAME_PREFIX: gVNIC NIC を使用する標準の VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
  • REGION: サブネットワークのリージョン。
  • RDMA_NAME_PREFIX: RDMA NIC を使用する VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
  • RESERVATION: 予約名、ブロック、または 予約内のサブブロック。予約名または使用可能なブロックを取得するには、予約容量を表示するをご覧ください。インスタンスの配置の要件に基づいて、次のいずれかを選択します。
    • 任意の単一ブロックに A4X インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
          
    • 特定のブロックに A4X インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
          
    • 特定のサブブロックに A4X インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
          

MIG を作成する

A4X マシンタイプを使用する場合は、ターゲット サイズを指定して MIG を作成する必要があります。

1x72 の GPU トポロジを取得するには、 18 個の A4X インスタンスを含む MIG を作成します。MIG を作成するときに、acceleratorTopology フィールドを指定するワークロード ポリシーを適用します。ポリシーを適用すると、Compute Engine は NVLink ドメインを使用するために、1 つのサブブロックに 18 個の A4X インスタンスをすべて作成します。 サブブロックに 18 個のインスタンスすべての容量がない場合、すぐに作成できない マネージド インスタンス は、容量 が使用可能になるまで CREATING 状態のままになります。これらのマネージド インスタンスは、容量がある場合に MIG が作成するコンピューティング インスタンスを表します。

acceleratorTopology フィールドが 1x72 に設定されたワークロード ポリシーを適用する場合、MIG に 18 個を超える A4X インスタンスを作成することはできません。 18 個を超えるインスタンスを指定すると、MIG の作成が失敗します。複数の NVLink ドメインを作成するには、ドメインごとに個別の MIG を作成し、各 MIG に同じワークロード ポリシーを適用します。

MIG を作成するには、次のいずれかのオプションを選択します。

gcloud

指定したターゲット サイズで MIG を作成するには、 instance-groups managed create コマンドを使用します。

ゾーン MIG またはリージョン MIG を次のように作成します。

  • ゾーン MIG を作成するには、次のコマンドを使用します。
    gcloud compute instance-groups managed create MIG_NAME \
      --template=INSTANCE_TEMPLATE_URL \
      --size=TARGET_SIZE \
      --workload-policy=WORKLOAD_POLICY_URL \
      --zone=ZONE
    
  • リージョン MIG を作成するには、次のコマンドを使用します。
    gcloud compute instance-groups managed create MIG_NAME \
        --template=INSTANCE_TEMPLATE_URL \
        --size=TARGET_SIZE \
        --workload-policy=WORKLOAD_POLICY_URL \
        --region=REGION
    
次のように置き換えます。
  • MIG_NAME: MIG の名前。
  • INSTANCE_TEMPLATE_URL: MIG でインスタンスの作成に使用するインスタンス テンプレートの URL。この URL には、インスタンス テンプレートの ID または名前を含めることができます。次のいずれかの値を指定します。
    • リージョン インスタンス テンプレートの場合: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • グローバル インスタンス テンプレートの場合: INSTANCE_TEMPLATE_ID
  • TARGET_SIZE: MIG に含めるインスタンスの数。アクセラレータ トポロジが 1x72 の場合、ターゲット サイズを 18 に設定します。
  • WORKLOAD_POLICY_URL:ワークロード ポリシーの URL(例: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy)。
  • ZONE: MIG を作成するゾーン。ワークロード ポリシーのリージョン内のゾーンを指定します。
  • REGION: MIG を作成するリージョン。ワークロード ポリシーと同じリージョンを指定します。リージョン MIG の場合は、リージョンの代わりに、 `--zones` フラグを使用してそのリージョンのゾーンを指定できます。

REST

指定したターゲット サイズで MIG を作成するには、POST リクエストを送信します。

ゾーン MIG またはリージョン MIG を次のように作成します。

  • ゾーン MIG を作成するには、instanceGroupManagers.insert メソッドPOST リクエストを送信します。
    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
    {
      "versions": [
        {
          "instanceTemplate": "INSTANCE_TEMPLATE_URL"
        }
      ],
      "name": "MIG_NAME",
      "instanceTemplate": "INSTANCE_TEMPLATE_URL",
      "targetSize": "TARGET_SIZE",
      "resourcePolicies": {
        "workloadPolicy": WORKLOAD_POLICY_URL
      }
    }
    
  • リージョン MIG を作成するには、regionInstanceGroupManagers.insert メソッドPOST リクエストを送信します。
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "instanceTemplate": "INSTANCE_TEMPLATE_URL",
        "targetSize": "TARGET_SIZE",
        "resourcePolicies": {
          "workloadPolicy": WORKLOAD_POLICY_URL
        }
      }
    
次のように置き換えます。
  • PROJECT_ID: プロジェクト ID。
  • ZONE: MIG を作成するゾーン。 ワークロード ポリシーのリージョン内のゾーンを指定します。
  • REGION: MIG を作成するリージョン。 ワークロード ポリシーと同じリージョンを指定します。
  • INSTANCE_TEMPLATE_URL: MIG でインスタンスの作成に使用するインスタンス テンプレートの URL。この URL には、インスタンス テンプレートの ID または名前を含めることができます。次のいずれかの値を指定します。
    • リージョン インスタンス テンプレートの場合: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • グローバル インスタンス テンプレートの場合: INSTANCE_TEMPLATE_ID
  • MIG_NAME: MIG の名前。
  • TARGET_SIZE: MIG に含めるインスタンスの数。 アクセラレータ トポロジが 1x72 の場合、ターゲット サイズを 18 に設定します。
  • WORKLOAD_POLICY_URL:ワークロード ポリシーの URL(例: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy)。

次のステップ