A4X Max を使用して AI 最適化 MIG を作成する

このドキュメントでは、A4X Max アクセラレータ最適化マシンタイプを使用するマネージド インスタンス グループ(MIG)の作成方法について説明します。コンピューティング インスタンスと クラスタの作成オプションについては、 デプロイ オプションの概要 ページをご覧ください。

A4X Max インスタンス タイプ

Compute Engine インスタンス(コンピューティング インスタンス)は、Google のインフラストラクチャでホストされるコンピューティング リソース で、仮想マシン(VM)または ベアメタル インスタンスのいずれかです。A4X Max インスタンスは ベアメタル インスタンスとして使用できます。これは、 基盤となる物理ハードウェアへの直接アクセス(仮想化なし)を提供する点で VM インスタンスとは異なります。A4X Max マシンタイプの詳細については、Compute Engine ドキュメントの A4X Max シリーズ をご覧ください。

複数の A4X Max インスタンスを単一のエンティティとして管理する場合は、MIG を作成します。MIG の詳細については、Compute Engine ドキュメントの マネージド インスタンス グループ をご覧ください。

制限事項

A4X Max マシンタイプを使用して MIG を作成する場合、次の制限が適用されます。

  • RDMA ネットワーキングを使用するリージョン MIG を作成する場合、MIG は RDMA のネットワーク プロファイルを構成したゾーンにのみ A4X Max インスタンスを作成できます

  • MIG で インスタンスの柔軟性 を構成することはできません。

  • ワークロード ポリシーを MIG に適用すると、グループに A4X Max インスタンスが含まれている場合、MIG でポリシーを変更できません。ポリシーを変更するには、まず MIG のサイズをゼロに変更 する必要があります。

  • プレースメント ポリシーを指定するインスタンス テンプレートを使用して、ワークロード ポリシーを使用する MIG を作成することはできません。

  • 予約にバインドされた プロビジョニング モデルを使用する必要があります。他のプロビジョニング モデルは対象外です。

  • サイズ変更リクエストを使用して、A4X Max インスタンスを MIG に追加することはできません。インスタンスを追加するには、MIG のターゲット サイズを設定する必要があります。

始める前に

MIG を作成する前に、次の手順を完了します。

  1. 使用オプションを選択する: 選択した使用オプションによって、GPU リソースの取得方法 と使用方法が決まります。

    詳細については、使用オプションを選択するをご覧ください。

  2. 容量を取得する: 容量を取得するプロセスは、使用オプションごとに異なります。

    選択した使用オプションの容量を取得するプロセスについては、 容量の概要をご覧ください。

必要なロール

MIG を作成するために必要な権限を取得するには、プロジェクトに対するCompute インスタンス管理者(v1) roles/compute.instanceAdmin.v1)IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールには MIG の作成に必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

MIG を作成するには、次の権限が必要です。

  • MIG を作成する: compute.instanceGroupManagers.create プロジェクトに対する

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

A4X Max の基本

A4X Max クラスタは、大規模でノンブロッキングのネットワーク パフォーマンスを実現するために、ブロックとサブブロックの階層に編成されています。このトポロジを理解することは、容量を予約してワークロードをデプロイするうえで重要です。

A4X Max インスタンス
A4X Max インスタンスは、4 つの GPU が接続された単一の A4X Max マシンタイプです。
サブブロック
サブブロックは、A4X Max 容量の基本単位です。A4X Max の場合、サブブロックは 18 個の A4X Max インスタンス(72 個の GPU)で構成されます。これらのインスタンスは NVLink ドメインを形成し、マルチノード NVLink システムを使用して接続されます。1x72 トポロジを指定するワークロード ポリシーを適用して、A4X Max サブブロックを作成します。
ブロック
A4X Max ブロックは、25 個のサブブロック(NVLink ドメイン)で構成され、合計で最大 450 個の A4X Max インスタンス(1,800 個の GPU)になります。サブブロックは、効率的なスケーリングのためにレール整列型です。各サブブロックには MIG が必要です。 したがって、単一の A4X Max ブロックに対して 25 個の MIG を作成できます。

次の表に、A4X Max インスタンスでサポートされているトポロジ オプションを示します。

トポロジ(acceleratorTopology GPU の数 インスタンス数
1x72 72 18

概要

A4X Max マシンタイプを使用して MIG を作成する手順は次のとおりです。

  1. VPC ネットワークを作成する。
  2. ワークロード ポリシーを作成する
  3. インスタンス テンプレートの作成
  4. MIG を作成する

VPC ネットワークを作成する。

A4X Max マシンタイプのネットワークを設定するには、次のネットワーク インターフェース用に 2 つの VPC ネットワークを作成します。

  • IDPF ネットワーク インターフェース(NIC)用の 2 つのサブネットがある 1 つの標準 VPC ネットワーク。ホスト間通信に使用されます。
  • 複数の A4X Max サブブロックを作成する場合は、CX-8 NIC 用の RoCE ネットワーク プロファイル を持つ 1 つの VPC ネットワーク。RoCE VPC ネットワークは、自動的に提供される default-subnet-1-RDMA_NAME_PREFIX-net という名前の単一のサブネットを使用し、8 つの CX-8 NIC すべてがこのサブネットを使用します。これらの NIC は RDMA over Converged Ethernet(RoCE)を使用し、 複数の A4X Max サブブロックへの スケールアウトに不可欠な高帯域幅で低レイテンシの通信を提供します。単一の A4X Max サブブロックの場合、 単一のサブブロック内で GPU 間通信がマルチノード NVLink によって処理されるため、この VPC ネットワークをスキップできます。

NIC の配置の詳細については、 ネットワーク帯域幅と NIC の配置を確認するをご覧ください。

手順ガイドに沿って、手動または自動(提供されたスクリプト)でネットワークを作成します。

手順ガイド

ネットワークを作成するには、次の操作を行います。

これらの VPC ネットワークでは、 最大伝送単位(MTU)をより大きい値に設定することをおすすめします。 A4X Max マシンタイプの場合、推奨される MTU は 8896 バイトです。 他の GPU マシンタイプの推奨 MTU 設定を確認するには、 GPU マシンタイプの MTU 設定をご覧ください。

スクリプト

ネットワークを作成する手順は次のとおりです。

これらの VPC ネットワークでは、 最大伝送単位(MTU)をより大きい値に設定することをおすすめします。 A4X Max マシンタイプの場合、推奨される MTU は 8896 バイトです。 他の GPU マシンタイプの推奨 MTU 設定を確認するには、 GPU マシンタイプの MTU 設定をご覧ください。

  1. 次のスクリプトを使用して、IDPF NIC の標準 VPC ネットワークを作成します。

      
        #!/bin/bash
    
        # Create regular VPC network for the IDPF NICs
        gcloud compute networks create IDPF_NETWORK_PREFIX-net \
          --subnet-mode=custom \
          --mtu=8896 \
          --enable-ula-internal-ipv6
    
        # Create subnets for the IDPF NICs
        for N in $(seq 0 1); do
          gcloud compute networks subnets create IDPF_NETWORK_PREFIX-$N \
            --network=IDPF_NETWORK_PREFIX-net \
            --region=REGION \
            --stack-type=IPV6_ONLY \
            --ipv6-access-type=INTERNAL
        done
    
        gcloud compute firewall-rules create IDPF_NETWORK_PREFIX-internal \
          --network=IDPF_NETWORK_PREFIX-net \
          --action=ALLOW \
          --rules=tcp:0-65535,udp:0-65535,58 \
          --source-ranges=IP_RANGE
    
    
      
  2. 複数の A4X Max サブブロックが必要な場合は、次のスクリプトを使用して、 RoCE VPC ネットワークとサブネットを各 A4X Max インスタンスの 4 つの CX-8 NIC 用に作成します。

      
        #!/bin/bash
    
        # List and make sure network profiles exist in the machine type's zone
        gcloud compute network-profiles list --filter "location.name=ZONE"
    
        # Create network for RDMA NICs
        gcloud compute networks create RDMA_NAME_PREFIX-net \
          --network-profile=ZONE-vpc-roce-metal \
          --subnet-mode custom \
          --mtu=8896
    
        # For RoCE VPC networks for bare metal instances, a single subnet named
        # default-subnet-1-RDMA_NAME_PREFIX-net is automatically provided.
        # For more details, see https://cloud.google.com/vpc/docs/rdma-network-profiles.
    
      

    次のように置き換えます。

    • IDPF_NETWORK_PREFIX: IDPF NIC の標準 VPC ネットワークとサブネットに使用するカスタム名の接頭辞。
    • RDMA_NAME_PREFIX: CX-8 NIC の RoCE VPC ネットワークとサブネットに使用するカスタム名の接頭辞。
    • ZONE: 使用するマシンタイプが使用可能なゾーン(us-central1-a など)を指定します。リージョンの詳細については、リージョンおよびゾーン別の GPU の可用性をご覧ください。
    • REGION: サブネットを作成するリージョン。このリージョンは、指定したゾーンに対応している必要があります。たとえば、ゾーンが us-central1-a の場合、リージョンは us-central1 です。
    • IP_RANGE: SSH ファイアウォール ルールに使用する IP 範囲。
  3. 省略可: VPC ネットワーク リソースが正常に作成されたことを確認するには、 Google Cloud コンソールでネットワーク設定を確認します。
    1. Google Cloud コンソールで、[VPC ネットワーク] ページに移動します。

      [VPC ネットワーク] に移動

    2. リストで、前の手順で作成したネットワークを検索します。
    3. サブネット、ファイアウォール ルール、その他のネットワーク設定を表示するには、ネットワークの名前をクリックします。

ワークロード ポリシーの作成

ワークロード ポリシーは、作成後に更新することはできません。ワークロード ポリシーを変更するには、新しいポリシーを作成する必要があります。

ワークロード ポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

ワークロード ポリシーを作成するには、 gcloud compute resource-policies create workload-policy コマンドを使用します。

アクセラレータ間ネットワーク構成の場合は、コマンドで --accelerator-topology フラグを指定します。

A4X Max マシンタイプには、次のコマンドを使用します。1x72 のアクセラレータ トポロジは、ブロック内の NVLink を介して接続された 72 個の GPU を示します。

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --type=high-throughput \
    --accelerator-topology=1x72 \
    --region=REGION

次のように置き換えます。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。
  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。リージョンの詳細については、 リージョンおよびゾーン別の GPU の可用性をご覧ください。

REST

ワークロード ポリシーを作成するには、POST リクエストを resourcePolicies.insert メソッドに送信します。

アクセラレータ間ネットワーク構成の場合は、リクエストで acceleratorTopology フィールドを指定します。

A4X Max マシンタイプには、次のリクエストを行います。1x72 のアクセラレータ トポロジは、ブロック内の NVLink を介して接続された 72 個の GPU を示します。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
  {
    "name": "WORKLOAD_POLICY_NAME"
    "workloadPolicy": {
      "type": "HIGH_THROUGHPUT",
      "acceleratorTopology": "1x72"
    }
  }

次のように置き換えます。

  • PROJECT_ID: プロジェクト ID
  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。リージョンの詳細については、 リージョンおよびゾーン別の GPU の可用性をご覧ください。
  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

インスタンス テンプレートの作成

インスタンス テンプレートを作成して、MIG のインスタンス プロパティを指定します。

インスタンス テンプレートを作成するには、次のいずれかのオプションを選択します。

次のコマンドは、インスタンスのアクセス スコープも設定します。権限管理を簡素化するには、インスタンスのアクセス スコープを cloud-platform アクセスに設定し、IAM ロールを使用してインスタンスがアクセスできるサービスを定義することをおすすめします。詳細については、スコープのベスト プラクティスをご覧ください。

gcloud

リージョン インスタンス テンプレートを作成するには、 gcloud compute instance-templates create コマンドを使用します。

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=a4x-maxgpu-4g-metal \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --instance-template-region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=IDPF,network=IDPF_NETWORK_PREFIX-net,stack-type=IPV6_ONLY,subnet=IDPF_NETWORK_PREFIX-sub-0 \
    --network-interface=nic-type=IDPF,network=IDPF_NETWORK_PREFIX-net,stack-type=IPV6_ONLY,subnet=IDPF_NETWORK_PREFIX-sub-1,no-address \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE \
    --restart-on-failure

次のように置き換えます。

  • INSTANCE_TEMPLATE_NAME: インスタンス テンプレートの名前。
  • IMAGE_FAMILY: 使用する OS イメージのイメージ ファミリー。 サポート対象のオペレーティング システムの一覧については、サポートされているオペレーティング システムをご覧ください。
  • IMAGE_PROJECT: OS イメージのプロジェクト ID。
  • REGION: インスタンス テンプレートを作成するリージョン。 使用するマシンタイプが利用可能なリージョンを指定します。 リージョンの詳細については、 リージョンおよびゾーン別の GPU の可用性をご覧ください。
  • DISK_SIZE: ブートディスクのサイズ(GB)。
  • IDPF_NETWORK_PREFIX: IDPF NIC を使用する VPC ネットワークとサブネットの作成時に指定した名前の接頭辞 。
  • RDMA_NAME_PREFIX: RDMA NIC を使用する VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
  • RESERVATION: 予約名、ブロック、または 予約内のサブブロック。予約名または使用可能なブロックを取得するには、予約容量を表示するをご覧ください。インスタンスの配置の要件に基づいて、次のいずれかを選択します。
    • 任意の単一ブロックに A4X Max インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
          
    • 特定のブロックに A4X Max インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
          
    • 特定のサブブロックに A4X Max インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
          

REST

リージョン インスタンス テンプレートを作成するには、POST リクエストを regionInstanceTemplates.insert メソッドに送信します。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
  "name":"INSTANCE_TEMPLATE_NAME",
  "properties":{
    "machineType":"a4x-maxgpu-4g-metal",
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "serviceAccounts": [
      {
        "email": "default",
        "scopes": [
          "https://www.googleapis.com/auth/cloud-platform"
        ]
      }
    ],
    "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/IDPF_NETWORK_PREFIX-net",
      "nicType": "IDPF",
      "stackType": "IPV6_ONLY",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/IDPF_NETWORK_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/IDPF_NETWORK_PREFIX-net",
      "nicType": "IDPF",
      "stackType": "IPV6_ONLY",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/IDPF_NETWORK_PREFIX-sub-1"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    }
  ],
    "reservationAffinity":{
        "consumeReservationType":"SPECIFIC_RESERVATION",
        "key":"compute.googleapis.com/reservation-name",
        "values":[
          "RESERVATION"
        ]
      },
    "scheduling":{
        "provisioningModel":"RESERVATION_BOUND",
        "instanceTerminationAction":"DELETE",
        "onHostMaintenance": "TERMINATE",
        "automaticRestart":true
      }
  }
}

次のように置き換えます。

  • INSTANCE_TEMPLATE_NAME: インスタンス テンプレートの名前。
  • IMAGE_FAMILY: 使用する OS イメージのイメージ ファミリー。 サポート対象のオペレーティング システムの一覧については、サポートされているオペレーティング システムをご覧ください。
  • IMAGE_PROJECT: OS イメージのプロジェクト ID。
  • REGION: インスタンス テンプレートを作成するリージョン。 使用するマシンタイプが利用可能なリージョンを指定します。 リージョンの詳細については、 リージョンおよびゾーン別の GPU の可用性をご覧ください。
  • DISK_SIZE: ブートディスクのサイズ(GB)。
  • NETWORK_PROJECT_ID: ネットワークのプロジェクト ID。
  • IDPF_NETWORK_PREFIX: IDPF NIC を使用する VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
  • REGION: サブネットワークのリージョン。
  • RDMA_NAME_PREFIX: RDMA NIC を使用する VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
  • RESERVATION: 予約名、ブロック、または 予約内のサブブロック。予約名または使用可能なブロックを取得するには、予約容量を表示するをご覧ください。インスタンスの配置の要件に基づいて、次のいずれかを選択します。
    • 任意の単一ブロックに A4X Max インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
          
    • 特定のブロックに A4X Max インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
          
    • 特定のサブブロックに A4X Max インスタンスを作成するには:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
          

MIG を作成する

A4X Max マシンタイプを使用して MIG を作成する場合は、MIG のターゲット サイズを使用してインスタンス数を指定します。MIG の作成時に、ターゲット サイズを必要なインスタンス数に設定するか、ゼロから始めて後で増やすことができます。サイズ変更リクエストを使用して、A4X Max MIG にインスタンスを追加することはできません。

1x72 の GPU トポロジを取得するには、18 個の A4X Max インスタンスで MIG を作成します。MIG を作成するときに、acceleratorTopology フィールドを指定するワークロード ポリシーを適用します。ポリシーを適用すると、Compute Engine は 1 つのサブブロックに 18 個の A4X Max インスタンスをすべて作成して、NVLink ドメインを使用します。 サブブロックに 18 個のインスタンスすべての容量がない場合、すぐに作成できない マネージド インスタンス は、容量 が使用可能になるまで CREATING 状態のままになります。これらのマネージド インスタンスは、容量がある場合に MIG が作成するコンピューティング インスタンスを表します。

acceleratorTopology フィールドが 1x72 に設定されたワークロード ポリシーを適用すると、MIG で 18 個を超える A4X Max インスタンスを作成することはできません。 18 個を超えるインスタンスを指定すると、MIG の作成が失敗します。複数の NVLink ドメインを作成するには、ドメインごとに個別の MIG を作成し、各 MIG に同じワークロードポリシーを適用します。

MIG を作成するには、次のいずれかのオプションを選択します。

gcloud

指定したターゲット サイズで MIG を作成するには、 instance-groups managed create コマンドを使用します。

ゾーン MIG またはリージョン MIG を次のように作成します。

  • ゾーン MIG を作成するには、次のコマンドを使用します。
    gcloud compute instance-groups managed create MIG_NAME \
      --template=INSTANCE_TEMPLATE_URL \
      --size=TARGET_SIZE \
      --workload-policy=WORKLOAD_POLICY_URL \
      --zone=ZONE
    
  • リージョン MIG を作成するには、次のコマンドを使用します。
    gcloud compute instance-groups managed create MIG_NAME \
        --template=INSTANCE_TEMPLATE_URL \
        --size=TARGET_SIZE \
        --workload-policy=WORKLOAD_POLICY_URL \
        --region=REGION
    
次のように置き換えます。
  • MIG_NAME: MIG の名前。
  • INSTANCE_TEMPLATE_URL: MIG でインスタンスの作成に使用するインスタンス テンプレートの URL。この URL には、インスタンス テンプレートの ID または名前を含めることができます。次のいずれかの値を指定します。
    • リージョン インスタンス テンプレートの場合: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • グローバル インスタンス テンプレートの場合: INSTANCE_TEMPLATE_ID
  • TARGET_SIZE: MIG に含めるインスタンスの数。
  • WORKLOAD_POLICY_URL: 省略可。 ワークロード ポリシーの URL。例: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy。ワークロード ポリシーを使用しない場合は、--workload-policy フラグを削除できます。
  • ZONE: MIG を作成するゾーン。 ワークロード ポリシーを使用する場合は、ポリシーのリージョン内のゾーンを指定します。
  • REGION: MIG を作成するリージョン。ワークロード ポリシーを使用する場合は、ポリシーと同じリージョンを指定します。リージョン MIG の場合は、リージョンの代わりに、--zones フラグを使用してそのリージョンのゾーンを指定できます。

REST

指定したターゲット サイズで MIG を作成するには、POST リクエストを送信します。

ゾーン MIG またはリージョン MIG を次のように作成します。

  • ゾーン MIG を作成するには、instanceGroupManagers.insert メソッドPOST リクエストを送信します。
    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
    {
      "versions": [
        {
          "instanceTemplate": "INSTANCE_TEMPLATE_URL"
        }
      ],
      "name": "MIG_NAME",
      "instanceTemplate": "INSTANCE_TEMPLATE_URL",
      "targetSize": "TARGET_SIZE",
      "resourcePolicies": {
        "workloadPolicy": WORKLOAD_POLICY_URL
      }
    }
    
  • リージョン MIG を作成するには、regionInstanceGroupManagers.insert メソッドPOST リクエストを送信します。
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "instanceTemplate": "INSTANCE_TEMPLATE_URL",
        "targetSize": "TARGET_SIZE",
        "resourcePolicies": {
          "workloadPolicy": WORKLOAD_POLICY_URL
        }
      }
    
次のように置き換えます。
  • PROJECT_ID: プロジェクト ID。
  • ZONE: MIG を作成するゾーン。 ワークロード ポリシーのリージョン内のゾーンを指定します。
  • REGION: MIG を作成するリージョン。 ワークロード ポリシーと同じリージョンを指定します。
  • INSTANCE_TEMPLATE_URL: MIG でインスタンスの作成に使用するインスタンス テンプレートの URL。この URL には、インスタンス テンプレートの ID または名前を含めることができます。次のいずれかの値を指定します。
    • リージョン インスタンス テンプレートの場合: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • グローバル インスタンス テンプレートの場合: INSTANCE_TEMPLATE_ID
  • MIG_NAME: MIG の名前。
  • TARGET_SIZE: MIG に含めるインスタンスの数。
  • WORKLOAD_POLICY_URL: 省略可。 ワークロード ポリシーの URL。例: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy.

次のステップ