Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

A4X を使用して AI 最適化 MIG を作成する

このドキュメントでは、A4X マシンタイプを使用するマネージドインスタンスグループ（MIG）の作成方法について説明します。このアクセラレータ最適化マシンタイプの詳細については、 A4X をご覧ください。

複数の仮想マシン（VM）を単一のエンティティとして管理する場合は、MIG を作成します。MIG の詳細については、Compute Engine のドキュメントのマネージドインスタンスグループをご覧ください。

VM またはクラスタを作成する他の方法については、デプロイオプションの概要をご覧ください。

制限事項

A4X VM を使用して MIG を作成する場合は、マシンタイプと MIG の両方の制限事項を考慮してください。

A4X VM の制限事項

次のマシン固有の制限が適用されます。

このマシンタイプを使用するインスタンスは、継続利用割引とフレキシブル確約利用割引の対象外となります。
インスタンスを作成できるのは、特定のリージョンとゾーンのみです。
Persistent Disk（リージョンまたはゾーン）は使用できません。 Google Cloud Hyperdisk のみを使用できます。
このマシンタイプは、NVIDIA Grace プラットフォームでのみ使用できます。
A4X ではマシンタイプの変更はサポートされていません。このマシンタイプに切り替える場合、またはこのマシンタイプから切り替える場合は、新しいインスタンスを作成する必要があります。
このマシンタイプでは Windows オペレーティングシステムを実行できません。サポートされている Linux オペレーティングシステムの一覧については、 GPU インスタンスでサポートされているオペレーティングシステムをご覧ください。
A4X インスタンスの場合、ethtool -S を使用して GPU ネットワーキングをモニタリングすると、_phy で終わる物理ポートカウンタは更新されません。これは、MRDMA 仮想関数（VF）アーキテクチャを使用するインスタンスの想定される動作です。詳細については、 MRDMA 関数とネットワークモニタリングツールをご覧ください。
A4X インスタンスは、以下をサポートしていません。
2026 年 2 月 4 日より前に作成された Hyperdisk ML ディスクを A4X マシンタイプに接続することはできません。

MIG の制限事項

A4X マシンタイプを使用して MIG を作成する場合、次の制限が適用されます。

RDMA ネットワーキングを使用するリージョン MIG を作成する場合、MIG は RDMA のネットワークプロファイルを設定したゾーンにのみ A4X インスタンスを作成できます。
MIG でインスタンスの柔軟性を構成することはできません。
ワークロードポリシーを MIG に適用すると、グループに A4X インスタンスが含まれている場合、MIG でポリシーを変更できません。ポリシーを変更するには、まず MIG のサイズを 0 に変更する必要があります。
プレースメントポリシーを指定するインスタンステンプレートを使用して、ワークロードポリシーを使用する MIG を作成することはできません。

予約にバインドされたプロビジョニングモデルを使用する必要があります。他のプロビジョニングモデルは対象外です。
サイズ変更リクエストを使用して A4X インスタンスを MIG に追加することはできません。インスタンスを追加するには、MIG のターゲットサイズを設定する必要があります。

始める前に

MIG を作成する前に、次の手順を完了します（まだ完了していない場合）。

使用オプションを選択する: 選択した使用オプションによって、GPU リソースの取得方法と使用方法が決まります。詳細については、使用オプションを選択するをご覧ください。
容量を取得する: 容量を取得するプロセスは、使用オプションごとに異なります。選択した使用オプションの容量を取得するプロセスについては、容量の概要をご覧ください。
注: A4X Max または A4X の容量をリクエストすると、すべての容量モードで取得されます。このモードは、A4X Max または A4X マシンタイプでサポートされている唯一の予約運用モードです。すべての容量モードの詳細については、予約運用モードをご覧ください。

必要なロール

MIG を作成するために必要な権限を取得するには、プロジェクトに対するCompute インスタンス管理者（v1）（roles/compute.instanceAdmin.v1）IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールには MIG の作成に必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

MIG を作成するには、次の権限が必要です。

MIG を作成する: compute.instanceGroupManagers.create プロジェクトに対する

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

A4X の基礎

A4X クラスタは、大規模でノンブロッキングのネットワークパフォーマンスを実現するために、ブロックとサブブロックの階層に編成されています。このトポロジを理解することは、容量を予約してワークロードをデプロイするうえで重要です。

A4X インスタンス: A4X インスタンスは、4 つの GPU が接続された単一の A4X マシンタイプです。
サブブロック: サブブロックは、A4X 容量の基本単位です。A4X の場合、サブブロックは 18 個の A4X インスタンス（72 個の GPU）で構成されます。これらのインスタンスは NVLink ドメインを形成し、マルチノード NVLink システムを使用して接続されます。1x72 トポロジを指定するワークロードポリシーを適用して、A4X サブブロックを作成します。
ブロック: A4X ブロックは 25 個のサブブロック（NVLink ドメイン）で構成され、合計で最大 450 個の A4X インスタンス（1,800 個の GPU）になります。サブブロックは、効率的なスケーリングのためにレール整列型です。各サブブロックには MIG が必要です。したがって、単一の A4X ブロックに対して 25 個の MIG を作成できます。

次の表に、A4X インスタンスでサポートされているトポロジオプションを示します。

トポロジ（`acceleratorTopology`）	GPU の数	インスタンス数
`1x72`	72	18

概要

A4X マシンタイプを使用して MIG を作成する手順は次のとおりです。

VPC ネットワークを作成する。
ワークロードポリシーを作成する。
インスタンステンプレートの作成
MIG を作成する

VPC ネットワークを作成する。

ヒント: 簡単なテストを設定する場合は、この手順をスキップして、代わりに単一の NIC --network-interface=nic-type=GVNIC を指定できます。

A4X マシンタイプのネットワークを設定するには、次のネットワークインターフェース用に 3 つの VPC ネットワークを作成します。

gVNIC ネットワークインターフェース（NIC）用の 2 つの標準 VPC ネットワーク。ホスト間通信に使用されます。
複数の A4X サブブロックを作成する場合は、CX-7 NIC 用の RoCE ネットワークプロファイルを持つ 1 つの VPC ネットワーク。 RoCE VPC ネットワークには、4 個のサブネット（ CX-7 NIC ごとに 1 個のサブネット）が必要です。これらの NIC は RDMA over Converged Ethernet（RoCE）を使用し、複数の A4X サブブロックへのスケールアウトに不可欠な高帯域幅で低レイテンシの通信を提供します。単一の A4X サブブロックの場合、単一のサブブロック内で GPU 間通信がマルチノード NVLink によって処理されるため、この VPC ネットワークをスキップできます。

NIC の配置の詳細については、ネットワーク帯域幅と NIC の配置を確認するをご覧ください。

手順ガイドに沿って、手動または自動（提供されたスクリプト）でネットワークを作成します。

手順ガイド

ネットワークを作成するには、次の操作を行います。

gVNIC の標準 VPC ネットワークを作成するには、Virtual Private Cloud ネットワークの作成と管理をご覧ください。
RoCE VPC ネットワークを作成するには、RDMA NIC 用の Virtual Private Cloud ネットワークを作成するをご覧ください。

これらの VPC ネットワークでは、最大伝送単位（MTU）をより大きい値に設定することをおすすめします。 A4X マシンタイプの場合、推奨される MTU は 8896 バイトです。他の GPU マシンタイプの推奨 MTU 設定を確認するには、 GPU マシンタイプの MTU 設定をご覧ください。

スクリプト

ネットワークを作成する手順は次のとおりです。

次のスクリプトを使用して、gVNIC の標準 VPC ネットワークを作成します。

  
    #!/bin/bash

    # Create regular VPC networks and subnets for the gVNICs
    for N in $(seq 0 1); do
      gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \
        --subnet-mode=custom \
        --mtu=8896

      gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \
        --network=GVNIC_NAME_PREFIX-net-$N \
        --region=REGION \
        --range=192.168.$N.0/24

      gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \
        --network=GVNIC_NAME_PREFIX-net-$N \
        --action=ALLOW \
        --rules=tcp:0-65535,udp:0-65535,icmp \
        --source-ranges=192.168.0.0/16
    done

    # Create SSH firewall rules
    gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \
      --network=GVNIC_NAME_PREFIX-net-0 \
      --action=ALLOW \
      --rules=tcp:22 \
      --source-ranges=IP_RANGE

    # Assumes that an external IP is only created for vNIC 0
    gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \
      --network=GVNIC_NAME_PREFIX-net-0 \
      --action=ALLOW \
      --rules=icmp \
      --source-ranges=IP_RANGE

複数の A4X サブブロックが必要な場合は、次のスクリプトを使用して、各 A4X インスタンスの 4 つの CX-7 NIC の RoCE VPC ネットワークとサブネットを作成します。

重要: デプロイが単一の A4X サブブロックのみで構成されている場合は、この手順をスキップできます。
```
  
    #!/bin/bash

    # List and make sure network profiles exist in the machine type's zone
    gcloud compute network-profiles list --filter "location.name=ZONE"

    # Create network for RDMA NICs
    gcloud compute networks create RDMA_NAME_PREFIX-mrdma \
      --network-profile=ZONE-vpc-roce \
      --subnet-mode custom \
      --mtu=8896

    # Create subnets
    for N in $(seq 0 3); do
      gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \
        --network=RDMA_NAME_PREFIX-mrdma \
        --region=REGION \
        --range=192.168.$((N+2)).0/24 # offset to avoid overlap with gVNICs
    done

  
```
次のように置き換えます。
- GVNIC_NAME_PREFIX: gVNIC の標準 VPC ネットワークとサブネットに使用するカスタム名の接頭辞。
- RDMA_NAME_PREFIX: CX-7 NIC の RoCE VPC ネットワークとサブネットに使用するカスタム名の接頭辞。
- ZONE: 使用するマシンタイプが使用可能なゾーン（us-central1-a など）を指定します。リージョンの詳細については、リージョンおよびゾーン別の GPU の可用性をご覧ください。
- REGION: サブネットを作成するリージョン。このリージョンは、指定したゾーンに対応している必要があります。たとえば、ゾーンが us-central1-a の場合、リージョンは us-central1 です。
- IP_RANGE: SSH ファイアウォールルールに使用する IP 範囲。
省略可: VPC ネットワークリソースが正常に作成されたことを確認するには、 Google Cloud コンソールでネットワーク設定を確認します。
1. Google Cloud コンソールで、[VPC ネットワーク] ページに移動します。
  [VPC ネットワーク] に移動
2. リストで、前の手順で作成したネットワークを検索します。
3. サブネット、ファイアウォールルール、その他のネットワーク設定を表示するには、ネットワークの名前をクリックします。

ワークロードポリシーの作成

テスト用に MIG に単一の A4X インスタンスを作成する場合は、この手順をスキップします。それ以外の場合は、ワークロードポリシーを作成して、A4X インスタンスを含む MIG を作成する必要があります。

ワークロードポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

ワークロードポリシーを作成するには、 gcloud compute resource-policies create workload-policy コマンドを使用します。

アクセラレータ間ネットワーク構成の場合は、コマンドで --accelerator-topology フラグを指定します。

A4X マシンタイプには次のコマンドを使用します。1x72 のアクセラレータトポロジは、72 個の GPU がブロック内の NVLink を介して接続されていることを示します。

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --type=high-throughput \
    --accelerator-topology=1x72 \
    --region=REGION

次のように置き換えます。

WORKLOAD_POLICY_NAME: ワークロードポリシーの名前。
REGION: ワークロードポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。リージョンの詳細については、リージョンおよびゾーン別の GPU の可用性をご覧ください。

REST

ワークロードポリシーを作成するには、POST リクエストを resourcePolicies.insert メソッドに送信します。

アクセラレータ間ネットワーク構成の場合は、リクエストで acceleratorTopology フィールドを指定します。

A4X マシンタイプには次のリクエストを行います。1x72 のアクセラレータトポロジは、72 個の GPU がブロック内の NVLink を介して接続されていることを示します。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
  {
    "name": "WORKLOAD_POLICY_NAME"
    "workloadPolicy": {
      "type": "HIGH_THROUGHPUT",
      "acceleratorTopology": "1x72"
    }
  }

次のように置き換えます。

PROJECT_ID: プロジェクト ID
REGION: ワークロードポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。リージョンの詳細については、リージョンおよびゾーン別の GPU の可用性をご覧ください。
WORKLOAD_POLICY_NAME: ワークロードポリシーの名前。

インスタンステンプレートの作成

インスタンステンプレートを作成して、MIG の VM プロパティを指定します。

インスタンステンプレートを作成するには、次のいずれかのオプションを選択します。

次のコマンドは、インスタンスのアクセススコープも設定します。権限管理を簡素化するには、インスタンスのアクセススコープを cloud-platform アクセスに設定し、IAM ロールを使用してインスタンスがアクセスできるサービスを定義することをおすすめします。詳細については、スコープのベストプラクティスをご覧ください。

gcloud

リージョンインスタンステンプレートを作成するには、 gcloud compute instance-templates create コマンドを使用します。

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=a4x-highgpu-4g \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --instance-template-region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address 
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE \
    --restart-on-failure

次のように置き換えます。

INSTANCE_TEMPLATE_NAME: インスタンステンプレートの名前。
IMAGE_FAMILY: 使用する OS イメージのイメージファミリー。サポート対象のオペレーティングシステムの一覧については、サポートされているオペレーティングシステムをご覧ください。
IMAGE_PROJECT: OS イメージのプロジェクト ID。
REGION: インスタンステンプレートを作成するリージョン。使用するマシンタイプが利用可能なリージョンを指定します。リージョンの詳細については、リージョンおよびゾーン別の GPU の可用性をご覧ください。
DISK_SIZE: ブートディスクのサイズ（GB）。
GVNIC_NAME_PREFIX: gVNIC NIC を使用する標準の VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
RDMA_NAME_PREFIX: RDMA NIC を使用する VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
RESERVATION: 予約名、ブロック、または予約内のサブブロック。予約名または使用可能なブロックを取得するには、予約容量を表示するをご覧ください。インスタンスの配置の要件に基づいて、次のいずれかを選択します。
- 任意の単一ブロックに A4X インスタンスを作成するには:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
    
```
- 特定のブロックに A4X インスタンスを作成するには:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    
```
- 特定のサブブロックに A4X インスタンスを作成するには:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
    
```
ヒント: 予約が現在のプロジェクトに存在する場合は、予約値の projects/RESERVATION_OWNER_PROJECT_ID/reservations/ を省略できます。

REST

リージョンインスタンステンプレートを作成するには、POST リクエストを regionInstanceTemplates.insert メソッドに送信します。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
  "name":"INSTANCE_TEMPLATE_NAME",
  "properties":{
    "machineType":"a4x-highgpu-4g",
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "serviceAccounts": [
      {
        "email": "default",
        "scopes": [
          "https://www.googleapis.com/auth/cloud-platform"
        ]
      }
    ],
    "networkInterfaces": [
      {
        "accessConfigs": [
          {
            "name": "external-nat",
            "type": "ONE_TO_ONE_NAT"
          }
        ],
        "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
        "nicType": "GVNIC",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
        "nicType": "GVNIC",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
      }
    ],
    "reservationAffinity":{
        "consumeReservationType":"SPECIFIC_RESERVATION",
        "key":"compute.googleapis.com/reservation-name",
        "values":[
          "RESERVATION"
        ]
      },
    "scheduling":{
        "provisioningModel":"RESERVATION_BOUND",
        "instanceTerminationAction":"DELETE",
        "onHostMaintenance": "TERMINATE",
        "automaticRestart":true
      }
  }
}

次のように置き換えます。

INSTANCE_TEMPLATE_NAME: インスタンステンプレートの名前。
IMAGE_FAMILY: 使用する OS イメージのイメージファミリー。サポート対象のオペレーティングシステムの一覧については、サポートされているオペレーティングシステムをご覧ください。
IMAGE_PROJECT: OS イメージのプロジェクト ID。
REGION: インスタンステンプレートを作成するリージョン。使用するマシンタイプが利用可能なリージョンを指定します。リージョンの詳細については、リージョンおよびゾーン別の GPU の可用性をご覧ください。
DISK_SIZE: ブートディスクのサイズ（GB）。
NETWORK_PROJECT_ID: ネットワークのプロジェクト ID。
GVNIC_NAME_PREFIX: gVNIC NIC を使用する標準の VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
REGION: サブネットワークのリージョン。
RDMA_NAME_PREFIX: RDMA NIC を使用する VPC ネットワークとサブネットの作成時に指定した名前の接頭辞。
RESERVATION: 予約名、ブロック、または予約内のサブブロック。予約名または使用可能なブロックを取得するには、予約容量を表示するをご覧ください。インスタンスの配置の要件に基づいて、次のいずれかを選択します。
- 任意の単一ブロックに A4X インスタンスを作成するには:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
    
```
- 特定のブロックに A4X インスタンスを作成するには:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    
```
- 特定のサブブロックに A4X インスタンスを作成するには:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
    
```
ヒント: 予約が現在のプロジェクトに存在する場合は、予約値の projects/RESERVATION_OWNER_PROJECT_ID/reservations/ を省略できます。

MIG を作成する

A4X マシンタイプを使用する場合は、ターゲットサイズを指定して MIG を作成する必要があります。

1x72 の GPU トポロジを取得するには、 18 個の A4X インスタンスを含む MIG を作成します。MIG を作成するときに、acceleratorTopology フィールドを指定するワークロードポリシーを適用します。ポリシーを適用すると、Compute Engine は NVLink ドメインを使用するために、1 つのサブブロックに 18 個の A4X インスタンスをすべて作成します。サブブロックに 18 個のインスタンスすべての容量がない場合、すぐに作成できないマネージドインスタンスは、容量が使用可能になるまで CREATING 状態のままになります。これらのマネージドインスタンスは、容量がある場合に MIG が作成するコンピューティングインスタンスを表します。

acceleratorTopology フィールドが 1x72 に設定されたワークロードポリシーを適用する場合、MIG に 18 個を超える A4X インスタンスを作成することはできません。 18 個を超えるインスタンスを指定すると、MIG の作成が失敗します。複数の NVLink ドメインを作成するには、ドメインごとに個別の MIG を作成し、各 MIG に同じワークロードポリシーを適用します。

MIG を作成するには、次のいずれかのオプションを選択します。

gcloud

指定したターゲットサイズで MIG を作成するには、 instance-groups managed create コマンドを使用します。

ゾーン MIG またはリージョン MIG を次のように作成します。

ゾーン MIG を作成するには、次のコマンドを使用します。

gcloud compute instance-groups managed create MIG_NAME \
  --template=INSTANCE_TEMPLATE_URL \
  --size=TARGET_SIZE \
  --workload-policy=WORKLOAD_POLICY_URL \
  --zone=ZONE

リージョン MIG を作成するには、次のコマンドを使用します。

gcloud compute instance-groups managed create MIG_NAME \
    --template=INSTANCE_TEMPLATE_URL \
    --size=TARGET_SIZE \
    --workload-policy=WORKLOAD_POLICY_URL \
    --region=REGION

次のように置き換えます。

MIG_NAME: MIG の名前。
INSTANCE_TEMPLATE_URL: MIG でインスタンスの作成に使用するインスタンステンプレートの URL。この URL には、インスタンステンプレートの ID または名前を含めることができます。次のいずれかの値を指定します。
- リージョンインスタンステンプレートの場合: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- グローバルインスタンステンプレートの場合: INSTANCE_TEMPLATE_ID
TARGET_SIZE: MIG に含めるインスタンスの数。アクセラレータトポロジが 1x72 の場合、ターゲットサイズを 18 に設定します。
WORKLOAD_POLICY_URL：ワークロードポリシーの URL（例: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy）。
ZONE: MIG を作成するゾーン。ワークロードポリシーのリージョン内のゾーンを指定します。
REGION: MIG を作成するリージョン。ワークロードポリシーと同じリージョンを指定します。リージョン MIG の場合は、リージョンの代わりに、 `--zones` フラグを使用してそのリージョンのゾーンを指定できます。

REST

指定したターゲットサイズで MIG を作成するには、POST リクエストを送信します。

ゾーン MIG またはリージョン MIG を次のように作成します。

ゾーン MIG を作成するには、instanceGroupManagers.insert メソッドに POST リクエストを送信します。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
{
  "versions": [
    {
      "instanceTemplate": "INSTANCE_TEMPLATE_URL"
    }
  ],
  "name": "MIG_NAME",
  "instanceTemplate": "INSTANCE_TEMPLATE_URL",
  "targetSize": "TARGET_SIZE",
  "resourcePolicies": {
    "workloadPolicy": WORKLOAD_POLICY_URL
  }
}

リージョン MIG を作成するには、regionInstanceGroupManagers.insert メソッドに POST リクエストを送信します。

  POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
  {
    "versions": [
      {
        "instanceTemplate": "INSTANCE_TEMPLATE_URL"
      }
    ],
    "name": "MIG_NAME",
    "instanceTemplate": "INSTANCE_TEMPLATE_URL",
    "targetSize": "TARGET_SIZE",
    "resourcePolicies": {
      "workloadPolicy": WORKLOAD_POLICY_URL
    }
  }

次のように置き換えます。

PROJECT_ID: プロジェクト ID。
ZONE: MIG を作成するゾーン。ワークロードポリシーのリージョン内のゾーンを指定します。
REGION: MIG を作成するリージョン。ワークロードポリシーと同じリージョンを指定します。
INSTANCE_TEMPLATE_URL: MIG でインスタンスの作成に使用するインスタンステンプレートの URL。この URL には、インスタンステンプレートの ID または名前を含めることができます。次のいずれかの値を指定します。
- リージョンインスタンステンプレートの場合: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- グローバルインスタンステンプレートの場合: INSTANCE_TEMPLATE_ID
MIG_NAME: MIG の名前。
TARGET_SIZE: MIG に含めるインスタンスの数。アクセラレータトポロジが 1x72 の場合、ターゲットサイズを 18 に設定します。
WORKLOAD_POLICY_URL：ワークロードポリシーの URL（例: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy）。

A4X を使用して AI 最適化 MIG を作成する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

制限事項

A4X VM の制限事項

MIG の制限事項

始める前に

必要なロール

必要な権限

A4X の基礎

概要

VPC ネットワークを作成する。

手順ガイド

スクリプト

ワークロード ポリシーの作成

gcloud

REST

インスタンス テンプレートの作成

gcloud

REST

MIG を作成する

gcloud

REST

次のステップ

A4X を使用して AI 最適化 MIG を作成する

ワークロードポリシーの作成

インスタンステンプレートの作成