Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

MIG 用のワークロードポリシーを作成する

このドキュメントでは、A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）、H4D Compute Engine インスタンスを使用するマネージドインスタンスグループ（MIG）のポリシーを作成する方法について説明します。ワークロードポリシーを作成するときに適用する要件と制限事項の詳細については、ワークロードポリシーについてをご覧ください。

ワークロードポリシーを使用すると、MIG 内の Compute Engine インスタンスの配置またはトポロジを指定できます。たとえば、ワークロードポリシーを使用して、コンピューティングインスタンスを互いに近い場所に配置し、AI、ML、HPC ワークロードのネットワークレイテンシを最小限に抑えることができます。

始める前に

まだ設定していない場合は、認証を設定します。認証では、 Google Cloud サービスと API にアクセスするための ID が確認されます。ローカル開発環境からコードまたはサンプルを実行するには、次のいずれかのオプションを選択して Compute Engine に対する認証を行います。
このページのサンプルをどのように使うかに応じて、タブを選択してください。
gcloud
1. Google Cloud CLI をインストールします。インストール後、初期化するには、次のコマンドを実行して Google Cloud CLI を初期化します。
  gcloud init
  外部 ID プロバイダ（IdP）を使用している場合は、まずフェデレーション ID を使用して gcloud CLI にログインする必要があります。
  
  注: すでに gcloud CLI をインストールしている場合は、gcloud components update を実行して最新バージョンがインストールされていることを確認してください。
デフォルトのリージョンとゾーンを設定します。

REST

このページの REST API サンプルをローカル開発環境で使用するには、 gcloud CLI に指定した認証情報を使用します。

Google Cloud CLI をインストールします。

外部 ID プロバイダ（IdP）を使用している場合は、まずフェデレーション ID を使用して gcloud CLI にログインする必要があります。

詳細については、 Google Cloud 認証ドキュメントの REST を使用して認証するをご覧ください。

必要なロール

ワークロードポリシーを作成して MIG に適用するために必要な権限を取得するには、プロジェクトに対するCompute インスタンス管理者（v1）（roles/compute.instanceAdmin.v1）IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールにはワークロードポリシーを作成して MIG に適用するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

ワークロードポリシーを作成して MIG に適用するには、次の権限が必要です。

ワークロードポリシーを作成するには: compute.resourcePolicies.create プロジェクトに対する

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

ワークロードポリシーの作成

ワークロードポリシーを作成するには、MIG 内のコンピューティングインスタンスが使用するマシンシリーズに応じて、次のいずれかの方法を使用します。

A4X Max インスタンスまたは A4X インスタンスのワークロードポリシーを作成する
A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）、H4D インスタンスのワークロードポリシーを作成する

A4X Max インスタンスまたは A4X インスタンスのワークロードポリシーを作成する

ワークロードポリシーを MIG 内の A4X Max インスタンスまたは A4X インスタンスに適用する場合は、ポリシーの作成時にアクセラレータトポロジ値を指定する必要があります。このアクションにより、ワークロードで大規模なノンブロッキングネットワークパフォーマンスを実現できます。

A4X Max インスタンスまたは A4X インスタンスのワークロードポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

A4X Max インスタンスまたは A4X インスタンスのワークロードポリシーを作成するには、 gcloud compute resource-policies create workload-policy コマンドと --accelerator-topology=1x72 フラグを使用します。

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --accelerator-topology=1x72 \
    --type=high-throughput \
    --region=REGION

次のように置き換えます。

WORKLOAD_POLICY_NAME: ワークロードポリシーの名前。
REGION: ワークロードポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。A4X Max マシンタイプまたは A4X マシンタイプを使用できるリージョンを確認するには、使用可能なリージョンとゾーンをご覧ください。

REST

A4X Max インスタンスまたは A4X インスタンスのワークロードポリシーを作成するには、POST request to the resourcePolicies.insert method を作成します。リクエストの本文に、1x72 に設定された acceleratorTopology フィールドを含めます。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies

{
  "name": "WORKLOAD_POLICY_NAME",
  "workloadPolicy": {
    "acceleratorTopology": "1x72",
    "type": "HIGH_THROUGHPUT"
  }
}

次のように置き換えます。

PROJECT_ID: ワークロードポリシーを作成するプロジェクトの ID。
REGION: ワークロードポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。A4X Max マシンタイプまたは A4X マシンタイプを使用できるリージョンを確認するには、使用可能なリージョンとゾーンをご覧ください。
WORKLOAD_POLICY_NAME: ワークロードポリシーの名前。

A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）、H4D インスタンスのワークロードポリシーを作成する

ワークロードポリシーを MIG 内の A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）、H4D インスタンスに適用する場合は、ポリシーの作成時に最大トポロジ距離値を指定することをおすすめします。このアクションにより、コンピューティングインスタンス間の配置が近くなります。ただし、指定する配置がコンパクトになるほど、コンピューティングインスタンスを作成するゾーンで使用できるリソースが少なくなる可能性があります。

A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）インスタンスのワークロードポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

ワークロードポリシーを作成するには、 gcloud compute resource-policies create workload-policy コマンドを使用します。MIG 内のコンピューティングインスタンスを配置する距離に応じて、コマンドに次のフラグを含めます。

コンピューティングインスタンスを互いに近い場所にベストエフォートで配置するには、--type=high-throughput フラグを含めます。
```
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --type=high-throughput \
    --region=REGION
```

コンピューティングインスタンスの配置をさらに制御するには、--max-topology-distance フラグと --type=high-throughput フラグを含めます。

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --max-topology-distance=TOPOLOGY_DISTANCE \
    --type=high-throughput \
    --region=REGION

次のように置き換えます。

WORKLOAD_POLICY_NAME: ワークロードポリシーの名前。
REGION: ワークロードポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。GPU マシンタイプを使用できるリージョンを確認するには、使用可能なリージョンとゾーンをご覧ください。
TOPOLOGY_DISTANCE: 最大トポロジ距離。最大距離を短くすると、VM の可用性が低下する可能性があります。次のいずれかの値を指定します。
- A4 インスタンスまたは H4D インスタンスを同じクラスタに配置するには: CLUSTER
- A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）、H4D インスタンスを同じブロックに配置するには: BLOCK
- A4、A3 Ultra、H4D インスタンスを同じサブブロックに配置するには: SUBBLOCK

REST

ワークロードポリシーを作成するには、POST リクエストを resourcePolicies.insert メソッドに送信します。MIG 内のコンピューティングインスタンスを配置する距離に応じて、リクエスト本文に次のフィールドを含めます。

コンピューティングインスタンスを互いに近い場所にベストエフォートで配置するには、リクエスト本文に type フィールドを含めます。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies

{
  "name": "WORKLOAD_POLICY_NAME",
  "workloadPolicy": {
    "type": "HIGH_THROUGHPUT"
  }
}

コンピューティングインスタンスの配置をさらに制御するには、リクエスト本文に maxTopologyDistance フィールドと type フィールドを含めます。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies

{
  "name": "WORKLOAD_POLICY_NAME",
  "workloadPolicy": {
    "maxTopologyDistance": "TOPOLOGY_DISTANCE",
    "type": "HIGH_THROUGHPUT"
  }
}

次のように置き換えます。

PROJECT_ID: ワークロードポリシーを作成するプロジェクトの ID。
REGION: ワークロードポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。GPU マシンタイプを使用できるリージョンを確認するには、使用可能なリージョンとゾーンをご覧ください。
WORKLOAD_POLICY_NAME: ワークロードポリシーの名前。
TOPOLOGY_DISTANCE: 最大トポロジ距離。最大距離を短くすると、VM の可用性が低下する可能性があります。次のいずれかの値を指定します。
- A4 インスタンスまたは H4D インスタンスを同じクラスタに配置するには: CLUSTER
- A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）、H4D インスタンスを同じブロックに配置するには: BLOCK
- A4、A3 Ultra、H4D インスタンスを同じサブブロックに配置するには: SUBBLOCK

MIG 用のワークロード ポリシーを作成する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

始める前に

gcloud

REST

必要なロール

必要な権限

ワークロード ポリシーの作成

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成する

gcloud

REST

A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）、H4D インスタンスのワークロード ポリシーを作成する

gcloud

REST

次のステップ

MIG 用のワークロードポリシーを作成する

ワークロードポリシーの作成

A4X Max インスタンスまたは A4X インスタンスのワークロードポリシーを作成する

A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）、H4D インスタンスのワークロードポリシーを作成する