このドキュメントでは、A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D Compute Engine インスタンスを使用するマネージド インスタンス グループ(MIG)のポリシーを作成する方法について説明します。ワークロード ポリシーを作成するときに適用する要件と制限事項の詳細については、 ワークロード ポリシーについて をご覧ください。
ワークロード ポリシーを使用すると、MIG 内の Compute Engine インスタンスの配置またはトポロジを指定できます。たとえば、ワークロード ポリシーを使用して、コンピューティング インスタンスを互いに近い場所に配置し、AI、ML、HPC ワークロードのネットワーク レイテンシを最小限に抑えることができます。
始める前に
-
まだ設定していない場合は、認証を設定します。認証では、 Google Cloud サービスと API にアクセスするための ID が確認されます。ローカル開発環境からコードまたはサンプルを実行するには、次のいずれかのオプションを選択して Compute Engine に対する認証を行います。
このページのサンプルをどのように使うかに応じて、タブを選択してください。
gcloud
-
Google Cloud CLI をインストールします。 インストール後、 初期化するには、次のコマンドを実行して Google Cloud CLI を初期化します。
gcloud init外部 ID プロバイダ(IdP)を使用している場合は、まず フェデレーション ID を使用して gcloud CLI にログインする必要があります。
-
- デフォルトのリージョンとゾーンを設定します。
REST
このページの REST API サンプルをローカル開発環境で使用するには、 gcloud CLI に指定した認証情報を使用します。
Google Cloud CLI をインストールします。
外部 ID プロバイダ(IdP)を使用している場合は、まず フェデレーション ID を使用して gcloud CLI にログインする必要があります。
詳細については、 Google Cloud 認証ドキュメントの REST を使用して認証する をご覧ください。
必要なロール
ワークロード ポリシーを作成して MIG に適用するために必要な権限を取得するには、プロジェクトに対するCompute インスタンス管理者(v1) (roles/compute.instanceAdmin.v1)IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。
この事前定義ロールには ワークロード ポリシーを作成して MIG に適用するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。
必要な権限
ワークロード ポリシーを作成して MIG に適用するには、次の権限が必要です。
-
ワークロード ポリシーを作成するには:
compute.resourcePolicies.createプロジェクトに対する
カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。
ワークロード ポリシーの作成
ワークロード ポリシーを作成するには、MIG 内のコンピューティング インスタンスが使用するマシンシリーズに応じて、次のいずれかの方法を使用します。
A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成する
ワークロード ポリシーを MIG 内の A4X Max インスタンスまたは A4X インスタンスに適用する場合は、ポリシーの作成時に アクセラレータ トポロジ値 を指定する必要があります。このアクションにより、ワークロードで大規模なノンブロッキング ネットワーク パフォーマンスを実現できます。
A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、次のいずれかのオプションを選択します。
gcloud
A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、
gcloud compute resource-policies create workload-policy コマンド
と --accelerator-topology=1x72 フラグを使用します。
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
次のように置き換えます。
WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。A4X Max マシンタイプまたは A4X マシンタイプを使用できる リージョンを確認するには、 使用可能なリージョンとゾーンをご覧ください。
REST
A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、POST
request to the
resourcePolicies.insert method を作成します。
リクエストの本文に、1x72 に設定された acceleratorTopology フィールドを含めます。
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
次のように置き換えます。
PROJECT_ID: ワークロード ポリシーを作成するプロジェクトの ID。REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。A4X Max マシンタイプまたは A4X マシンタイプを使用できる リージョンを確認するには、 使用可能なリージョンとゾーンをご覧ください。WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。
A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスのワークロード ポリシーを作成する
ワークロード ポリシーを MIG 内の A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスに適用する場合は、ポリシーの作成時に 最大トポロジ距離値 を指定することをおすすめします。このアクションにより、コンピューティング インスタンス間の配置が近くなります。ただし、指定する配置がコンパクトになるほど、コンピューティング インスタンスを作成するゾーンで使用できるリソースが少なくなる可能性があります。
A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)インスタンスのワークロード ポリシーを作成するには、次のいずれかのオプションを選択します。
gcloud
ワークロード ポリシーを作成するには、
gcloud compute resource-policies create workload-policy コマンドを使用します。MIG 内のコンピューティング インスタンスを配置する距離に応じて、コマンドに次のフラグを含めます。
コンピューティング インスタンスを互いに近い場所にベスト エフォートで配置するには、
--type=high-throughputフラグを含めます。gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGIONコンピューティング インスタンスの配置をさらに制御するには、
--max-topology-distanceフラグと--type=high-throughputフラグを含めます。gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
次のように置き換えます。
WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。GPU マシンタイプを使用できる リージョンを確認するには、 使用可能なリージョンとゾーンをご覧ください。TOPOLOGY_DISTANCE: 最大トポロジ距離。最大距離を短くすると、VM の可用性が低下する可能性があります。 次のいずれかの値を指定します。A4 インスタンスまたは H4D インスタンスを同じクラスタに配置するには:
CLUSTERA4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスを同じブロックに配置するには:
BLOCKA4、A3 Ultra、H4D インスタンスを同じサブブロックに配置するには:
SUBBLOCK
REST
ワークロード ポリシーを作成するには、POST リクエストを
resourcePolicies.insert メソッドに送信します。MIG 内のコンピューティング インスタンスを配置する距離に応じて、リクエスト本文に次のフィールドを含めます。
コンピューティング インスタンスを互いに近い場所にベスト エフォートで配置するには、リクエスト本文に
typeフィールドを含めます。POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }コンピューティング インスタンスの配置をさらに制御するには、リクエスト本文に
maxTopologyDistanceフィールドとtypeフィールドを含めます。POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
次のように置き換えます。
PROJECT_ID: ワークロード ポリシーを作成するプロジェクトの ID。REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。GPU マシンタイプを使用できる リージョンを確認するには、 使用可能なリージョンとゾーンをご覧ください。WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。TOPOLOGY_DISTANCE: 最大トポロジ距離。最大距離を短くすると、VM の可用性が低下する可能性があります。 次のいずれかの値を指定します。A4 インスタンスまたは H4D インスタンスを同じクラスタに配置するには:
CLUSTERA4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスを同じブロックに配置するには:
BLOCKA4、A3 Ultra、H4D インスタンスを同じサブブロックに配置するには:
SUBBLOCK
次のステップ
ワークロード ポリシーを作成したら、MIG に適用する方法を学習します。
ワークロード ポリシーを 置換、削除、消去する方法を学習する。