コンパクト プレースメント ポリシーとワークロード ポリシーの概要

このドキュメントでは、コンパクト プレースメント ポリシーとワークロード ポリシーの概要と比較について説明します。どちらのポリシーでも、ネットワーク レイテンシを最小限に抑えるように Compute Engine インスタンスの配置を構成できます。

デフォルトでは、コンピューティング インスタンスの場所はゾーンを指定するだけで管理します。将来の予約またはマネージド インスタンス グループ(MIG)のサイズ変更リクエストを使用して A4X、A4、A3 Ultra、A3 Mega、A3 High(8 GPU)マシンを取得すると、取得するコンピューティング インスタンスは高密度にコロケーションされます。ただし、インスタンス間のパフォーマンスを最適化するために、特定のコンピューティング インスタンスを近くに配置することが必要な場合があります。コンピューティング インスタンスをより近くに配置するには、コンピューティング インスタンスにコンパクト プレースメント ポリシーを適用するか、MIG にワークロード ポリシーを適用します。

コンピューティング インスタンスのコンパクト プレースメント ポリシー

スタンドアロン コンピューティング インスタンスまたは一括作成されたコンピューティング インスタンスにコンパクト プレースメント ポリシーを適用すると、Compute Engine は可能な限り互いに近接したコンピューティング インスタンスをベスト エフォートで作成しようとします。アプリケーションでネットワーク レイテンシを最小限に抑える必要がある場合は、コンパクト プレースメント ポリシーを作成するときに maxDistance フィールド(プレビュー)を指定します。

詳細については、Compute Engine のドキュメントのコンパクト プレースメント ポリシーについてをご覧ください。

MIG 用のワークロード ポリシー

ワークロード ポリシーを MIG に適用すると、MIG のコンピューティング インスタンスの配置と基盤となるインフラストラクチャを指定できます。A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)でワークロード ポリシーを使用すると、コンピューティング インスタンス間のネットワーク レイテンシを最小限に抑え、パフォーマンスを最適化できます。

MIG のコンピューティング インスタンスで使用されるマシンタイプに応じて、次の状況ではワークロード ポリシーが必要または省略可能です。

  • A4X Max インスタンスまたは A4X インスタンスのサブブロックをデプロイするには、ワークロード ポリシーが必要です。

  • A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)インスタンスを使用する場合、ワークロード ポリシーは省略可能です。

詳細については、Compute Engine のドキュメントの MIG のワークロード ポリシーについてをご覧ください。

コンパクト プレースメント ポリシーとワークロード ポリシーの比較

次の表に、コンパクト配置ポリシーとワークロード ポリシーの違いを示します。

コンパクト プレースメント ポリシー ワークロード ポリシー
ポリシーの使用量
  • スタンドアロン インスタンス
  • Bulk API を使用してデプロイされたインスタンス
マネージド インスタンス グループ(MIG)
サポートされているマシンタイプ A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High、A3 Edge、A2、G2
  • Flex Start の場合: A4 と A3 Ultra
  • スポットまたは予約の場合: A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)
グループ化のセマンティクス

Compute Engine は、同じコンパクト プレースメント ポリシーを使用するインスタンスを互いに近い位置に配置します。

ワークロードごとに異なるプレースメント ポリシーを使用することをおすすめします。異なるワークロードを実行するインスタンス間でプレースメント ポリシーを再利用すると、これらのインスタンスがすべて一緒に配置されます。このコロケーションにより、特定のワークロードをスケールアウトするときに、互いに近いインスタンスを作成することが困難になる可能性があります。

Compute Engine は、ワークロード ポリシーを使用する MIG のインスタンスをより近くに配置します。

異なるワークロードを実行する複数の MIG でワークロード ポリシーを再利用すると、インスタンスが個々の MIG にまとめられます。再利用は、インスタンスの各グループを互いに分離する必要がある大規模なトレーニング モデルに最適です。

コンピューティング インスタンスのコロケーション構成

ベスト エフォートのコンピューティング インスタンスのコロケーションを行うには、groupPlacementPolicy.collocation フィールドを COLLOCATED に設定します。

ベスト エフォートのコンピューティング インスタンスのコロケーションを行うには、workloadPolicy.type フィールドを HIGH_THROUGHPUT に設定します。

追加の構成
  • コンピューティング インスタンスの厳密な配置を行うには、maxDistance フィールドを指定します。
  • A4X などのパーティショニングをサポートする GPU ファミリーの場合は、gpuTopology フィールドを指定します。
  • コンピューティング インスタンスの厳密な配置を行うには、maxTopologyDistance フィールドを指定します。
  • A4X などのパーティショニングをサポートする GPU ファミリーの場合は、acceleratorTopology フィールドを指定します。

最大距離値の比較

最大距離の値を小さくすると、コンピューティング インスタンスが近接した位置に配置されますが、一部のコンピューティング インスタンスが作成されない可能性も高くなります。

次の表に、各最大距離値でサポートされているマシンシリーズとコンピューティング インスタンスの数を示します。

コンパクト プレースメント ポリシーの maxDistance ワークロード ポリシーの maxTopologyDistance 説明 サポートされているマシンシリーズ コンピューティング インスタンスの最大数
未指定(非推奨) 未指定(非推奨) Compute Engine は、コンピューティング インスタンスをできるだけ近くに配置しようとしますが、コンピューティング インスタンス間の最大距離はありません。 A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU) 1500
3 CLUSTER Compute Engine は、隣接するブロックにコンピューティング インスタンスを作成します。 A4 1,500
2 BLOCK Compute Engine は、同じブロックにコンピューティング インスタンスを作成します。 A4 と A3 Ultra
  • A4 インスタンスの場合: 150
  • A3 Ultra、A3 Mega、A3 High(8 個の GPU)インスタンスの場合: 256
1 SUBBLOCK Compute Engine は、同じサブブロックにコンピューティング インスタンスを作成します。 A4 と A3 Ultra 22

次のステップ