デプロイ オプションの概要

AI、ML、HPC のワークロードを実行するには、AI 最適化 VM と A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)マシンのクラスタをデプロイします。大規模な AI/ML クラスタを実行できるこれらのマシンの機能の詳細については、クラスタ管理の概要をご覧ください。

A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)VM は、Compute Engine から直接作成することも、Compute Engine インスタンスで実行される Cluster Toolkit や Google Kubernetes Engine などの他のサービスを介して作成することもできます。

ユースケースに適した VM またはクラスタを作成するには、次のいずれかを選択します。

オプション ユースケース
Cluster Director Slurm クラスタの設定と構成を自動化するフルマネージド サービスが必要である。Cluster Director を使用すると、クラスタのコンピューティング、ネットワーキング、ストレージ リソースを構成して、パフォーマンスを最大化し、ダウンタイムを最小限に抑えることができます。詳細については、テンプレートに基づいて AI 最適化クラスタを作成するをご覧ください。
Cluster Toolkit

Slurm クラスタと GKE クラスタの両方をデプロイするプロセスを簡素化するオープンソース ソフトウェアを使用したい。Cluster Toolkit は、高度なカスタマイズと拡張ができるように設計されています。詳細については、以下をご覧ください。

GKE ワークロードのニーズに基づいて Google Kubernetes Engine クラスタを構成する際に、最大限の柔軟性を確保したい。詳細については、AI に最適化されたカスタム Google Kubernetes Engine クラスタを作成するをご覧ください。
Compute Engine を使用する

独自のオーケストレーターを設定できるように、インフラストラクチャ レイヤを完全に制御したい。詳細については、以下をご覧ください。