用語

AI ハイパーコンピュータの操作では、次の用語がよく使用されます。

ブロック
ノンブロッキング ファブリックで相互接続されたサブブロックの集合。すべてのホスト間の高帯域幅接続を提供します。

クラスタ
高速ネットワーク ファブリックで相互接続されたブロックのコレクション。各クラスタはグローバルに一意です。A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)マシンでは、クラスタはアクセラレータ容量のブロックに共通のノンブロッキング ネットワーク ファブリックを提供します。クラスタ内では、東から西へのネットワーキングはブロックのコレクション全体でブロックされません。

高密度デプロイ
アクセラレータ リソースを物理的に互いに近い場所に割り当て、ネットワーク ホップを最小限に抑え、レイテンシを最小限にするように最適化するリソース リクエスト。

ネットワーク ファブリック
ネットワーク ファブリックは、クラスタ内のすべてのブロックと Google Cloud サービスに高帯域幅で低レイテンシの接続を提供します。Jupiter は、ソフトウェア定義ネットワーキングと光回路スイッチを使用してネットワークを進化させ、パフォーマンスを最適化する Google のデータセンター ネットワーク アーキテクチャです。

ノードまたはホスト
データセンター内の単一の物理サーバーマシン。各ホストには、アクセラレータなどのコンピューティング リソースが関連付けられています。これらのコンピューティング リソースの数と構成は、マシン ファミリーによって異なります。Compute Engine インスタンスは物理ホスト上にプロビジョニングされます。

NVLink ドメイン(サブブロックとも呼ばれます)は、A4X Max マシンと A4X マシンの容量のコア単位です。NVLink ドメインは、マルチノード NVLink システムで接続された 18 個の A4X Max インスタンスまたは A4X インスタンス(72 個の GPU)で構成されます。

サブブロック
単一の物理ラックにあるホストと関連する接続ハードウェアのグループ。A4X Max マシンと A4X マシンのコンテキストでは、サブブロックは NVLink ドメインとも呼ばれます。

詳細

次のドキュメントでは、対応するトピックに関連する用語について詳しく説明しています。