TPU Cluster Director の概要
TPU Cluster Director は、 Google Cloud AI アクセラレータを予約ベースで直接制御できるように設計されています。Cloud TPU の場合、Cluster Director の基本機能により、マルチテナント オファリングを超えて物理的に分離された TPU 容量を提供する新しいサービス階層が提供されます。
- 専用の物理的に同じ場所に配置された容量: 密度の高い同じ場所に配置された TPU 予約が提供されるようになり、最適なネットワーク パフォーマンスとワークロード スケジューリングを実現するためにハードウェアを完全に制御できるようになりました。
- 高度なメンテナンスと制御: メンテナンス イベントを正確に制御できます。特定の VM、キューブ、Pod、または予約全体をターゲットに設定し、これらのイベントの順序とペースを管理して、ビジネスへの影響を最小限に抑えることができます。
- トポロジ認識スケジューリング: ハードウェアの物理トポロジ、健全性、使用率を包括的に把握できるため、パフォーマンス重視のワークロード配置をよりスマートに行うことができます。
Cluster Director の基盤は Google Kubernetes Engine と完全に統合されています。この統合により、大規模な AI ワークロードを強化するいくつかの機能が提供されます。
- 効率、フォールト トレランス、復元力の向上 - 要求の厳しい AI タスクに堅牢な環境を提供します。
- トポロジを認識するノードプールとワークロードの配置。- 同一の場所にある高密度予約を使用すると、特定の Pod またはキューブをターゲットにできます。これにより、ワークロードのスケジュール設定をより細かく行うことができます。
GKE で Cluster Director の基盤を使用すると、ワークロードの使用率、パフォーマンス、スケーラビリティの向上、スループットと信頼性の向上、物理容量(ホストから GKE クラスタまで)の包括的なオブザーバビリティというメリットが得られます。
GKE の TPU Cluster Director 基盤は、新しい全容量モードの予約で使用できます。
すべての容量モード
以前は、TPU 容量は「マネージド」モードで提供されていました。このモードでは、Google が障害のある TPU マシンを自動的に置き換えますが、予約容量の一部を保持して、TPU スライスが再起動に必要なリソースを確保できるようにします。Google は、TPU の新しい容量モードとして「全容量」モードを導入しました。この容量モードでは、TPU ハードウェア トポロジ、使用率ステータス、予約済み容量の健全性ステータスを完全に把握できます。予約済みの容量全体にアクセスできますが、障害と計画メンテナンスの管理はお客様の責任となります。
全容量モードの主な機能は次のとおりです。
- 完全な制御と可視性: 予約済み容量を完全に制御し、ハードウェアの健全性とトポロジを完全に可視化できます。これにより、ホールドバックを含むすべての利用可能な容量を確認し、マシンの障害を直接管理できます。
- 専用容量: AI ワークロードで常に使用できる専用容量にアクセスできます。容量をすべて使用し、ホールドバックがないため、予測可能性が高く、割り当てが増加します。つまり、予約した TPU 容量をすべて使用できます。これで、優先度の低いワークロードを実行するために、ホールドバック容量にもアクセスできるようになりました。
- 最適化されたパフォーマンス: TPU All Capacity モードでは、大規模で密結合の ML ワークロードと HPC ワークロードに不可欠な、超低レイテンシ ネットワーキングによる大規模なアクセラレータ リソースの密なコロケーションが実現します。このアーキテクチャは、トレーニング ワークロードと推論ワークロードの両方でパフォーマンスを最大化するように最適化されています。
サポートされている TPU 世代
TPU の全容量モードと機能は、Trillium(tpu v6e)、TPU Ironwood(tpu7x)、および将来の TPU 世代で使用できます。以前の世代の TPU のサポートは予定されていません。
TPU Cluster Director の用語
Cluster Director のトポロジのコンセプトは、クラスタ、ブロック、サブブロック、ホストの 4 つのレベルで構成されています。クラスタは、Pod の倍数で物理 TPU 容量の Google デプロイ ユニットです。クラスタ内のすべての TPU 容量が 1 つのゾーン内にあります。全容量モードの TPU 予約は、常に 1 つのクラスタ内にあります。TPU の場合、残りのトポロジ コンセプトは、次の表に示すように物理コンポーネントにマッピングされます。
Trillium
| トポロジのコンセプト | Trillium | コア数 | チップ | ホスト |
|---|---|---|---|---|
| --- | チップ | 1 | 1 | なし |
| ホスト | ホスト | 8 | 8 | 1 |
| サブブロック | Trillium Pod | 256 | 256 | 32 |
| ブロック | 1 つの予約に複数の Trillium Pod(最大 16 個) | 最大 4,096 |
最大 4,096 |
最大 512 |
| --- | サブブロックで許可されるスライス | 1x1、2x2、2x4、4x4、4x8、8x8、8x16、16x16 | ||
| --- | 1 つの予約に複数のブロックを設定でき、各ブロックには 1 ~ 16 個の Trillium Pod を設定できます。 | |||
Trillium スライスのサイズについて詳しくは、Trillium でサポートされている構成をご覧ください。
Ironwood
| トポロジのコンセプト | Ironwood | コア数 | チップ | ホスト |
|---|---|---|---|---|
| --- | チップ | 2 | 1 | --- |
| ホスト | ホスト | 8 | 4 | 1 |
| SubBlock | キューブ | 128 | 64 | 16 |
| ブロック | 複数の Ironwood キューブ(最大で 1 つの Pod) | 最大 9,216(144 個のキューブ) | 最大 2,304 | |
| --- | ブロック内のスライス: 許可される例 | 1x1x1、2x2x1、2x2x2、2x4x4、4x4x4、8x8x8、16x8x8、16x16x8、12x24x24(その他多数) | ||
| --- | 予約には、1 つ以上の Ironwood キューブ(最大で Ironwood Pod 全体)を指定できます。 |
Ironwood スライスのサイズについては、TPUv7x でサポートされている構成をご覧ください。