Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

GPU マシンタイプ

このドキュメントでは、AI Hypercomputer がサポートする GPU マシンシリーズについて説明します。これらのマシンシリーズを使用して、AI、ML、ハイパフォーマンスコンピューティング（HPC）のワークロードを実行する Compute Engine インスタンスとクラスタを作成できます。

AI Hypercomputer で GPU を使用するには、アクセラレータ最適化マシンファミリーのほとんどのマシンシリーズを使用できます。アクセラレータ最適化マシンファミリーの各マシンシリーズは、特定の GPU モデルを使用します。アクセラレータ最適化マシンファミリーの詳細については、アクセラレータ最適化マシンファミリーをご覧ください。

次のセクションでは、AI Hypercomputer がサポートするアクセラレータ最適化マシンシリーズについて説明します。

A4X Max シリーズと A4X シリーズ

このセクションでは、A4X Max マシンシリーズと A4X マシンシリーズで使用可能な構成について説明します。これらのマシンシリーズの詳細については、Compute Engine ドキュメントの A4X および A4X Max アクセラレータ最適化マシンシリーズをご覧ください。

A4X Max（ベアメタル）

A4X Max マシンタイプは、NVIDIA GB300 Grace Blackwell Ultra Superchip（nvidia-gb300）を使用しており、基盤モデルのトレーニングとサービングに最適です。A4X Max マシンタイプは、ベアメタルインスタンスとして使用できます。

A4X Max は、 NVIDIA GB300 NVL72 に基づくエクサスケールプラットフォームです。各マシンには、Arm Neoverse V2 コアの NVIDIA Grace CPU を搭載した 2 つのソケットがあります。これらの CPU は、高速チップ間（NVLink-C2C）通信対応の 4 つの NVIDIA B300 Blackwell GPU に接続されています。

						アタッチされた NVIDIA GB300 Grace Blackwell Ultra Superchip
マシンタイプ	vCPU 数¹	インスタンスのメモリ（GB）	アタッチされたローカル SSD（GiB）	物理 NIC の数	最大ネットワーク帯域幅（Gbps）²	GPU 数	GPU メモリ³ （GB HBM3e）
`a4x-maxgpu-4g-metal`	144	960	12,000	6	3,600	4	1,116

¹vCPU は、利用可能な CPU プラットフォームのいずれかで単一のハードウェアハイパースレッドとして実装されます。
² 最大下り（外向き）帯域幅は許容数を超えることはできません。実際の下り（外向き）帯域幅は、宛先 IP アドレスやその他の要因によって異なります。ネットワーク帯域幅の詳細については、ネットワーク帯域幅をご覧ください。
³ GPU メモリは GPU デバイスのメモリであり、データの一時的な保存に使用できます。これはインスタンスのメモリとは別のものであり、グラフィックを多用するワークロードの高帯域幅の需要に対応するように設計されています。

A4X

A4X マシンタイプは、NVIDIA GB200 Grace Blackwell Superchip（nvidia-gb200）を使用しており、基盤モデルのトレーニングとサービングに最適です。

A4X は、 NVIDIA GB200 NVL72 に基づくエクサスケールプラットフォームです。各マシンには、Arm Neoverse V2 コアの NVIDIA Grace CPU を搭載した 2 つのソケットがあります。これらの CPU は、高速チップ間（NVLink-C2C）通信対応の 4 つの NVIDIA B200 Blackwell GPU に接続されています。

						アタッチされた NVIDIA GB200 Grace Blackwell Superchip
マシンタイプ	vCPU 数¹	インスタンスのメモリ（GB）	アタッチされたローカル SSD（GiB）	物理 NIC の数	最大ネットワーク帯域幅（Gbps）²	GPU 数	GPU メモリ³ （GB HBM3e）
`a4x-highgpu-4g`	140	884	12,000	6	2,000	4	744

A4 シリーズ

このセクションでは、A4 マシンシリーズで使用可能な構成について説明します。このマシンシリーズの詳細については、 Compute Engine ドキュメントの A4 アクセラレータ最適化マシンシリーズをご覧ください。

A4

A4 マシンタイプには、 NVIDIA B200 Blackwell GPU （nvidia-b200）が割り当てられており、基盤モデルのトレーニングとサービングに最適です。

						アタッチされた NVIDIA B200 Blackwell GPU
マシンタイプ	vCPU 数¹	インスタンスのメモリ（GB）	アタッチされたローカル SSD（GiB）	物理 NIC の数	最大ネットワーク帯域幅（Gbps）²	GPU 数	GPU メモリ³ （GB HBM3e）
`a4-highgpu-8g`	224	3,968	12,000	10	3,600	8	1,440

A3 シリーズ

このセクションでは、A3 マシンシリーズで使用可能な構成について説明します。このマシンシリーズの詳細については、 Compute Engine ドキュメントの A3 アクセラレータ最適化マシンシリーズをご覧ください。

A3 Ultra

A3 Ultra マシンタイプには NVIDIA H200 SXM GPU （nvidia-h200-141gb）が割り当てられており、A3 シリーズで最も高いネットワークパフォーマンスを提供します。A3 Ultra マシンタイプは、基盤モデルのトレーニングとサービングに最適です。

						アタッチされた NVIDIA H200 GPU
マシンタイプ	vCPU 数¹	インスタンスのメモリ（GB）	アタッチされたローカル SSD（GiB）	物理 NIC の数	最大ネットワーク帯域幅（Gbps）²	GPU 数	GPU メモリ³ （GB HBM3e）
`a3-ultragpu-8g`	224	2,952	12,000	10	3,600	8	1128

A3 Mega

A3 Mega マシンタイプには NVIDIA H100 SXM GPU が搭載されており、大規模なモデルのトレーニングとマルチホスト推論に最適です。

注: a3-megagpu-8g マシンタイプをプロビジョニングする場合は、これらのインスタンスのクラスタを使用し、Google Kubernetes Engine（GKE）や Slurm などのスケジューラでデプロイすることをおすすめします。これらのオプションの詳しい使用方法については以下をご覧ください。

Google Kubernetes Engine クラスタを作成するには、GKE を使用して A3 Mega クラスタをデプロイするをご覧ください。
Slurm クラスタを作成するには、A3 Mega Slurm クラスタをデプロイするをご覧ください。

						アタッチされた NVIDIA H100 GPU
マシンタイプ	vCPU 数¹	インスタンスのメモリ（GB）	アタッチされたローカル SSD（GiB）	物理 NIC の数	最大ネットワーク帯域幅（Gbps）²	GPU 数	GPU メモリ³ （GB HBM3）
`a3-megagpu-8g`	208	1,872	6,000	9	1,800	8	640

A3 High

A3 High マシンタイプには NVIDIA H100 SXM GPU が搭載されており、大規模なモデル推論とモデルのファインチューニングの両方に適しています。

注: a3-highgpu-1g、a3-highgpu-2g、または a3-highgpu-4g マシンタイプをプロビジョニングする場合は、Spot VM または Flex-start VM を使用してインスタンスを作成する必要があります。これらのオプションの詳細な手順については、以下をご覧ください。

Spot VM を作成するには、アクセラレータ最適化 VM を作成するときにプロビジョニングモデルを SPOT に設定します。
Flex Start VM を作成するには、次のいずれかの方法を使用します。
- スタンドアロン VM を作成し、アクセラレータ最適化 VM を作成するときにプロビジョニングモデルを FLEX_START に設定します。
- マネージドインスタンスグループ（MIG）でサイズ変更リクエストを作成します。手順については、GPU VM を使用して MIG を作成するをご覧ください。

						アタッチされた NVIDIA H100 GPU
マシンタイプ	vCPU 数¹	インスタンスのメモリ（GB）	アタッチされたローカル SSD（GiB）	物理 NIC の数	最大ネットワーク帯域幅（Gbps）²	GPU 数	GPU メモリ³ （GB HBM3）
`a3-highgpu-1g`	26	234	750	1	25	1	80
`a3-highgpu-2g`	52	468	1,500	1	50	2	160
`a3-highgpu-4g`	104	936	3,000	1	100	4	320
`a3-highgpu-8g`	208	1,872	6,000	5	1,000	8	640

A3 Edge

A3 Edge マシンタイプには NVIDIA H100 SXM GPU が搭載されており、サービング専用に設計されています。 a 限定されたリージョンセットで使用できます。

						アタッチされた NVIDIA H100 GPU
マシンタイプ	vCPU 数¹	インスタンスのメモリ（GB）	アタッチされたローカル SSD（GiB）	物理 NIC の数	最大ネットワーク帯域幅（Gbps）²	GPU 数	GPU メモリ³ （GB HBM3）
`a3-edgegpu-8g`	208	1,872	6,000	5	600: asia-south1 と northamerica-northeast2 の場合 400: その他のすべての A3 Edge リージョン	8	640

次のステップ

GPU の詳細については、Compute Engine ドキュメントの次のページをご覧ください。
- Compute Engine の GPU について学習する。
- GPU のリージョンとゾーンの可用性を確認する。
- GPU の料金について学習する。
AI Hypercomputer のネットワークサービスとストレージサービスについて学習する。