Google Cloud 透過 N4A、C4A 和 A4X 機器系列,在 Compute Engine 中提供一系列 Arm 伺服器。ARM 架構經過最佳化處理,運作效率相當卓越,因此成本效益更高。
與 x86 伺服器相比,Arm 處理器具有能源效率,因此常見於標準伺服器。手機和筆電就是採用 Arm 處理器的裝置。Arm CPU 的指令集較少,因此指令越少,效能速度就越快,電池和電力消耗也越低。
N4A 採用 Google 的 Axion Arm 處理器,以及 Neoverse N3 處理器。C4A 採用以 Arm Neoverse V2 處理器為基礎的 Axion Arm 處理器。Neoverse V2 是首款 V 系列 CPU,效能、電力和安全性都經過 Armv9 強化。這款 GPU 專為高效能運算、機器學習和一般用途的雲端運算而設計。如要達成下列任一目的,請考慮使用 N4A 或 C4A 一般用途 Arm 虛擬機器 (VM):
- 執行需要擴充用量的運算密集型工作負載。
- 針對與 Arm 相容的工作負載,提供最佳成本效益。
- 以現代化開放原始碼軟體堆疊為基礎建構。
- 開發及測試使用 Arm CPU 的行動或嵌入式系統。
- 評估工作負載是否適合 Arm CPU。
如要搭配 Arm 架構 CPU 使用 GPU,請選擇 A4X Max 或 A4X 系列機器,這類機器採用 NVIDIA 機架規模架構。這些機器系列的執行個體已附加 NVIDIA Grace Blackwell Superchip。這些機器系列經過最佳化調整,相當適合用於大規模平行處理的 Compute Unified Device Architecture (CUDA) 運算工作負載,例如機器學習 (ML) 和高效能運算 (HPC)。
A4X Max 和 A4X 機器系列
A4X Max 和 A4X 機器系列同時具備 Arm 架構的 CPU 和附加的 GPU。這個系列的兩種機型都有兩個插槽,其中 NVIDIA Grace Arm CPU 連接四個 GPU,並透過快速晶片對晶片 (NVLink C2C) 通訊。
- A4X Max:提供最多 144 個 vCPU 和 960 GB 記憶體的機器類型。這款超級晶片搭載 B300 GPU,每個 GPU 提供 279 GB 的記憶體。A4X Max 可做為
a4x-maxgpu-4g-metal機型中的裸機執行個體。 - A4X:提供最多 140 個 vCPU 和 884 GB 記憶體的機器類型。這款超級晶片搭載 B200 GPU,每個 GPU 提供 186 GB 記憶體。A4X 適用於
a4x-highgpu-4g機器類型。
A4X Max 和 A4X 執行個體的儲存空間選項
A4X Max 和 A4X 可搭配 Google Cloud Hyperdisk 連接的儲存空間使用,並隨附 12,000 GiB 的本機 SSD。建立執行個體時,Compute Engine 會自動將本機 SSD 磁碟連結至執行個體。
作業系統映像檔
A4X Max 和 A4X 執行個體支援以 Arm 為基礎的公開 OS 映像檔。您也可以使用公開的 Arm 架構 OS 映像檔建立自訂映像檔。
N4A 機器系列
N4A 是最新款的 Google Axion 型 VM,採用 Neoverse N3 CPU。N4A 提供的機器類型最多可搭載 64 個 vCPU 和 512 GB 的 DDR5 記憶體,並支援 Titanium 基礎架構處理單元 (IPU)。N4A 採用新一代動態資源管理,適用於 standard、highmem 和 highcpu 機型,並提供自訂機型和新增擴充記憶體的選項。
N4A 支援標準網路,搭配 gVNIC 網路介面時,最高可達 50 Gbps。N4A 也支援 NVMe 磁碟介面,以及 Hyperdisk Balanced、Hyperdisk Balanced High Availability 和 Hyperdisk Throughput 儲存空間。
C4A 機器系列
C4A 是首款以 Google Axion Arm64 架構 CPU 為基礎建構的 Arm 架構 VM。C4A 提供最多 72 個 vCPU 和 576 GB DDR5 記憶體的機器類型。C4A 提供 standard、highmem 和 highcpu 機型。
C4A 提供兩種裸機機型:
c4a-highmem-96-metal,搭載 96 個 vCPU 和 768 GB 的 DDR5 記憶體c4a-standard-96-metal,搭載 96 個 vCPU 和 384 GB 的 DDR5 記憶體
C4A 採用 Titanium 架構,可卸載網路,並透過 gVNIC 網路介面,為每個 VM 提供高達 100 Gbps 的 Tier_1 網路效能。C4A 也支援 NVMe 和 IDPF 磁碟介面,搭配 Hyperdisk 磁碟區使用。
多執行緒並行
如果是 C4A 系列機器,每個 vCPU 都由單一核心支援,且沒有多執行緒並行 (SMT)。因此,與啟用 SMT 的 VM 相比,C4A VM 的每 vCPU 效能更高。雖然 SMT 可為特定工作負載帶來好處,但單一執行緒核心非常適合耗用大量運算資源的工作負載,因為程序可以存取整個核心,不必與其他程序共用。
作業系統映像檔
C4A 和 N4A VM 支援公開的 Arm 架構 OS 映像檔。 您也可以使用公開的 Arm 架構映像檔建立自訂映像檔。
Tau T2A 機器系列
Tau T2A Arm 機器系列搭載 64 核心 Ampere Altra Arm 處理器,全核心頻率為 3.0 GHz。Tau T2A 可讓您執行最適合或專為 Arm 設計的工作負載。
Tau T2A 系列機器提供預先定義的機器類型,最多可搭載 48 個實體核心,每個 vCPU 具備 4 GB 記憶體。Tau T2A 機型會在單一 NUMA 節點內執行。
Tau T2A 機型僅支援 NVMe 儲存介面,以及Google 虛擬 NIC (gVNIC) 網路介面。系統不支援 Virtio-Net 和 SCSI 介面。所有公開發布的 Arm OS 映像檔都已設定為使用 NVMe 和 gVNIC 介面。gVNIC 是專為 Compute Engine 設計的網路介面。可提供更優異的效能,並支援更高的網路頻寬和處理量。
在這個系列中,每個 vCPU 都由單一核心支援,且沒有多執行緒並行 (SMT)。
工作負載建議
C4A 機器系列非常適合各種擴充和運算密集型工作負載,尤其是在成本效益是主要考量時。部署下列工作負載時,請考慮使用 C4A:
- 機器學習資料處理
- 機器學習推論和提供模型
- 應用程式、網站和遊戲放送
- 嵌入式系統開發
- 在 Arm 上的 CI/CD 中開發
- 影片和圖片編碼、轉碼及處理
- 數位廣告交易平台和放送
- 快取伺服器
- 運算藥物研發
- Android 應用程式開發
- 自動或傳統汽車軟體開發
後續步驟
- 請參閱 A4X Max 和 A4X 系列機器的規格和功能。
- 請參閱 N4A 機器系列的規格。
- 查看 C4A 機器系列的規格。
- 瞭解 Google Cloud適用的 CPU 平台。
- 使用 Arm OS 映像檔建立及啟動 Compute Engine 執行個體。