本文說明取得和使用 AI Hypercomputer 運算資源的各種方式,也就是計費模式。請根據工作負載、工作負載持續時間和費用需求,選擇最合適的選項。
每個消費選項都會指定下列內容:
如何存取容量來建立 VM 或叢集。
底層的佈建模式,這會決定 VM 的取得容易程度、生命週期和價格。
比較用量方案
下表摘要列出這兩種用量選項的主要差異:
| 用量方案 | AI Hypercomputer 的未來預留項目 | 最多 90 天的未來預留項目 (日曆模式) | 彈性啟動 | Spot |
|---|---|---|---|---|
| 支援的機器 | A4X Max、A4X、A4、A3 Ultra、A3 Mega 或 A3 High | 配備 8 個 GPU 的 A4、A3 Ultra、A3 Mega 或 A3 High | 任何 GPU 機器 ,但 A4X Max 和 A4X 除外 | 任何 GPU 機器 但 A4X Max 和 A4X 除外 |
| 效期 | 不限時間 | 最多 90 天 | 最多 7 天 | 任何時間 (但須遵守搶占規定) |
| 先占 | ||||
| 容量保證 | 非常高。如果 Google Cloud 核准您的預留要求,Compute Engine 就會佈建您要求的容量,確保您能取得所需資源。 | 非常高。如果 Google Cloud 核准您的預留要求,Compute Engine 就會佈建您要求的容量,確保您能取得所需資源。 | 盡力而為。Compute Engine 會盡力排定您要求容量的佈建作業。 | 盡力而為。Compute Engine 會盡力佈建您要求的容量。 |
| 配額 | 系統會在提供容量前自動增加配額。 | 不會收取配額費用。 | 系統會收取先占配額費用。 | 系統會收取先占配額費用。 |
| 定價 |
|
|
|
|
| 資源分配 | 密集 | 密集 |
|
標準 (精簡 政策 (選用)) |
| 佈建模型 | 取決於預留項目 | 取決於預留項目 | 彈性啟動 | Spot |
| 建立方式 | 如要建立 VM,請完成下列步驟:
|
如要建立 VM,請完成下列步驟:
|
如要建立 VM,請使用下列任一方法:
當您要求的容量可用時,Compute Engine 就會佈建該容量。 |
您可以立即使用部署選項總覽中說明的任一方法建立 VM。 |
選擇使用選項
請使用下列流程圖,選擇最適合工作負載的使用選項:

上圖中的問題如下:
需要超過 90 天的運算資源嗎?
是:請參閱「 在 AI Hypercomputer 中使用未來預留項目」。
否:請前往問題 2。
是否需要預留容量?
是:請參閱在日曆模式中使用未來預留項目。
否:請前往問題 3。
您的工作負載是否具備容錯能力?
在 AI Hypercomputer 中使用未來預留項目
如要執行需要密集分配資源的長期大型分散式工作負載,您可以要求預留未來特定時間的運算資源。在該段時間內,您擁有預留資源的獨占存取權,並可使用這些資源建立 VM 或叢集。預留項目期限結束時,Compute Engine 會執行下列操作:
- Compute Engine 會刪除預留項目。
- 根據您為 VM 指定的終止動作,Compute Engine 會停止或刪除使用預留項目的任何 VM。
AI Hypercomputer 未來預留項目的理想工作負載
未來預留項目非常適合下列工作負載:
預先訓練基礎模型
多主機基礎模型推論
AI Hypercomputer 中未來預留項目的主要特徵
未來預留項目具有下列特性:
-
您可以預留 A4X Max、A4X、A4、A3 Ultra、A3 Mega 或 A3 High (8 個 GPU) 機器類型。 機器會密集配置,以縮短網路延遲。
-
您可以視需要預留 VM,預留時間和數量不限,但必須是未來的日期。然後,您可以使用預留資源建立及執行 VM,直到預留期限結束為止。如果預留資源一年以上,您必須購買並附上依資源計算的承諾使用合約。
-
預留期間開始後,您可以按照下列步驟修改自動建立的預留項目:
-
您使用「取決於預留項目」的佈建模式,可享有下列優點:
有較高機率取得 GPU。
除了附加至 VM 的承諾,您還可享有 vCPU 和 GPU 最高 53% 的折扣。
如何在 AI Hypercomputer 中使用未來的預留項目
如要使用未來預留項目建立 VM 或叢集,請完成下列步驟:
-
要求預留容量。聯絡帳戶團隊,並指定要預留的資源。Google 會根據可用性為您建立預留要求草稿。如果資訊正確無誤,即可提交。 Google Cloud 會立即核准預訂要求。
如需操作說明,請參閱「預留容量」。
-
使用保留的資源。在所選預留期間開始時,您可以使用預留項目建立 VM 或叢集。
如要瞭解建立 VM 或叢集的各種方法,請參閱「VM 和叢集建立總覽」。
在日曆模式中使用未來預留項目
如要執行需要密集分配資源的短期分散式工作負載,您可以要求最多 90 天的運算資源。在該段時間內,您擁有預留資源的獨占存取權,並可使用這些資源建立 VM 或叢集。預留項目期限結束時,Compute Engine 會執行下列操作:
- Compute Engine 會刪除預留項目。
- 根據您為 VM 指定的終止動作,Compute Engine 會停止或刪除使用預留項目的任何 VM。
日曆模式未來預留項目的理想工作負載
日曆模式的未來預留項目非常適合下列工作負載:
模型預先訓練
模型微調
模擬
推論
日曆模式未來預留項目的主要特性
日曆模式的未來預留項目具有下列特性:
-
您可以預留 A4、A3 Ultra、A3 Mega 或 A3 High (8 個 GPU) 機型。這些機器會密集配置,以縮短網路延遲。
-
您可以查看資源的未來可用性,然後預留最多 80 部 VM,預留期限最長為 90 天。然後,您可以在預留期間結束前,使用預留資源建立 VM。
-
預留期間開始後,您可以按照下列步驟修改自動建立的預留項目:
-
您使用「取決於預留項目」的佈建模式,可享有下列優點:
有較高機率取得 GPU。
vCPU 和 GPU 可獲得最高 53% 的折扣。
如何在日曆模式中使用未來預留項目
如要在日曆模式中使用未來的預留項目建立 VM 或叢集,請完成下列步驟:
-
查看資源供應情形。您可以查看要預訂資源的未來可用情形。建立預訂要求時,您可以指定已確認可用的資源數量、類型和預訂時間長度。這樣做可提高 Google Cloud 核准要求的機率。
如需操作說明,請參閱「 查看資源未來供應情形」。
-
預留容量。你為未來日期和時間建立預留要求。 Google Cloud 會在兩分鐘內核准預留要求。如果獲得核准,Compute Engine 就會為您保留容量。在您選擇的交付日期,您可以使用預留資源建立 VM 或叢集。
如需操作說明,請參閱 為 GPU VM 或 TPU 建立預留項目要求。
-
使用保留的資源。在所選預留期間開始時,您可以使用預留項目建立 VM 或叢集。
如要瞭解建立 VM 或叢集的不同方法,請參閱下列文章:
- 如要建立 A4、A3 Ultra、A3 Mega 或 A3 High (8 個 GPU) VM,請參閱「VM 和叢集建立總覽」。
- 如要建立啟用 GPUDirect-TCPX 的 A3 Mega 或 A3 High (8 個 GPU) VM,請參閱「建立啟用 GPUDirect-TCPX 的 A3 VM」。
使用彈性啟動
如要執行需要密集分配資源的短期工作負載,可以使用彈性啟動功能,要求最多七天的運算資源。只要有可用資源,Compute Engine 就會建立您要求的 VM 數量。您可以停止獨立的彈性啟動 VM,但無法停止代管執行個體群組 (MIG) 透過大小調整要求建立的彈性啟動 VM。彈性啟動 VM 會一直存在,直到您刪除 VM,或 Compute Engine 在執行時間結束時刪除 VM 為止。
適合彈性啟動的工作負載
彈性啟動非常適合可隨時啟動的工作負載,例如:
小型模型預先訓練
模型微調
模擬
批次推論
彈性啟動的主要特性
Flex-start 具有下列特性:
-
您可以要求任何 GPU 機器類型,但 A4X Max 和 A4X 除外。資源分配方式會因建立方法而異:
- 如果是獨立的彈性啟動 VM,機器會使用標準放置位置。這項放置方式會根據可用性分配機器,因此 VM 可能會位於同一區域內的不同位置。
- 如使用其他建立方法,系統會密集配置機器,盡量縮短網路延遲。
您使用彈性啟動佈建模式,可享有下列優點:
有較高機率取得 GPU。
vCPU、記憶體和 GPU 最高可享 53% 折扣。
如何使用彈性啟動
如要使用彈性啟動功能建立 VM 或叢集,請選取下列任一選項:
- 建立獨立 VM
- 建立含有大小調整要求的 MIG
- 建立 Slurm 叢集
- 建立 GKE 叢集:
使用 Spot
如要執行容錯工作負載,您可以根據可用性立即取得運算資源。以盡可能最低的價格取得資源。不過,Compute Engine 可能會隨時先占 VM 並取回資源。
適合 Spot 的工作負載
Spot 非常適合可接受作業中斷的工作負載,例如:
批次處理
高效能運算 (HPC)
持續整合與持續部署 (CI/CD)
資料分析
媒體編碼
線上推論
Spot 的主要特性
Spot 具有下列特性:
-
您可以建立任何 GPU 機器類型,但 A4X Max 和 A4X 除外。密集配置取決於可用資源。如要確保配置的 VM 位置更相近,可以對 VM 套用密集配置政策。
-
您即刻就能建立 VM,數量不限。VM 會持續執行,直到您加以停止或刪除,或直到 Compute Engine 先占 VM 並取回資源。
-
您使用 Spot 佈建模式,可享有下列優點:
有較高機率取得 GPU。
許多機型、GPU、TPU 和本機 SSD 磁碟可享最高 91% 的折扣。
如何使用 Spot
如要使用 Spot 建立 VM 或叢集,請完成下列步驟:
-
選用:建立密集配置政策。您可以建立密集配置政策,指定 VM 彼此間的距離。您選擇的最小距離會影響可套用政策的 VM 數量和類型。
-
建立 Spot VM。您可以視需要建立多部 VM,數量不限。VM 會持續執行,直到您加以停止或刪除,或直到 Compute Engine 先占 VM 並取回資源。
如需操作說明,請參閱「VM 和叢集建立總覽」。