選擇用量方案

本文說明取得和使用 AI Hypercomputer 運算資源的各種方式,也就是計費模式。請根據工作負載、工作負載持續時間和費用需求,選擇最合適的選項。

每個消費選項都會指定下列內容:

  • 如何存取容量來建立 VM 或叢集。

  • 底層的佈建模式,這會決定 VM 的取得容易程度、生命週期和價格。

比較用量方案

下表摘要列出這兩種用量選項的主要差異:

用量方案 AI Hypercomputer 的未來預留項目 最多 90 天的未來預留項目 (日曆模式) 彈性啟動 Spot
支援的機器 A4X Max、A4X、A4、A3 Ultra、A3 Mega 或 A3 High 配備 8 個 GPU 的 A4、A3 Ultra、A3 Mega 或 A3 High 任何 GPU 機器 ,但 A4X Max 和 A4X 除外 任何 GPU 機器 但 A4X Max 和 A4X 除外
效期 不限時間 最多 90 天 最多 7 天 任何時間 (但須遵守搶占規定)
先占
容量保證 非常高。如果 Google Cloud 核准您的預留要求,Compute Engine 就會佈建您要求的容量,確保您能取得所需資源。 非常高。如果 Google Cloud 核准您的預留要求,Compute Engine 就會佈建您要求的容量,確保您能取得所需資源。 盡力而為。Compute Engine 會盡力排定您要求容量的佈建作業。 盡力而為。Compute Engine 會盡力佈建您要求的容量。
配額 系統會在提供容量前自動增加配額。 不會收取配額費用。 系統會收取先占配額費用。 系統會收取先占配額費用。
定價
資源分配 密集 密集
  • MIG 大小調整要求:密集
  • 獨立彈性啟動 VM:標準
標準 (精簡 政策 (選用))
佈建模型 取決於預留項目 取決於預留項目 彈性啟動 Spot
建立方式 如要建立 VM,請完成下列步驟:
  1. 聯絡帳戶團隊預留資源
  2. 在您選擇的日期和時間,您可以使用預留容量,透過「VM 和叢集建立總覽」中說明的任何方法,建立 VM 和叢集。
如要建立 VM,請完成下列步驟:
  1. 在日曆模式中建立未來預留項目
  2. 在您選擇的日期和時間,您可以使用預留容量,透過「部署選項總覽」中說明的任何方法,建立 VM 和叢集。
如要建立 VM,請使用下列任一方法:

當您要求的容量可用時,Compute Engine 就會佈建該容量。

您可以立即使用部署選項總覽中說明的任一方法建立 VM。

選擇使用選項

請使用下列流程圖,選擇最適合工作負載的使用選項:

這張流程圖顯示 AI Hypercomputer 的計費模式。

上圖中的問題如下:

  1. 需要超過 90 天的運算資源嗎?

  2. 是否需要預留容量?

  3. 您的工作負載是否具備容錯能力?

在 AI Hypercomputer 中使用未來預留項目

如要執行需要密集分配資源的長期大型分散式工作負載,您可以要求預留未來特定時間的運算資源。在該段時間內,您擁有預留資源的獨占存取權,並可使用這些資源建立 VM 或叢集。預留項目期限結束時,Compute Engine 會執行下列操作:

  • Compute Engine 會刪除預留項目。
  • 根據您為 VM 指定的終止動作,Compute Engine 會停止或刪除使用預留項目的任何 VM。

AI Hypercomputer 未來預留項目的理想工作負載

未來預留項目非常適合下列工作負載:

  • 預先訓練基礎模型

  • 多主機基礎模型推論

AI Hypercomputer 中未來預留項目的主要特徵

未來預留項目具有下列特性:

  • 您可以預留 A4X Max、A4X、A4、A3 Ultra、A3 Mega 或 A3 High (8 個 GPU) 機器類型。 機器會密集配置,以縮短網路延遲。

  • 您可以視需要預留 VM,預留時間和數量不限,但必須是未來的日期。然後,您可以使用預留資源建立及執行 VM,直到預留期限結束為止。如果預留資源一年以上,您必須購買並附上依資源計算的承諾使用合約

  • 預留期間開始後,您可以按照下列步驟修改自動建立的預留項目:

  • 您使用「取決於預留項目」的佈建模式,可享有下列優點:

    • 有較高機率取得 GPU。

    • 除了附加至 VM 的承諾,您還可享有 vCPU 和 GPU 最高 53% 的折扣。

如何在 AI Hypercomputer 中使用未來的預留項目

如要使用未來預留項目建立 VM 或叢集,請完成下列步驟:

  1. 要求預留容量。聯絡帳戶團隊,並指定要預留的資源。Google 會根據可用性為您建立預留要求草稿。如果資訊正確無誤,即可提交。 Google Cloud 會立即核准預訂要求。

    如需操作說明,請參閱「預留容量」。

  2. 使用保留的資源。在所選預留期間開始時,您可以使用預留項目建立 VM 或叢集。

    如要瞭解建立 VM 或叢集的各種方法,請參閱「VM 和叢集建立總覽」。

在日曆模式中使用未來預留項目

如要執行需要密集分配資源的短期分散式工作負載,您可以要求最多 90 天的運算資源。在該段時間內,您擁有預留資源的獨占存取權,並可使用這些資源建立 VM 或叢集。預留項目期限結束時,Compute Engine 會執行下列操作:

  • Compute Engine 會刪除預留項目。
  • 根據您為 VM 指定的終止動作,Compute Engine 會停止或刪除使用預留項目的任何 VM。

日曆模式未來預留項目的理想工作負載

日曆模式的未來預留項目非常適合下列工作負載:

  • 模型預先訓練

  • 模型微調

  • 模擬

  • 推論

日曆模式未來預留項目的主要特性

日曆模式的未來預留項目具有下列特性:

  • 您可以預留 A4、A3 Ultra、A3 Mega 或 A3 High (8 個 GPU) 機型。這些機器會密集配置,以縮短網路延遲。

  • 您可以查看資源的未來可用性,然後預留最多 80 部 VM,預留期限最長為 90 天。然後,您可以在預留期間結束前,使用預留資源建立 VM。

  • 預留期間開始後,您可以按照下列步驟修改自動建立的預留項目:

  • 您使用「取決於預留項目」的佈建模式,可享有下列優點:

    • 有較高機率取得 GPU。

    • vCPU 和 GPU 可獲得最高 53% 的折扣。

如何在日曆模式中使用未來預留項目

如要在日曆模式中使用未來的預留項目建立 VM 或叢集,請完成下列步驟:

  1. 查看資源供應情形。您可以查看要預訂資源的未來可用情形。建立預訂要求時,您可以指定已確認可用的資源數量、類型和預訂時間長度。這樣做可提高 Google Cloud 核准要求的機率。

    如需操作說明,請參閱「 查看資源未來供應情形」。

  2. 預留容量。你為未來日期和時間建立預留要求。 Google Cloud 會在兩分鐘內核准預留要求。如果獲得核准,Compute Engine 就會為您保留容量。在您選擇的交付日期,您可以使用預留資源建立 VM 或叢集。

    如需操作說明,請參閱 為 GPU VM 或 TPU 建立預留項目要求

  3. 使用保留的資源。在所選預留期間開始時,您可以使用預留項目建立 VM 或叢集。

    如要瞭解建立 VM 或叢集的不同方法,請參閱下列文章:

使用彈性啟動

如要執行需要密集分配資源的短期工作負載,可以使用彈性啟動功能,要求最多七天的運算資源。只要有可用資源,Compute Engine 就會建立您要求的 VM 數量。您可以停止獨立的彈性啟動 VM,但無法停止代管執行個體群組 (MIG) 透過大小調整要求建立的彈性啟動 VM。彈性啟動 VM 會一直存在,直到您刪除 VM,或 Compute Engine 在執行時間結束時刪除 VM 為止。

適合彈性啟動的工作負載

彈性啟動非常適合可隨時啟動的工作負載,例如:

  • 小型模型預先訓練

  • 模型微調

  • 模擬

  • 批次推論

彈性啟動的主要特性

Flex-start 具有下列特性:

  • 您可以要求任何 GPU 機器類型,但 A4X Max 和 A4X 除外。資源分配方式會因建立方法而異:

    • 如果是獨立的彈性啟動 VM,機器會使用標準放置位置。這項放置方式會根據可用性分配機器,因此 VM 可能會位於同一區域內的不同位置。
    • 如使用其他建立方法,系統會密集配置機器,盡量縮短網路延遲。
  • 您使用彈性啟動佈建模式,可享有下列優點:

    • 有較高機率取得 GPU。

    • vCPU、記憶體和 GPU 最高可享 53% 折扣。

如何使用彈性啟動

如要使用彈性啟動功能建立 VM 或叢集,請選取下列任一選項:

使用 Spot

如要執行容錯工作負載,您可以根據可用性立即取得運算資源。以盡可能最低的價格取得資源。不過,Compute Engine 可能會隨時先占 VM 並取回資源。

適合 Spot 的工作負載

Spot 非常適合可接受作業中斷的工作負載,例如:

  • 批次處理

  • 高效能運算 (HPC)

  • 持續整合與持續部署 (CI/CD)

  • 資料分析

  • 媒體編碼

  • 線上推論

Spot 的主要特性

Spot 具有下列特性:

  • 您可以建立任何 GPU 機器類型,但 A4X Max 和 A4X 除外。密集配置取決於可用資源。如要確保配置的 VM 位置更相近,可以對 VM 套用密集配置政策

  • 您即刻就能建立 VM,數量不限。VM 會持續執行,直到您加以停止或刪除,或直到 Compute Engine 先占 VM 並取回資源。

  • 您使用 Spot 佈建模式,可享有下列優點:

    • 有較高機率取得 GPU。

    • 許多機型、GPU、TPU 和本機 SSD 磁碟可享最高 91% 的折扣。

如何使用 Spot

如要使用 Spot 建立 VM 或叢集,請完成下列步驟:

  1. 選用:建立密集配置政策。您可以建立密集配置政策,指定 VM 彼此間的距離。您選擇的最小距離會影響可套用政策的 VM 數量和類型。

  2. 建立 Spot VM。您可以視需要建立多部 VM,數量不限。VM 會持續執行,直到您加以停止或刪除,或直到 Compute Engine 先占 VM 並取回資源。

如需操作說明,請參閱「VM 和叢集建立總覽」。