Compute Engine 執行個體的佈建模型

建立 Compute Engine 執行個體時,您必須定義要用來取得所要求資源的方法,也就是佈建模型。每種佈建模式都會決定運算執行個體的可用性、生命週期和價格。

本文說明建立運算執行個體時可指定的不同佈建模型。瞭解這些模型後,您就能為工作負載選擇最佳選項。

可用的佈建模式

建立運算執行個體時,您可以指定下列其中一種佈建模型。如未指定佈建模型,Compute Engine 預設會使用標準佈建模型。

  • 標準

  • Spot

  • 彈性啟動

  • 取決於預留項目

下表列出各佈建模式的用途和價格比較:

標準 Spot 彈性啟動 取決於預留項目
摘要
  • 您可以根據資源可用性,立即建立運算執行個體。
  • 您可以控管何時停止或刪除運算執行個體。
  • 您可以根據資源可用性,立即建立運算執行個體。
  • 您可以控管何時停止或刪除運算執行個體。但您也允許 Compute Engine 隨時停止或刪除運算執行個體,以回收容量。
  • 您可以根據資源可用性,在指定等待時間內建立運算執行個體。如果是獨立的彈性啟動型 VM,您最多可以指定兩小時的等待時間。如果是 MIG 規模調整要求,等待時間不確定。
  • 您可以控管何時停止或刪除運算執行個體。不過,您無法暫停或重新建立這些設定。運算執行個體至少會執行 10 分鐘,最多可執行 7 天。當運算執行個體達到執行時間上限時,Compute Engine 會根據終止動作停止或刪除執行個體。
  • 您可以要求在未來日期保留容量,以便建立運算執行個體。如果 Google Cloud 核准您的要求,Compute Engine 就會建立預留項目。在預訂期間開始時,您可以建立與預訂項目相符的運算執行個體,藉此使用預訂項目。
  • 在核准的預留期間,您可以停止、重新啟動、刪除及重新建立運算執行個體,視需要使用預留資源。預留項目到期後,Compute Engine 會刪除預留項目,並根據終止動作停止或刪除使用預留項目的運算執行個體。
用途

適合需要穩定性和持續運作的工作負載,例如:

  • 網路伺服器
  • 資料庫
  • 企業應用程式
  • 開發和測試

適用於可容許中斷的工作負載,例如:

  • 批次處理
  • 高效能運算 (HPC)
  • 持續整合與持續部署 (CI/CD)
  • 資料分析
  • 媒體編碼
  • 線上推論

需要穩定性且執行時間不超過七天的工作負載,例如:

  • 小型模型預先訓練
  • 模型微調
  • HPC 模擬
  • 批次推論

適合需要穩定性和特定執行時間的工作負載,例如:

  • 時長最長 90 天的工作負載

    • 模型預先訓練工作
    • 模型微調工作
    • HPC 模擬工作負載
    • 短期內推論工作負載預期會增加
  • 工作負載超過 90 天

    • 訓練工作負載
    • 推論工作負載
資源分配 盡力而為。Compute Engine 會盡可能將資源放置在彼此附近。如要控管放置位置,您可以選擇使用放置位置政策 盡力而為。Compute Engine 會盡可能將資源放置在彼此附近。如要控管放置位置,您可以選擇使用放置位置政策

資源分配方式會因建立運算執行個體的方式而異:

  • 盡力而為。如果您建立獨立的彈性啟動型 VM,Compute Engine 會盡力將資源放在彼此附近。如要控管放置位置,您可以選擇使用 放置位置政策
  • 密集。如果您透過 MIG 調整大小要求建立彈性啟動 VM,Compute Engine 會將資源實際放置在緊密耦合的主機上,並透過高速網路架構連線,盡量縮短網路延遲時間。
密集。Compute Engine 會將資源實際放置在緊密耦合的主機上,並透過高速網路架構連線,盡量減少網路延遲。
定價
  • 您需要支付運算執行個體的標準價格。請參閱 VM 執行個體定價
  • 您建立運算執行個體時,會根據所用的方法產生費用:

    • 如果您立即建立運算執行個體,則會採用即付即用 (PAYG) 方案。
    • 如果您使用隨需預留項目或未來預留項目自動建立的預留項目建立運算執行個體,系統會持續收費,直到預留項目存在為止。詳情請參閱 預留項目計費
  • C3、M3 和 A3 機器系列可享最高 60% 的折扣。 詳情請參閱定價頁面
  • 您採用即付即用方案。
  • 根據運算執行個體使用的機器系列,您可獲得以下折扣:

    • 對於 A4、A3 和 A2 系列機器,vCPU、記憶體和 GPU 可享 53% 的折扣。
    • H4D 機器系列 的 vCPU 和記憶體可享 25% 折扣。
    其他支援的機器系列不符合折扣資格。詳情請參閱Dynamic Workload Scheduler (DWS) 定價
  • 您採用即付即用方案。
配額 建立運算執行個體時,會消耗標準配額。 建立 Spot VM 時,系統會消耗標準配額。 建立彈性啟動型 VM 時,會消耗先占配額 。如果專案沒有先占配額,就會消耗標準配額。

配額消耗量會因您預留資源的方法而異:

  • 日後透過 AI Hypercomputer 或 HPC 叢集預訂資源:Google 會管理預訂資源的配額。您不需要手動申請配額。在核准的未來預留項目開始時間,如果專案配額不足,Google 會自動增加配額。
  • 日曆模式的未來預留項目:如要預留 H4D 機器類型,系統會消耗 CPU 配額。如要預留 GPU 或 TPU 機器類型,不需要配額。

運算執行個體可用性和生命週期

下表列出各佈建模式的運算執行個體可用性和生命週期:

標準 Spot 彈性啟動 取決於預留項目
建立前的必要條件 建立活動沒有任何條件限制。 建立活動沒有任何條件限制。 建立活動沒有任何條件限制。

如要建立運算執行個體,您必須先使用下列其中一種方法預留容量:

在您選擇的送達日期和時間,Compute Engine 會佈建您要求的容量。接著,您就可以建立運算執行個體,使用這些容量。

支援的機器系列 您可以使用任何機器系列,但 A4X Max、A4X、A4 和 A3 Ultra 除外。 您可以選用所有機型系列 (C3、M3 和 A3)。

你只能使用下列機器系列:

根據您預留容量來建立 VM 的方式,您只能使用下列機器系列:

運算執行個體可用性 只要您要求的資源可用,隨時都能建立運算執行個體。 只要您要求的資源可用,隨時都能建立運算執行個體。

您可以按照下列方式建立運算執行個體:

Compute Engine 會使用 DWS,根據資源可用性排定您要求的容量佈建作業。DWS 可協助您取得 GPU 等高需求資源。

您只能在預留未來日期的容量後,建立運算執行個體。在您要求的日期,Compute Engine 會提供您要求的容量,您可以使用這些容量建立運算執行個體。如果您在日曆模式下使用未來預留項目預留資源,Compute Engine 會使用 DWS 佈建您要求的容量。DWS 可協助您取得 GPU 等高需求資源。
容量保證 視建立方法而定。容量保證會因您建立運算執行個體的方法而異,如下所示:
  • 如果您立即建立運算執行個體,Compute Engine 會盡力佈建您要求的容量。
  • 如果您建立的運算執行個體會耗用隨需預留項目,或是未來預留項目自動建立的預留項目,那麼只要預留項目有預留容量可用,您就能確保 Compute Engine 會佈建您要求的容量。
盡力而為。建立 Spot VM 時,Compute Engine 會盡力佈建您要求的容量。 盡力而為。建立 MIG 調整大小要求時,Compute Engine 會盡力排定您要求容量的佈建作業。 非常高。如果 Google Cloud 核准您的預留要求,您就能非常確信 Compute Engine 會在您選擇的交付日期和時間,佈建預留容量。在預留期間,您擁有預留容量的獨占存取權。
運算執行個體生命週期 您可以控制何時停止或刪除運算執行個體。不過,如果運算執行個體使用的機型不支援即時遷移,Compute Engine 會在主機維護事件期間停止運算執行個體。

您可以控管何時停止或刪除運算執行個體,但下列情況除外:

  • Compute Engine 會停止或刪除運算執行個體,以回收容量。這項程序稱為「先占」
  • 如果運算執行個體使用的機型不支援即時遷移,Compute Engine 會在主機維護事件期間停止運算執行個體。

在運算執行個體達到執行時間上限前,您可以採取下列行動:

  • 停止運算執行個體:如果運算執行個體是獨立建立,您隨時可以停止執行個體。
  • 刪除運算執行個體:您隨時可以刪除運算執行個體。

當運算執行個體達到執行時間上限時,Compute Engine 會將其刪除。

您可以控管何時停止或刪除運算執行個體,但下列情況除外:

  • Compute Engine 會在主機維護事件期間停止運算執行個體。
  • 系統自動建立的預留項目,已達到佈建要求容量的承諾預留項目期限。屆時,Compute Engine 會刪除預訂項目,並根據設定中指定的 終止動作,停止或刪除任何使用預訂項目的運算執行個體。

後續步驟