關於彈性啟動 VM

本文將概略介紹彈性啟動 VM,詳細說明其主要特徵,以及建立時適用的需求和限制。

彈性啟動 VM 是指您使用彈性啟動佈建模式建立的虛擬機器 (VM) 執行個體。這個模式會使用動態工作負載排程器 (DWS),從安全的容量集區調度折扣運算資源,提高取得 GPU 等高需求資源的機率。建立彈性啟動 VM 後,Compute Engine 會嘗試在特定時間範圍內分配您要求的資源。如果成功,彈性啟動 VM 就會開始運作,最多可運作七天。

如果工作負載需要資源的時間超過七天,或需要更高的容量保證,您可以在日曆模式中建立未來預留項目要求,繼續享有 DWS 折扣。

彈性啟動 VM 的用途

彈性啟動 VM 非常適合執行可隨時啟動的工作負載,例如:

  • 小型模型預先訓練

  • 模型微調

  • 高效能運算 (HPC) 模擬

  • 批次推論

彈性啟動 VM 的主要特性

相較於其他類型的 Compute Engine 執行個體,彈性啟動 VM 具有下列特徵:

  • 資源配置等待時間:您可以在 Compute Engine 配置所要求的資源前,建立彈性啟動 VM。不過,只有在指定時間範圍內有可用資源時,VM 才會啟動。如果沒有可用資源,VM 建立要求就會失敗。

    詳情請參閱本文的「彈性啟動型 VM 等待時間」一節。

  • 運作時間有限:彈性啟動 VM 最多可不間斷運作七天。時間一到,Compute Engine 會根據 VM 屬性中指定的終止動作,自動停止或刪除 VM。

    詳情請參閱本文的「彈性啟動型 VM 的有限執行時間」一節。

  • Compute Engine 如何分配 VM:Compute Engine 會盡量在鄰近位置建立彈性啟動 VM,以盡量減少網路延遲。如要控管彈性啟動 VM 的放置位置,您可以選擇使用密集配置政策或工作負載政策。

    詳情請參閱本文的彈性啟動型 VM 分配一節。

  • 彈性啟動佈建模式:您可以使用彈性啟動佈建模式建立彈性啟動 VM。相較於使用標準佈建模型建立的 VM,這個佈建模型可提供更高的資源可用性,以及折扣價格。

    如要進一步瞭解各個佈建模式,請參閱「Compute Engine 執行個體佈建模式」。

彈性啟動型 VM 等待時間

建立彈性啟動型 VM 時,VM 不會立即啟動。Compute Engine 會嘗試在特定時間範圍內分配您要求的資源,並啟動 VM。如果您有足夠的配額可供要求資源使用,且 Compute Engine 在等待時間結束前分配資源,則彈性啟動型 VM 會在容量可用後兩分鐘內啟動。否則 VM 建立要求會失敗。

等待時間取決於您建立 VM 的方法:

獨立彈性啟動 VM 的等待時間

如要建立獨立的彈性啟動 VM,您必須使用 requestValidForDuration 欄位指定等待時間。你可以設定等待時間為零秒,或介於 90 秒到 7,200 秒 (兩小時) 之間。

根據工作負載的區域需求,我們建議您採用下列等待時間,以提高彈性啟動型 VM 建立要求成功的機率:

  • 嚴格的可用區要求:如果工作負載要求您在特定可用區中建立彈性啟動型 VM,建議您將 requestValidForDuration 欄位設為 90 秒以上,最多兩小時。等待時間越長,取得資源的機會就越高。 在這段期間,VM 會維持 PENDING 狀態

  • 無可用區需求:如果彈性啟動型 VM 可在區域中的任何可用區執行,建議您將 requestValidForDuration 欄位設為零秒。這個值表示 Compute Engine 只會在資源可立即使用時分配資源。如果資源不足導致要求失敗,請嘗試在其他可用區建立彈性啟動型 VM。

如要在 Compute Engine 嘗試分配資源時停止 VM 建立要求,請刪除彈性啟動型 VM。

具有彈性啟動 VM 的 MIG 等待時間

如果您將彈性啟動 VM 新增至代管執行個體群組 (MIG),Compute Engine 會持續嘗試佈建您要求的資源,直到成功或您取消要求為止。Compute Engine 將 VM 新增至 MIG 的方式會因建立方法而異:

  • MIG 大小調整要求:當所有資源都可供使用時,Compute Engine 會一次將要求的 VM 新增至 MIG。除非您在執行時間結束前刪除 VM,否則 Compute Engine 會同時刪除 VM。詳情請參閱「關於 MIG 大小調整要求」。

  • 設有目標大小的 MIG:當容量充足時,Compute Engine 會個別建立每個 VM。因此,MIG 可能一開始只會建立部分要求的 VM,然後在容量允許的情況下,稍後再新增其餘 VM。除非您在 VM 執行時間結束前刪除 VM,否則 Compute Engine 會根據各 VM 的建立時間刪除 VM。詳情請參閱「建立使用彈性啟動 VM 的 MIG」。

彈性啟動型 VM 的運作時間限制

建立彈性啟動型 VM 時,您必須指定下列項目:

  • VM 執行時間長度:您必須指定 VM 的執行時間長度。最多可執行七天。如果工作負載在 VM 執行時間結束前完成,您可以停止或刪除獨立 VM,或刪除 MIG 中的 VM,以免產生不必要的費用。

  • VM 終止動作:您必須選擇在 VM 執行時間結束時,Compute Engine 要自動停止還是刪除 VM。對於 MIG 中的彈性啟動 VM,您只能指定在執行時間結束時刪除 VM。

彈性啟動型 VM 分配

Compute Engine 會盡量根據可用性,密集建立彈性啟動 VM。這種密集放置方式可減少網路躍點,並將延遲降至最低,非常適合需要持續 VM 通訊的工作負載,例如 AI 或機器學習工作負載。如要控管彈性啟動 VM 的放置位置,避免 VM 意外建立在相距遙遠的位置,請按照下列步驟操作:

配額

如要建立或重新啟動彈性啟動型 VM,您必須有足夠的先占配額,才能使用要求的 vCPU、記憶體,以及任何連接的 GPU 或本機 SSD 磁碟。

如果嘗試建立或重新啟動彈性啟動型 VM,但配額不足,則會發生下列其中一種情況:

  • VM 建立要求:配額充足前,要求會維持待處理狀態。如果在等待時間結束前未取得所需配額,要求就會失敗。

  • VM 重新啟動要求:要求會立即失敗。

定價

彈性啟動 VM 的計費方式如下:

  • 您採用即付即用 (PAYG) 模式,如要進一步瞭解 VM 在生命週期內的定價,請參閱定價

  • 使用 A4、A3、A2、G4 和 H4D 機器類型時,您可享有 vCPU、記憶體和任何連結 GPU 的折扣價。其他支援的加速器最佳化機器類型不符合折扣資格。詳情請參閱「DWS 定價」。

限制

以下各節說明彈性啟動 VM 的限制。

所有彈性啟動 VM 的限制

所有彈性啟動型 VM 都有下列限制:

  • 彈性啟動 VM 只能使用下列機器類型:

    • 任何 GPU 機型,但 A4X Max 和 A4X 除外

    • 下列區域的 TPU 版本:

      • TPU7xus-central1-c

      • TPU v6easia-northeast1-bus-east5-aus-south1-ai1b

      • TPU v5pus-east5-a

    • H4D 機型

  • 您必須使用彈性啟動佈建模式建立彈性啟動 VM。

  • 您必須使用 instanceTerminationActionmaxRunDuration 欄位,指定在彈性啟動型 VM 執行時間結束時,要停止還是刪除 VM。如果是 MIG,您只能指定刪除「彈性啟動」VM。

  • 您必須在主機維護事件期間停止彈性啟動 VM。

  • 您只能將密集配置政策套用至獨立的彈性啟動 VM。

  • 您無法將分散式配置政策套用至彈性啟動 VM。

  • 無法使用預留項目。

使用彈性啟動 VM 的 MIG 限制

所有具有彈性啟動 VM 的 MIG 都會受到下列限制:

此外,如要使用 MIG 規模調整要求建立彈性啟動 VM,請參閱 MIG 規模調整要求限制

後續步驟

歡迎試用

如果您未曾使用過 Google Cloud,歡迎建立帳戶,親自體驗實際使用 Compute Engine 的成效。新客戶還能獲得價值 $300 美元的免費抵免額,能用於執行、測試及部署工作負載。

免付費試用 Compute Engine