本文說明如何取得容量,以便在 AI Hypercomputer 計費模式中使用預訂功能。如要瞭解 AI Hypercomputer 的所有容量選項,請參閱容量總覽。
如要確保工作負載有充足的資源,請向 Google 提出預留要求。這項動作可讓您預留特定時間範圍的容量,從您選擇的特定日期和時間開始。Google 會根據您的要求,草擬未來預留項目要求。審查並提交這項草稿要求後,Compute Engine 會在 Google Cloud核准要求後,自動建立 (自動建立) 空預留項目。接著,在您選擇的開始時間,Compute Engine 會將要求的容量佈建到自動建立的預留項目中。之後您就可以使用預留項目建立虛擬機器 (VM) 執行個體,直到預留項目期限結束為止。
限制
本節說明未來預留項目要求,以及要求自動建立預留項目的限制。
未來預留項目要求的限制
Google 為您建立草擬的未來預留項目要求後,會套用下列限制:
- 你無法修改要求詳細資料,包括共用類型。
- 要求送出並獲得核准後,狀態會變更為
PROVISIONING,此時就無法取消或刪除要求。無論用量多寡,您都必須從要求開始時間起,支付所要求容量的費用。
自動建立預留項目的限制
Compute Engine 建立隨需預留項目來滿足您要求的容量後,會套用下列限制:
- 只有在要求開始時間過後,您才能使用或修改預留項目。
-
你只能透過下列方式修改預訂:
如要修改預訂中的其他屬性,請與帳戶團隊聯絡。
- 你無法手動刪除預留項目,如果您在預留容量時指定不要在預留期結束時自動刪除預留項目,就必須聯絡帳戶團隊刪除預留項目。
事前準備
如果還沒這麼做,請查看可用的 VM 和叢集設定。
-
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
REST
如要在本機開發環境中使用本頁的 REST API 範例,請使用您提供給 gcloud CLI 的憑證。
安裝 Google Cloud CLI。 完成後,執行下列指令來初始化 Google Cloud CLI:
gcloud init若您採用的是外部識別資訊提供者 (IdP),請先使用聯合身分登入 gcloud CLI。
詳情請參閱 Google Cloud 驗證說明文件中的「使用 REST 進行驗證」。
必要的角色
如要取得建立未來預留項目要求所需的權限,請要求管理員授予專案的Compute Future Reservation User (
roles/compute.futureReservationUser) IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。這個預先定義的角色具備建立未來預留要求所需的權限。如要查看確切的必要權限,請展開「Required permissions」(必要權限) 部分:
所需權限
如要建立未來預留項目要求,必須具備下列權限:
-
如要允許 Compute Engine 自動建立預留項目:
compute.reservations.create專案 -
如要建立未來預留項目要求:
compute.futureReservations.create在專案上 -
如要指定執行個體範本:
compute.instanceTemplates.useReadOnly執行個體範本中的compute.instanceTemplates.useReadOnly
配額
在未來預留項目要求程序中,Google 會管理預留資源的配額。您不需要申請配額。在核准的預訂時間開始時,如果預訂資源的配額不足,Google 會增加配額。
總覽
如要預留容量區塊,請完成下列步驟:
- 透過帳戶團隊要求容量。聯絡帳戶團隊,指定要預留的資源類型和數量。
- 檢查並提交預留項目要求草稿。Google 建立草擬的未來預留項目要求後,請進行審查。如果預填 ID 正確無誤,請提交審查要求。 Google Cloud 會立即核准。
透過帳戶團隊要求運算資源
請與帳戶團隊聯絡,並提供下列資訊,讓 Google 草擬未來預留項目要求:
- 專案編號:帳戶團隊建立要求,且 Compute Engine 佈建容量的專案編號。
- 機器類型:要預留的機器類型。您可以指定下列其中一項:
- A4X (
a4x-highgpu-4g) - A4 (
a4-highgpu-8g) - A3 Ultra (
a3-ultragpu-8g) - A3 Mega (
a3-megagpu-8g) - A3 High (
a3-highgpu-8g)
- A4X (
- 區域:要預留容量的區域。如要查看 GPU 機器類型適用的區域,請參閱加速器可用性。
- 總數:要預留的 VM 總數。您只能預留 VM 數量為 2 的倍數。每個區塊的區塊大小和 VM 數量會因機型和可用性而異。如需更多詳細資料,請洽詢您的帳戶團隊。
- 開始時間:預留期間的開始時間。屆時即可開始使用預留容量。將開始時間格式設為 RFC 3339 時間戳記,如下所示:
YYYY-MM-DDTHH:MM:SSOFFSET
更改下列內容:
YYYY-MM-DD:日期格式為四位數年份、兩位數月份和兩位數日期,並以半形連字號 (-) 分隔。HH:MM:SS:時間格式為兩位數的小時 (採用 24 小時制)、兩位數的分鐘和兩位數的秒數,並以半形冒號 (:) 分隔。OFFSET:時區格式為世界標準時間 (UTC) 的偏移量。舉例來說,如要使用太平洋標準時間 (PST),請指定-08:00。如要不使用偏移值,請指定Z。
- 結束時間:預留期間的結束時間。格式為 RFC 3339 時間戳記。屆時,Compute Engine 會執行下列操作:
- Compute Engine 會刪除自動建立的預留項目。
- 根據您為 VM 執行個體指定的終止動作,Compute Engine 會停止或刪除您使用自動建立的預留資源建立的任何 VM 執行個體。
- 預留項目名稱:Compute Engine 建立的預留項目名稱,用於提供預留容量。Compute Engine 只能建立明確指定的預留項目。
- 預留項目自動刪除:是否要讓 Compute Engine 在預留期間結束時,自動刪除自動建立的預留項目。如要手動刪除預訂,請與帳戶團隊聯絡。
- 維護作業排程類型:Compute Engine 如何為叢集中的 VM 執行個體安排主機維護作業。指定下列其中一個選項:
- 如要同步處理預留區塊中所有 A4X、A4 或 A3 Ultra VM 的維護作業,請使用
GROUPED。 - 如要為 A4 或 A3 Ultra VM 使用不同的維護時間表,請使用
INDEPENDENT。
GROUPED和INDEPENDENT排程選項。您可以採用標準的 Compute Engine 主機維護政策,在個別 VM 上排定維護作業,而非在整個叢集同步進行。由於這些附加 GPU 的執行個體不支援即時遷移,因此會受到終止並重新啟動政策的規範。 - 如要同步處理預留區塊中所有 A4X、A4 或 A3 Ultra VM 的維護作業,請使用
- 預留作業模式:在主機發生錯誤或回報主機故障後,由您或 Google Cloud管理 VM 復原程序。使用的模式取決於您預留的機器類型:
- 管理模式 (
HIGHLY_AVAILABLE_CAPACITY):這個模式適用於 A4、A3 Ultra、A3 Mega 和 A3 High 機型。您可讓 Google Cloud 管理 VM 的維護和復原程序,自動更換故障的機器。這個方法可提高 VM 的可用性,並協助您在新的主機上快速重新啟動 VM。不過,Compute Engine 更換機器後,VM 的拓撲可能會變更。 - 所有容量模式 (
ALL_CAPACITY)。這個模式適用於 A4X 機型。您必須手動管理 VM 的維護和復原程序。不過,您可完整存取預留項目中的所有機器,並更精細地控管 VM 拓撲和維護作業。
- 管理模式 (
- 共用類型:是否只有您的專案可以使用自動建立的預留項目 (
LOCAL),或是其他專案也可以使用預留項目 (SPECIFIC_PROJECTS)。提交要求後,這項屬性就無法變更。如要與機構中的其他專案共用預留容量,請按照下列步驟操作:- 如果尚未驗證,請確認 Google 建立要求的專案允許建立共用預留項目。
- 提供要共用預留容量的專案編號。您最多可以在機構中指定 100 個專案。
承諾名稱:如果預留期為一年以上,您必須購買預留的資源,並附上以資源為準的使用承諾。預留項目期限為 1 年至未滿 3 年時,承諾使用可享 1 年期承諾使用折扣 (CUD) 費率。預留期限為 3 年至未滿 6 年時,承諾使用可享 3 年期 CUD 費率。
如果與其他專案共用預留容量,這些專案必須與預留容量的專案使用相同的 Cloud 帳單帳戶,才能享有折扣。詳情請參閱「為資源型承諾啟用 CUD 分享功能」。
承諾的開始和結束日期與預留項目相同,但啟用時間可能不同。如果您將預訂開始時間指定為美國和加拿大太平洋時間的凌晨 12:00,則承諾會在您選擇的開始日期當天凌晨 12:00 啟用。如果指定其他開始時間,承諾方案會在所選開始日期的次日凌晨 12:00 生效。
Google 建立草擬的未來預留項目要求後,您的帳戶團隊會與您聯絡。
查看並提交預訂要求草稿
向帳戶團隊提供要預留的資源類型和數量後,Google 會草擬未來預留項目要求。您可以查看草擬的要求,確認無誤後提交審查。你必須在要求開始時間前提交要求。
如要查看並提交草擬的未來預留項目要求,請選取下列其中一個選項:
控制台
前往 Google Cloud 控制台的「Reservations」(預留項目) 頁面。
- 點選「Future reservations」(未來預留項目) 分頁標籤。「未來預留項目」表格會列出專案中的每項未來預留項目要求,而每個表格欄位則說明一項屬性。
- 在「Name」(名稱) 欄中,按一下 Google 為您建立的草稿要求名稱。系統會開啟頁面,顯示未來預留要求詳細資料。
- 在「基本資訊」部分,確認要求詳細資料 (例如「日期」和「共用類型」) 正確無誤。此外,如果您要求承諾,請確認承諾已指定。如果這些詳細資料有誤,請與帳戶團隊聯絡。
確認所有資訊無誤後,請提交要求:
- 按一下 「編輯草稿」。系統會顯示修改草稿要求的頁面。
- 點按「Create」(建立)。系統隨即會顯示「預留」頁面。 Google Cloud 會在幾分鐘內核准您的要求,然後 Compute Engine 會建立空白預留項目,其中包含您要求的資源。
gcloud
- 如要查看專案中未來預留項目的要求清單,請使用
gcloud compute future-reservations list指令,並將--filter旗標設為PROCUREMENT_STATUS=DRAFTING:gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
- 在指令輸出內容中,找出您提供給帳戶團隊的名稱所對應的預訂要求。
- 如要查看草稿要求的詳細資料,請使用
gcloud compute future-reservations describe指令:gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \ --zone=ZONE更改下列內容:
FUTURE_RESERVATION_NAME:草稿未來預訂要求的名稱。ZONE:Google 建立要求的可用區。
輸出結果會與下列內容相似:
autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z' creationTimestamp: '2025-11-27T11:14:58.305-08:00' deploymentType: DENSE id: '7979651787097007552' kind: compute#futureReservation name: example-draft-request planningStatus: DRAFT reservationName: example-reservation schedulingType: INDEPENDENT selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552 specificReservationRequired: true specificSkuProperties: instanceProperties: guestAccelerators: - acceleratorCount: 8 acceleratorType: nvidia-h200-141gb localSsds: - diskSizeGb: '375' interface: NVME ... machineType: a3-ultragpu-8g totalCount: '2' status: autoCreatedReservations: - https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation fulfilledCount: '2' lockTime: '2026-01-27T19:15:00Z' procurementStatus: DRAFTING timeWindow: endTime: '2026-02-10T19:20:00Z' startTime: '2026-01-27T19:20:00Z' zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b - 在指令輸出內容中,確認要求詳細資料 (例如預訂期間和共用類型) 正確無誤。此外,如果您購買了約期,請確認已指定約期。如果詳細資料有誤,請與帳戶團隊聯絡。
- 如要提交草稿要求以供審查,請使用
gcloud compute future-reservations update指令,並將--planning-status旗標設為SUBMITTED:gcloud compute future-reservations update FUTURE_RESERVATION_NAME \ --planning-status=SUBMITTED \ --zone=ZONEGoogle Cloud 會在幾分鐘內核准您的要求,然後 Compute Engine 會建立空白預留項目,其中包含您要求的資源。
REST
- 如要查看專案中的未來預留項目要求清單,請對
futureReservations.list方法發出GET要求。在要求網址中加入filter查詢參數,並設為status.procurementStatus=DRAFTING:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
更改下列內容:
PROJECT_ID:Google 建立未來預訂要求草稿的專案 ID。ZONE:要求所在的可用區。
- 在要求輸出內容中,找出您提供給帳戶團隊的名稱所對應的預訂要求。
- 如要查看草稿要求的詳細資料,請對 beta
futureReservations.get方法發出GET要求:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
將
FUTURE_RESERVATION_NAME替換為草稿未來預留項目要求的名稱。輸出結果會與下列內容相似:
{ "specificSkuProperties": { "instanceProperties": { "machineType": "a3-ultragpu-8g", "guestAccelerators": [ { "acceleratorType": "nvidia-h200-141gb", "acceleratorCount": 8 } ], "localSsds": [ { "diskSizeGb": "375", "interface": "NVME" }, ... ] }, "totalCount": "2" }, "kind": "compute#futureReservation", "id": "7979651787097007552", "creationTimestamp": "2025-11-27T11:14:58.305-08:00", "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request", "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552", "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b", "name": "example-draft-request", "timeWindow": { "startTime": "2026-01-27T19:20:00Z", "endTime": "2026-02-10T19:20:00Z" }, "status": { "procurementStatus": "DRAFTING", "lockTime": "2026-01-27T19:15:00Z" }, "planningStatus": "DRAFT", "specificReservationRequired": true, "reservationName": "example-reservation", "deploymentType": "DENSE", "schedulingType": "INDEPENDENT", "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z" } - 在輸出內容中,確認預訂期間和共用類型等要求詳細資料是否正確。此外,如果您要求承諾,請確認已指定承諾。如果詳細資料有誤,請與帳戶團隊聯絡。
- 如要提交草稿要求以供審查,請對 Beta 版
futureReservations.update方法發出PATCH要求。在要求網址中加入updateMask查詢參數,並設為planningStatus:PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus { "name": "FUTURE_RESERVATION_NAME", "planningStatus": "SUBMITTED" }Google Cloud 會在幾分鐘內核准您的要求,然後 Compute Engine 會建立空白預留項目,其中包含您要求的資源。
後續步驟
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2026-02-24 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2026-02-24 (世界標準時間)。"],[],[]] -
如要允許 Compute Engine 自動建立預留項目: