在「所有容量」模式下要求 TPU 容量

請與 Google Cloud 帳戶團隊聯絡,要求預訂「所有容量」模式。

在「所有容量」模式中要求 TPU 容量,並視需要共用專案

請向帳戶團隊提供必要的收費資訊。您的帳戶團隊會建立未來預留項目草稿,供您透過 Google Cloud 控制台查看。

您可以要求保留項目,並在機構的其他專案中共用。 Google Cloud您也可以要求預留項目與 Vertex AI 等其他 Google Cloud 服務共用。在提供給帳戶團隊的資訊中,指出預訂分享偏好設定:

屬性 說明
專案編號 帳戶團隊建立要求,且 Compute Engine 佈建容量的專案編號 (不是 ID)。
TPU 代別 Trillium 或 Ironwood
可用區 要預留容量的區域。
晶片數量 要預留的 TPU 晶片總數。
開始時間 預留期間的開始時間
結束時間 預留期間的結束時間
預留項目名稱 Compute Engine 建立的預留項目名稱,用於提供預留容量
預留項目自動刪除 是否要讓 Compute Engine 在預留期間結束時,自動刪除自動建立的預留項目。如要手動刪除預訂,請與帳戶團隊聯絡。
共用類型 自動建立的預留項目是否只能供專案使用 (LOCAL),或是其他專案也能使用 (SPECIFIC_PROJECTS)。提交要求後,您就無法變更這項設定。如要與機構中的其他專案共用預留容量,請按照下列步驟操作:
  1. 如果尚未驗證,請確認 Google 建立要求的專案 允許建立共用預訂
  2. 提供要共用預留容量的專案 ID。您最多可以在機構中指定 100 個專案。
承諾使用合約名稱 如果預留期限為一年以上,您必須購買依資源計算的承諾使用合約,並附加至預留資源。您可以購買 1 年或 3 年方案的使用承諾。如果與其他專案共用預留容量,這些專案必須與預留容量的專案使用相同的 Cloud Billing 帳戶,才能享有折扣。詳情請參閱「為資源型承諾啟用 CUD 分享功能」。

系統會為「所有容量」模式預留項目預設下列屬性:

屬性 說明
維護作業排程類型 Compute Engine 如何為叢集中的 VM 安排主機維護作業。TPU 叢集導向器僅支援 GROUPED 選項,也就是說,預留項目子區塊中所有 TPU VM 的維護作業都會同步處理。
預訂作業模式 在主機發生錯誤或回報主機有錯誤後,如何 Google Cloud 管理 VM 復原程序。TPU 叢集導向器僅支援 `ALL_CAPACITY` 選項,也就是說,您必須自行管理 VM 的維護和復原程序。不過,您可以完整存取預訂中的所有機器,並更精細地控管 VM 拓撲和維護作業。
部署作業類型 容量部署類型。TPU Cluster Director 僅支援 `DENSE`。

確認運算資源預留項目草稿

您必須確認帳戶團隊為您建立的預訂草案,才能在 Google Cloud 專案中取得 TPU 叢集導向器容量。請按照「檢查並提交預留項目要求草稿」一文中的操作說明,確認預留項目。

查看容量要求狀態

您可以判斷 TPU Cluster Director 容量要求的狀態。如果要求獲得核准,系統就會在要求的開始時間,為要求的持續時間分配容量。系統會在預訂開始時間開始計費。

詳情請參閱「查看未來預留項目」。

如要查看預訂要求詳細資料,請使用 Google Cloud CLI 執行下列指令:

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

更改下列內容:

  • RESERVATION_NAME:預留項目要求的名稱。
  • ZONE:Google 建立要求的時區。

輸出結果會與下列內容相似:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

擴大現有容量要求

你可以透過現有預訂取得額外容量。新增額外容量時,系統會沿用所有預訂屬性,例如預訂共用政策。您可以要求額外容量的 CUD。新的 CUD 會指向相同的預訂。帳戶團隊會為您完成預訂擴展程序。

在 Google Cloud 控制台中查看預留項目詳細資料

未來預留項目完成後,您可以在 Google Cloud 控制台的「預留項目」頁面查看詳細資料。部署類型為 Dense 的 TPU 預留項目表示這是 TPU 叢集導向器預留項目。