在「所有容量」模式下要求 TPU 容量
請與 Google Cloud 帳戶團隊聯絡,要求預訂「所有容量」模式。
在「所有容量」模式中要求 TPU 容量,並視需要共用專案
請向帳戶團隊提供必要的收費資訊。您的帳戶團隊會建立未來預留項目草稿,供您透過 Google Cloud 控制台查看。
您可以要求保留項目,並在機構的其他專案中共用。 Google Cloud您也可以要求預留項目與 Vertex AI 等其他 Google Cloud 服務共用。在提供給帳戶團隊的資訊中,指出預訂分享偏好設定:
| 屬性 | 說明 |
|---|---|
| 專案編號 | 帳戶團隊建立要求,且 Compute Engine 佈建容量的專案編號 (不是 ID)。 |
| TPU 代別 | Trillium 或 Ironwood |
| 可用區 | 要預留容量的區域。 |
| 晶片數量 | 要預留的 TPU 晶片總數。 |
| 開始時間 | 預留期間的開始時間 |
| 結束時間 | 預留期間的結束時間 |
| 預留項目名稱 | Compute Engine 建立的預留項目名稱,用於提供預留容量 |
| 預留項目自動刪除 | 是否要讓 Compute Engine 在預留期間結束時,自動刪除自動建立的預留項目。如要手動刪除預訂,請與帳戶團隊聯絡。 |
| 共用類型 | 自動建立的預留項目是否只能供專案使用 (LOCAL),或是其他專案也能使用 (SPECIFIC_PROJECTS)。提交要求後,您就無法變更這項設定。如要與機構中的其他專案共用預留容量,請按照下列步驟操作:
|
| 承諾使用合約名稱 | 如果預留期限為一年以上,您必須購買依資源計算的承諾使用合約,並附加至預留資源。您可以購買 1 年或 3 年方案的使用承諾。如果與其他專案共用預留容量,這些專案必須與預留容量的專案使用相同的 Cloud Billing 帳戶,才能享有折扣。詳情請參閱「為資源型承諾啟用 CUD 分享功能」。 |
系統會為「所有容量」模式預留項目預設下列屬性:
| 屬性 | 說明 |
|---|---|
| 維護作業排程類型 | Compute Engine 如何為叢集中的 VM 安排主機維護作業。TPU 叢集導向器僅支援 GROUPED 選項,也就是說,預留項目子區塊中所有 TPU VM 的維護作業都會同步處理。 |
| 預訂作業模式 | 在主機發生錯誤或回報主機有錯誤後,如何 Google Cloud 管理 VM 復原程序。TPU 叢集導向器僅支援 `ALL_CAPACITY` 選項,也就是說,您必須自行管理 VM 的維護和復原程序。不過,您可以完整存取預訂中的所有機器,並更精細地控管 VM 拓撲和維護作業。 |
| 部署作業類型 | 容量部署類型。TPU Cluster Director 僅支援 `DENSE`。 |
確認運算資源預留項目草稿
您必須確認帳戶團隊為您建立的預訂草案,才能在 Google Cloud 專案中取得 TPU 叢集導向器容量。請按照「檢查並提交預留項目要求草稿」一文中的操作說明,確認預留項目。
查看容量要求狀態
您可以判斷 TPU Cluster Director 容量要求的狀態。如果要求獲得核准,系統就會在要求的開始時間,為要求的持續時間分配容量。系統會在預訂開始時間開始計費。
詳情請參閱「查看未來預留項目」。
如要查看預訂要求詳細資料,請使用 Google Cloud CLI 執行下列指令:
gcloud compute future-reservations describe RESERVATION_NAME \ --zone=ZONE
更改下列內容:
- RESERVATION_NAME:預留項目要求的名稱。
- ZONE:Google 建立要求的時區。
輸出結果會與下列內容相似:
creationTimestamp: '2025-04-01' kind: compute#FutureReservation name: 'RESERVATION_NAME' aggregateReservations: vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L status: lockTime: 2024-03-01T17:00:00Z procurementStatus: APPROVED timeWindow: endTime: 2025-06-01T17:00:00Z startTime: 2024-05-01T17:00:00Z ...
擴大現有容量要求
你可以透過現有預訂取得額外容量。新增額外容量時,系統會沿用所有預訂屬性,例如預訂共用政策。您可以要求額外容量的 CUD。新的 CUD 會指向相同的預訂。帳戶團隊會為您完成預訂擴展程序。
在 Google Cloud 控制台中查看預留項目詳細資料
未來預留項目完成後,您可以在 Google Cloud 控制台的「預留項目」頁面查看詳細資料。部署類型為 Dense 的 TPU 預留項目表示這是 TPU 叢集導向器預留項目。