Cloud TPU 配額
本文列出 Cloud TPU 適用的配額。如要瞭解 Cloud TPU 定價,請參閱 Cloud TPU 定價。
Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。
Cloud Quotas 系統具備以下功能:
如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。
配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。
詳情請參閱「Cloud Quotas 總覽」。
TPU 配額
TPU 配額是指您可透過Google Cloud 專案使用的 Cloud TPU 核心數量上限。每個 TPU 版本都有專屬配額。此外,每個 Cloud TPU 版本配額都分為隨選配額和可先占 (或現貨) 配額。
建立 Cloud TPU 資源時,預設會建立隨選資源。使用 gcloud 指令建立資源時,可以透過 --spot 參數建立先佔資源。詳情請參閱「管理 TPU 資源」。
Cloud TPU 預設配額
下表列出各可用區的隨需和先占配額預設值。這些值指定了專案中可使用的 TPU 核心數量上限。
先占配額
| TPU 版本 | 預設配額 (核心數量) | 配額名稱 |
|---|---|---|
| v6e | 1536 個核心 | 每個可用區中每項專案的先占 TPU v6e 核心 |
| v5p | 768 個核心 | 每個可用區中每項專案的先占 TPU v5p 核心 |
| v5e | 1536 個核心 | 每個可用區中每項專案的先占 TPU v5 Lite Pod 核心 |
| v4 | 0 個核心 | 每個可用區中每項專案的先占 TPU v4 Pod 核心 |
| v3 Pod | 32 個核心 | 每個可用區中每項專案的先占 TPU v3 Pod 核心 |
| v3 | 120 個核心 | 每個可用區中每項專案的先占 TPU v3 核心 |
| v2 Pod | 32 個核心 | 每個區域中每項專案的先占 TPU v2 Pod 核心 |
| v2 | 120 個核心 | 每個可用區中每項專案的先占 TPU v2 核心 |
隨選配額
| TPU 版本 | 預設配額 (核心數量) | 配額名稱 |
|---|---|---|
| v6e | 512 個核心 | 每個可用區中每項專案的 TPU v6e 核心 |
| v5p | 128 個核心 | 每個區域中每項專案的 TPU v5p 核心 |
| v5e | 512 個核心 | 每個區域中每項專案的 TPU v5 LitePod 核心數 |
| v4 | 0 個核心 | 每個可用區中每項專案的 TPU v4 Pod 核心 |
| v3 Pod | 32 個核心 | 每個可用區中每項專案的 TPU v3 Pod 核心 |
| v3 | 40 個核心 | 每個可用區中每項專案的 TPU v3 核心數 |
| v2 Pod | 32 個核心 | 每個區域中每項專案的 TPU v2 Pod 核心 |
| v2 | 40 個核心 | 每個區域中每項專案的 TPU v2 核心 |
查看及要求額外配額
您可以在 Google Cloud 控制台的「配額」頁面,查看 Google Cloud 專案的配額。
如需更多 Cloud TPU 配額,請前往「配額」頁面提出申請。如要找出要增加的配額,請按一下垂直排列的三個點,然後選擇「編輯配額」。詳情請參閱「要求調整配額」。如果要求的配額低於自動核准門檻,系統會自動核准要求。
先占配額
| TPU 版本 | 自動核准門檻 | 配額名稱 |
|---|---|---|
| v6e | 所有可用區:0 個核心 | 每個可用區中每項專案的先占 TPU v6e 核心 |
| v5p | 所有可用區:0 個核心 | 每個可用區中每項專案的先占 TPU v5p 核心 |
| v5e |
|
每個可用區中每項專案的先占 TPU v5 Lite Pod 核心 |
| v4 | 所有可用區:0 個核心 | 每個可用區中每項專案的先占 TPU v4 Pod 核心 |
| v3 Pod |
|
每個可用區中每項專案的先占 TPU v3 Pod 核心 |
| v3 |
|
每個可用區中每項專案的先占 TPU v3 核心 |
| v2 Pod |
|
每個區域中每項專案的先占 TPU v2 Pod 核心 |
| v2 |
|
每個可用區中每項專案的先占 TPU v2 核心 |
隨選配額
| TPU 版本 | 自動核准門檻 | 配額名稱 |
|---|---|---|
| v6e | 所有可用區:0 個核心 | 每個可用區中每項專案的 TPU v6e 核心 |
| v5p | us-east5-a:64 核心 | 每個區域中每項專案的 TPU v5p 核心 |
| v5e | 所有可用區:64 個核心 | 每個區域中每項專案的 TPU v5 LitePod 核心數 |
| v4 | 所有可用區:0 個核心 | 每個區域中每項專案的 TPU v4 Pod 核心 |
| v3 Pod |
|
每個可用區中每項專案的 TPU v3 Pod 核心 |
| v3 |
|
每個可用區中每項專案的 TPU v3 核心 |
| v2 Pod |
|
每個可用區中每項專案的 TPU v2 Pod 核心 |
| v2 |
|
每個可用區中每項專案的 TPU v2 核心 |
您會收到電子郵件,瞭解配額要求是否獲得核准。 Google Cloud 服務配額會逐步增加。這可能會導致不同區域或資源持續推出。在推出期間, Google Cloud 控制台或 Cloud Quotas API 中顯示的配額值,不會反映新的配額值,直到推出完成為止。詳情請參閱「查看進行中的推出作業」。