Cloud TPU 配額

本文列出 Cloud TPU 適用的配額。如要瞭解 Cloud TPU 定價,請參閱 Cloud TPU 定價

Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。

Cloud Quotas 系統具備以下功能:

如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。

配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。

詳情請參閱「Cloud Quotas 總覽」。

TPU 配額

TPU 配額是指您可透過Google Cloud 專案使用的 Cloud TPU 核心數量上限。每個 TPU 版本都有專屬配額。此外,每個 Cloud TPU 版本配額都分為隨選配額和可先占 (或現貨) 配額。

建立 Cloud TPU 資源時,預設會建立隨選資源。使用 gcloud 指令建立資源時,可以透過 --spot 參數建立先佔資源。詳情請參閱「管理 TPU 資源」。

Cloud TPU 預設配額

下表列出各可用區的隨需和先占配額預設值。這些值指定了專案中可使用的 TPU 核心數量上限。

先占配額

TPU 版本 預設配額 (核心數量) 配額名稱
v6e 1536 個核心 每個可用區中每項專案的先占 TPU v6e 核心
v5p 768 個核心 每個可用區中每項專案的先占 TPU v5p 核心
v5e 1536 個核心 每個可用區中每項專案的先占 TPU v5 Lite Pod 核心
v4 0 個核心 每個可用區中每項專案的先占 TPU v4 Pod 核心
v3 Pod 32 個核心 每個可用區中每項專案的先占 TPU v3 Pod 核心
v3 120 個核心 每個可用區中每項專案的先占 TPU v3 核心
v2 Pod 32 個核心 每個區域中每項專案的先占 TPU v2 Pod 核心
v2 120 個核心 每個可用區中每項專案的先占 TPU v2 核心

隨選配額

TPU 版本 預設配額 (核心數量) 配額名稱
v6e 512 個核心 每個可用區中每項專案的 TPU v6e 核心
v5p 128 個核心 每個區域中每項專案的 TPU v5p 核心
v5e 512 個核心 每個區域中每項專案的 TPU v5 LitePod 核心數
v4 0 個核心 每個可用區中每項專案的 TPU v4 Pod 核心
v3 Pod 32 個核心 每個可用區中每項專案的 TPU v3 Pod 核心
v3 40 個核心 每個可用區中每項專案的 TPU v3 核心數
v2 Pod 32 個核心 每個區域中每項專案的 TPU v2 Pod 核心
v2 40 個核心 每個區域中每項專案的 TPU v2 核心

查看及要求額外配額

您可以在 Google Cloud 控制台的「配額」頁面,查看 Google Cloud 專案的配額。

如需更多 Cloud TPU 配額,請前往「配額」頁面提出申請。如要找出要增加的配額,請按一下垂直排列的三個點,然後選擇「編輯配額」。詳情請參閱「要求調整配額」。如果要求的配額低於自動核准門檻,系統會自動核准要求。

先占配額

TPU 版本 自動核准門檻 配額名稱
v6e 所有可用區:0 個核心 每個可用區中每項專案的先占 TPU v6e 核心
v5p 所有可用區:0 個核心 每個可用區中每項專案的先占 TPU v5p 核心
v5e
  • us-east5-b:800 個核心
  • us-west4-a:1600 個核心
  • us-west4-b:3968 個核心
  • us-west1-c:576 個核心
  • us-central1-a:3264 個核心
  • europe-west4-a:4032 個核心
每個可用區中每項專案的先占 TPU v5 Lite Pod 核心
v4 所有可用區:0 個核心 每個可用區中每項專案的先占 TPU v4 Pod 核心
v3 Pod
  • europe-west4-a:512 個核心
  • us-east1-d:320 個核心
每個可用區中每項專案的先占 TPU v3 Pod 核心
v3
  • us-central1-a:64 個核心
  • europe-west4-a:128 個核心
每個可用區中每項專案的先占 TPU v3 核心
v2 Pod
  • us-central1-a:64 個核心
  • europe-west4-a:64 個核心
每個區域中每項專案的先占 TPU v2 Pod 核心
v2
  • us-central1-b:128 個核心
  • us-central1-c:64 核心
  • us-central1-f:128 個核心
  • europe-west4-a:32 個核心
每個可用區中每項專案的先占 TPU v2 核心

隨選配額

TPU 版本 自動核准門檻 配額名稱
v6e 所有可用區:0 個核心 每個可用區中每項專案的 TPU v6e 核心
v5p us-east5-a:64 核心 每個區域中每項專案的 TPU v5p 核心
v5e 所有可用區:64 個核心 每個區域中每項專案的 TPU v5 LitePod 核心數
v4 所有可用區:0 個核心 每個區域中每項專案的 TPU v4 Pod 核心
v3 Pod
  • europe-west4-a:128 個核心
  • us-east1-d:64 個核心
每個可用區中每項專案的 TPU v3 Pod 核心
v3
  • us-central1-a:64 個核心
  • europe-west4-a:128 個核心
每個可用區中每項專案的 TPU v3 核心
v2 Pod
  • us-central1-a:64 個核心
  • europe-west4-a:64 個核心
每個可用區中每項專案的 TPU v2 Pod 核心
v2
  • us-central1-b:128 個核心
  • us-central1-c:64 核心
  • us-central1-f:128 個核心
  • europe-west4-a:32 個核心
每個可用區中每項專案的 TPU v2 核心

您會收到電子郵件,瞭解配額要求是否獲得核准。 Google Cloud 服務配額會逐步增加。這可能會導致不同區域或資源持續推出。在推出期間, Google Cloud 控制台或 Cloud Quotas API 中顯示的配額值,不會反映新的配額值,直到推出完成為止。詳情請參閱「查看進行中的推出作業」。