Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。
Cloud Quotas 系統具備以下功能:
如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。
配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。
詳情請參閱「Cloud Quotas 總覽」。
Vertex AI 資源也設有限制。這些限制與配額系統無關。限制無法變更。
頻率配額
特定專案和支援區域的 Vertex AI 要求適用下列配額規定。舉例來說,在單一專案中,您每分鐘可於某個地區提出最多 30,000 個線上推論要求,而在另一個支援的地區每分鐘則可另外提出 30,000 個線上推論要求。
如要瞭解 Gemini 模型的配額,請參閱「Vertex AI 的生成式 AI 配額和系統限制」。 如要瞭解 OpenMaaS 和第三方 MaaS 模型的配額,請參閱 Vertex AI MaaS 代管模型。如需 Llama 4 Maverick 的範例,請參閱 Llama 4 Maverick 17B-128E。
| 要求類型 | 每分鐘要求數 |
|---|---|
| 資源管理 (CRUD) 要求1 | 600 |
| 工作或長時間執行的作業 (LRO) 提交要求3 | 60 |
| 線上推論要求2 | 30,000 |
| 線上推論要求處理量 | 1.5 GB |
| 線上說明要求 | 600 |
| Vertex AI TensorBoard 時間序列讀取要求 | 60,000 |
| 機器學習中繼資料 (CRUD) 要求 | 12,000 |
| 生成式 AI 快取 (CRUD) 要求 | 200 |
| Vertex AI Vizier (CRUD) 請求 | 6,000 |
| Vertex AI 特徵儲存庫線上服務要求 | 300,000 |
| Vertex 機器學習中繼資料要求 | 12,000 |
| 計算詞元數或運算詞元數的要求數量 | 3,000 |
1 資源管理要求包括任何非作業、LRO、線上推論要求、Vertex AI Vizier 要求、ML 中繼資料要求、Vertex AI TensorBoard Timeseries Insights API 讀取要求、Vertex AI 特徵儲存庫要求、Vertex AI 特徵儲存庫串流要求或向量搜尋要求。資源管理要求可以是全域或區域性。
2 這項配額僅適用於公開端點。
3 職缺或 LRO 提交要求可以是全域或區域性。
工作或長時間執行的作業則包含下列要求:
- 建立或刪除資料集。
- 將資料匯入資料集,或是從資料集匯出資料。
- 建立端點。
- 建立或刪除自訂工作。
- 建立或刪除資料標籤工作。
- 建立或刪除超參數調整工作。
- 建立或刪除批次推論工作。
- 建立或刪除模型。
- 上傳、刪除或匯出模型。
- 建立或刪除筆記本執行階段範本。
- 指派、刪除、啟動或升級筆記本執行階段。
- 建立、刪除或更新模型監控器。
- 建立或刪除模型監控工作。
如需生成式 AI 模型的配額資訊,請參閱「Vertex AI 的生成式 AI 配額和限制」。
AutoML 模型配額
特定專案或地區的各個資料類型與目標適用下列配額規定。比方說,您可以在某個專案和地區中部署 10 個 AutoML 圖片分類模型和 10 個 AutoML 圖片物件偵測模型,總計可部署 20 個模型。
圖片
分類
| 配額 | 值 |
|---|---|
| 並行訓練工作 | 5 |
| 並行訓練工作 (含 Explainable AI) | 2 |
| 並行批次推論工作 | 5 |
| 並行模型部署工作 | 5 |
| 並行取消部署模型的工作 | 5 |
| 已部署的模型數量 | 10 |
物件偵測
| 配額 | 值 |
|---|---|
| 並行訓練工作 | 5 |
| 並行批次推論工作 | 5 |
| 已部署的模型數量 | 10 |
表格型
| 配額 | 值 |
|---|---|
| 並行訓練工作 | 5 |
| 並行批次推論工作 | 5 |
| 已部署的模型數量 | 30 |
Vertex AI Model Registry
Vertex AI Model Registry 支援的模型大小上限為 1 TB。
AutoML 模型限制
特定專案或地區的各個資料類型適用下列限制。舉例來說,在特定專案和區域中,您可以在批次要求輸入內容中納入最多 1,000,000 張圖片。
圖片
| 限制類型 | 值 |
|---|---|
| 圖片檔大小 | 上限:30 MB |
| 每個資料集的圖片數 | 上限:100 萬張 |
| 每個資料集的標籤數 | 下限:2 個 上限:5,000 個 |
| 每個標籤的圖片數 | 下限:10 張 建議:1,000 張 |
| 批次輸入 CSV 檔案大小 | 上限:100 MB |
| 批次輸入圖片數 | 上限:100 萬張 |
表格
| 限制類型 | 值 |
|---|---|
| 大小上限 | 100 GB |
| 列數 | 擁有 1,000 至 100,000,000 列的資料 |
| 欄數 | 擁有 2 至 1,000 個資料欄 |
| 同時執行的資料集匯入作業數量 | 5 次匯入 |
| CSV 檔案大小 | 上限:每個檔案 10 GB,總大小上限為 100 GB |
自訂訓練模型配額
特定專案或地區的 Vertex AI 自訂訓練模型適用下列配額規定。
訓練
| 配額 | 值 |
|---|---|
| 並行自訂訓練 pipeline | 2,000 |
| 每個區域用於訓練的 N1 和 E2 CPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 2,200 |
us-west2 | 20 |
us-west3 | 2,200 |
us-west4 | 20 |
us-central1 | 2,200 |
us-east1 | 2,200 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 450 |
northamerica-northeast1 | 2,200 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 2,200 |
europe-west1 | 2,200 |
europe-west4 | 2,200 |
europe-west6 | 20 |
europe-west3 | 2,200 |
europe-north1 | 20 |
europe-central2 | 450 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 2,200 |
asia-south2 | 20 |
asia-southeast1 | 2,200 |
asia-southeast2 | 2,200 |
asia-east2 | 2,200 |
asia-east1 | 2,200 |
asia-northeast1 | 2,200 |
asia-northeast2 | 20 |
australia-southeast1 | 2,200 |
australia-southeast2 | 20 |
asia-northeast3 | 2,200 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
| 每個地區用於訓練的 N2 CPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-south2 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
| 每個區域用於訓練的 M1 CPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 0 |
us-west3 | 0 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 0 |
northamerica-northeast1 | 0 |
northamerica-northeast2 | 0 |
southamerica-east1 | 0 |
southamerica-west1 | 0 |
europe-west2 | 0 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 0 |
europe-west3 | 0 |
europe-north1 | 0 |
europe-central2 | 0 |
europe-west8 | 0 |
europe-west9 | 0 |
europe-southwest1 | 0 |
asia-south1 | 0 |
asia-south2 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 0 |
asia-east2 | 0 |
asia-east1 | 0 |
asia-northeast1 | 0 |
asia-northeast2 | 0 |
australia-southeast1 | 0 |
australia-southeast2 | 0 |
asia-northeast3 | 0 |
me-west1 | 0 |
me-central1 | 0 |
me-central2 | 0 |
europe-west12 | 0 |
africa-south1 | 0 |
| 每個區域用於訓練的 C2 CPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-south2 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 20 |
me-central2 | 20 |
europe-west12 | 20 |
africa-south1 | 20 |
| 每個地區用於訓練的 A2 CPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 無限制 |
us-east1 | 無限制 |
us-east4 | 無限制 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 無限制 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 無限制 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 無限制 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域用於訓練的並行 A3 CPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 無限制 |
us-west2 | 無限制 |
us-west3 | 無限制 |
us-west4 | 無限制 |
us-central1 | 無限制 |
us-east1 | 無限制 |
us-east4 | 無限制 |
us-east5 | 無限制 |
us-south1 | 無限制 |
northamerica-northeast1 | 無限制 |
northamerica-northeast2 | 無限制 |
southamerica-east1 | 無限制 |
southamerica-west1 | 無限制 |
europe-west2 | 無限制 |
europe-west1 | 無限制 |
europe-west4 | 無限制 |
europe-west6 | 無限制 |
europe-west3 | 無限制 |
europe-north1 | 無限制 |
europe-central2 | 無限制 |
europe-west8 | 無限制 |
europe-west9 | 無限制 |
europe-southwest1 | 無限制 |
asia-south1 | 無限制 |
asia-south2 | 無限制 |
asia-southeast1 | 無限制 |
asia-southeast2 | 無限制 |
asia-east2 | 無限制 |
asia-east1 | 無限制 |
asia-northeast1 | 無限制 |
asia-northeast2 | 無限制 |
australia-southeast1 | 無限制 |
australia-southeast2 | 無限制 |
asia-northeast3 | 無限制 |
me-west1 | 無限制 |
me-central1 | 無限制 |
me-central2 | 無限制 |
europe-west12 | 無限制 |
africa-south1 | 無限制 |
| 每個區域用於訓練的並行 H200 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 8 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 0 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 8 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於訓練的 P4 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 6 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 6 |
us-east1 | 不適用 |
us-east4 | 1 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 6 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 6 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 6 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 6 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區的訓練用 T4 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 2 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 12 |
us-east1 | 2 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 6 |
europe-west1 | 不適用 |
europe-west4 | 2 |
europe-west6 | 不適用 |
europe-west3 | 0 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 6 |
asia-south2 | 不適用 |
asia-southeast1 | 1 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 6 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 1 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區的訓練用 L4 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 0 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 0 |
asia-south2 | 不適用 |
asia-southeast1 | 0 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 0 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 0 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於訓練的 RTX PRO 6000 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 0 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區的訓練用 P100 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 30 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 30 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 30 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 6 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區的訓練用 V100 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 6 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 6 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 6 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 6 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於訓練的 A100 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 8 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 8 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 8 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於訓練的並行 A100 80GB GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 0 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 0 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
詳情請參閱「查看及管理配額」。
| 每個區域用於訓練的並行 H100 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 0 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 0 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域用於訓練的並行 B200 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 0 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 0 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於訓練的並行 GB200 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於訓練的並行 H100 Mega GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 0 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 0 |
asia-northeast2 | 不適用 |
australia-southeast1 | 0 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
詳情請參閱「查看及管理配額」。
| 每個區域用於訓練的 TPU V2 核心數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 0 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域用於訓練的 TPU V2 Pod 核心數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 不適用 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域的訓練用 TPU V3 核心數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 0 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域用於訓練的 TPU V3 Pod 核心數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 不適用 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 訓練期間的 HDD 用量 (GB),按區域劃分 | |
|---|---|
| 區域 | 值 |
us-west1 | 180,000 |
us-west2 | 3,600 |
us-west3 | 180,000 |
us-west4 | 3,600 |
us-central1 | 180,000 |
us-east1 | 180,000 |
us-east4 | 3,600 |
us-east5 | 3,600 |
us-south1 | 180,000 |
northamerica-northeast1 | 180,000 |
northamerica-northeast2 | 3,600 |
southamerica-east1 | 3,600 |
southamerica-west1 | 3,600 |
europe-west2 | 180,000 |
europe-west1 | 180,000 |
europe-west4 | 180,000 |
europe-west6 | 3,600 |
europe-west3 | 180,000 |
europe-north1 | 3,600 |
europe-central2 | 180,000 |
europe-west8 | 3,600 |
europe-west9 | 180,000 |
europe-southwest1 | 3,600 |
asia-south1 | 180,000 |
asia-south2 | 3,600 |
asia-southeast1 | 180,000 |
asia-southeast2 | 180,000 |
asia-east2 | 180,000 |
asia-east1 | 180,000 |
asia-northeast1 | 180,000 |
asia-northeast2 | 3,600 |
australia-southeast1 | 180,000 |
australia-southeast2 | 3,600 |
asia-northeast3 | 180,000 |
me-west1 | 180,000 |
me-central1 | 3,600 |
me-central2 | 3,600 |
europe-west12 | 3,600 |
africa-south1 | 3,600 |
| 訓練期間的 SSD 用量 (GB),按區域劃分 | |
|---|---|
| 區域 | 值 |
us-west1 | 75,000 |
us-west2 | 450 |
us-west3 | 75,000 |
us-west4 | 450 |
us-central1 | 75,000 |
us-east1 | 75,000 |
us-east4 | 450 |
us-east5 | 450 |
us-south1 | 75,000 |
northamerica-northeast1 | 75,000 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 75,000 |
europe-west1 | 75,000 |
europe-west4 | 75,000 |
europe-west6 | 450 |
europe-west3 | 75,000 |
europe-north1 | 450 |
europe-central2 | 75,000 |
europe-west8 | 450 |
europe-west9 | 75,000 |
europe-southwest1 | 450 |
asia-south1 | 75,000 |
asia-south2 | 450 |
asia-southeast1 | 75,000 |
asia-southeast2 | 75,000 |
asia-east2 | 75,000 |
asia-east1 | 75,000 |
asia-northeast1 | 75,000 |
asia-northeast2 | 450 |
australia-southeast1 | 75,000 |
australia-southeast2 | 450 |
asia-northeast3 | 75,000 |
me-west1 | 75,000 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
| 訓練期間每個區域的 Hyperdisk Balanced 用量 (GB) | |
|---|---|
| 區域 | 值 |
us-west1 | 75,000 |
us-west2 | 450 |
us-west3 | 450 |
us-west4 | 450 |
us-central1 | 75,000 |
us-east1 | 450 |
us-east4 | 75,000 |
us-east5 | 450 |
us-south1 | 75,000 |
northamerica-northeast1 | 450 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 450 |
europe-west1 | 75,000 |
europe-west4 | 75,000 |
europe-west6 | 450 |
europe-west3 | 450 |
europe-north1 | 450 |
europe-central2 | 450 |
europe-west8 | 450 |
europe-west9 | 450 |
europe-southwest1 | 450 |
asia-south1 | 75,000 |
asia-south2 | 450 |
asia-southeast1 | 450 |
asia-southeast2 | 450 |
asia-east2 | 450 |
asia-east1 | 450 |
asia-northeast1 | 450 |
asia-northeast2 | 450 |
australia-southeast1 | 450 |
australia-southeast2 | 450 |
asia-northeast3 | 450 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
供應
| 配額 | 值 |
|---|---|
| 已部署的自訂模型副本數量 | 100 |
| 每個區域的服務 CPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 2,200 |
us-west2 | 2,200 |
us-west3 | 2,200 |
us-west4 | 16 |
us-central1 | 2,200 |
us-east1 | 2,200 |
us-east4 | 2,200 |
us-east5 | 16 |
us-south1 | 450 |
northamerica-northeast1 | 2,200 |
northamerica-northeast2 | 450 |
southamerica-east1 | 2,200 |
southamerica-west1 | 450 |
europe-west2 | 2,200 |
europe-west1 | 2,200 |
europe-west4 | 2,200 |
europe-west6 | 2,200 |
europe-west3 | 2,200 |
europe-north1 | 16 |
europe-central2 | 450 |
europe-west8 | 16 |
europe-west9 | 16 |
europe-southwest1 | 16 |
asia-south1 | 2,200 |
asia-south2 | 16 |
asia-southeast1 | 2,200 |
asia-southeast2 | 2,200 |
asia-east2 | 2,200 |
asia-east1 | 2,200 |
asia-northeast1 | 2,200 |
asia-northeast2 | 16 |
australia-southeast1 | 2,200 |
australia-southeast2 | 16 |
asia-northeast3 | 2,200 |
me-west1 | 450 |
me-central1 | 16 |
me-central2 | 16 |
europe-west12 | 16 |
africa-south1 | 16 |
| 每個地區用於服務的並行 H200 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 0 |
us-east5 | 不適用 |
us-south1 | 8 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 0 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 8 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於服務的 P100 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 30 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 30 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 30 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於服務的 P4 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 6 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 6 |
us-east1 | 不適用 |
us-east4 | 6 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 6 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 6 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 6 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 6 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域的服務用 T4 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 12 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 12 |
us-east1 | 12 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 12 |
europe-west1 | 不適用 |
europe-west4 | 12 |
europe-west6 | 不適用 |
europe-west3 | 0 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 6 |
asia-south2 | 不適用 |
asia-southeast1 | 6 |
asia-southeast2 | 不適用 |
asia-east2 | 12 |
asia-east1 | 6 |
asia-northeast1 | 6 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 6 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域用於服務的 L4 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 28 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 28 |
us-east1 | 28 |
us-east4 | 28 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 28 |
europe-west1 | 28 |
europe-west4 | 28 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 28 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 28 |
asia-northeast1 | 28 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於服務的 V100 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 6 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 6 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 6 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域用於服務的 A100 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 14 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 14 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 14 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 14 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 14 |
me-west1 | 1 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於服務的 A100 80GB GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 1 |
us-east1 | 不適用 |
us-east4 | 1 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 1 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 1 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於服務的並行 B200 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於服務的並行 GB200 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 不適用 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域的 H100 GPU 數量 (用於提供服務) | |
|---|---|
| 區域 | 值 |
us-west1 | 8 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 16 |
us-east1 | 不適用 |
us-east4 | 0 |
us-east5 | 16 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 16 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 16 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域用於服務的 H100 Mega GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 不適用 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 0 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 0 |
asia-northeast2 | 不適用 |
australia-southeast1 | 0 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個地區用於服務的 RTX Pro 6000 GPU 數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 0 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 不適用 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域的服務用 v5e TPU 晶片數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 4 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 0 |
us-central1 | 32 |
us-east1 | 不適用 |
us-east4 | 不適用 |
us-east5 | 不適用 |
us-south1 | 32 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 32 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 32 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 不適用 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
| 每個區域的服務用 v6e TPU 晶片數量 | |
|---|---|
| 區域 | 值 |
us-west1 | 不適用 |
us-west2 | 不適用 |
us-west3 | 不適用 |
us-west4 | 不適用 |
us-central1 | 不適用 |
us-east1 | 0 |
us-east4 | 不適用 |
us-east5 | 0 |
us-south1 | 不適用 |
northamerica-northeast1 | 不適用 |
northamerica-northeast2 | 不適用 |
southamerica-east1 | 不適用 |
southamerica-west1 | 不適用 |
europe-west2 | 不適用 |
europe-west1 | 不適用 |
europe-west4 | 8 |
europe-west6 | 不適用 |
europe-west3 | 不適用 |
europe-north1 | 不適用 |
europe-central2 | 不適用 |
europe-west8 | 不適用 |
europe-west9 | 不適用 |
europe-southwest1 | 不適用 |
asia-south1 | 不適用 |
asia-south2 | 不適用 |
asia-southeast1 | 不適用 |
asia-southeast2 | 不適用 |
asia-east2 | 不適用 |
asia-east1 | 不適用 |
asia-northeast1 | 0 |
asia-northeast2 | 不適用 |
australia-southeast1 | 不適用 |
australia-southeast2 | 不適用 |
asia-northeast3 | 不適用 |
me-west1 | 不適用 |
me-central1 | 不適用 |
me-central2 | 不適用 |
europe-west12 | 不適用 |
africa-south1 | 不適用 |
自訂訓練模型限制
特定專案或地區的 Vertex AI 自訂訓練模型適用下列限制。
供應
| 限制 | 值 |
|---|---|
| 每項專案的副本數量 | 200 |
| 每個叢集的容器數 | 25,000 |
Vertex AI 特徵儲存庫
本節列出下列項目的配額與限制:
Vertex AI 特徵儲存庫
特定專案或地區適用下列配額規定。舉例來說,在單一專案中,您可以在 us-central1 中有 200 個線上服務節點,在 us-east4 中有另外 50 個節點。
| 配額 | 值 |
|---|---|
| 每分鐘線上服務要求數 | 300,000 |
FeatureOnlineStore 執行個體數量上限 |
10 |
| 每分鐘的搜尋要求次數上限 | 6,000,000 |
專案中所有最佳化FeatureOnlineStore執行個體的線上服務節點數量上限 |
80 |
所有 FeatureOnlineStore 執行個體的 FeatureView 執行個體數量上限 |
30 |
Vertex AI 特徵儲存庫也有下列限制。您無法申請提高下表中的任何限制:
| 限制 | 值 |
|---|---|
專案和位置中的 FeatureGroup 資源數量上限 |
250 |
FeatureGroup 中的 Feature 資源數量上限 |
10,000 |
| 每個實體的特徵資料大小上限 | 5 MB |
每個線上放送要求中的實體 ID 數量 (FetchFeatureValues) |
1 |
| 實體 ID 長度上限 | 4,076 個字元 |
| 最佳化線上提供節點的儲存空間限制 | 200 GB |
Vertex AI 特徵儲存庫 (舊版)
特定專案或地區適用下列配額規定。舉例來說,在單一專案中,您可以在 us-central1 中執行 75 項並行批次工作,在 europe-west4 中執行另外 75 項工作。
| 配額 | 值 |
|---|---|
| 每分鐘線上服務要求數 | 300,000 |
| 每分鐘串流擷取要求數 | 60,000 |
| 每分鐘串流擷取寫入處理量 | 1.2 GB |
| 每分鐘特徵建立要求數 | 100 |
| 所有特徵商店的線上供應節點 | 30 |
| 並行批次工作 (攝取、提供及刪除特徵值) | 75 |
| 並行刪除特徵值的要求 | 1 |
| 所有特徵商店的實體類型 | 75 |
Vertex AI 特徵儲存庫 (舊版) 也有下列限制。您無法申請提高下表中的任何限制:
| 限制 | 值 |
|---|---|
| 線上供應節點的儲存空間上限 | 5 TB |
| 離線商店中的資料總量 | 無限制 |
| 每個實體類型的特徵 | 5,000 |
| 每個專案在每個區域每天建立、更新及刪除特徵商店的要求次數 | 500 |
| 串流擷取作業的單次要求大小 | 1 MB |
| 串流讀取時,每個要求可包含的實體數量 | 100 |
| 批次匯入時,每項要求可納入的檔案數量 | Avro 格式為 5,000 個,CSV 格式為 500 個 |
| 批次供應和匯出作業可要求的功能數量 | 5,000 |
| 如為批次擷取和串流擷取,可擷取特徵資料的最舊時間戳記 | 自目前日期起 4,000 天 |
Vertex AI 特徵儲存庫 (舊版) 的資料保留期限預設值如下,您可以覆寫此值:
| 資料保留預設值 | 預設值 |
|---|---|
| 離線儲存庫中的資料保留期限 (系統會刪除時間戳記早於此時間的特徵值) | 自目前日期起 4,000 天 |
| 線上商店中的資料保留期限 (系統會刪除超過保留期限的特徵值) | 自目前日期起 4,000 天 |
您可以透過下列方式覆寫資料保留期限:
如要覆寫網路商店的資料保留期限,請在建立或更新特徵儲存庫時設定
online_storage_ttl_days參數。如要覆寫離線商店的資料保留限制,請在建立或更新實體類型時設定
offline_storage_ttl_days參數。
Vector Search
特定專案在各個區域的 Vector Search 適用下列配額規定。
| 配額 | 值 |
|---|---|
| 並行建立索引作業 | 5 |
| 並行索引更新作業 | 5 |
| 已部署的索引節點數 | 50 |
| 已部署的索引 N2D 節點數量 | 5 |
| 索引數量 | 100 |
| 每分鐘串流更新要求數 | 6,000 |
| 每分鐘的串流更新輸送量(以 KB 為單位) | 120,000 |
Vertex 機器學習中繼資料
下列限制適用於各區域中特定專案的 Vertex 機器學習中繼資料。
| 限制 | 值 |
|---|---|
| 資源中繼資料欄位的序列化大小上限 | 204,800 個位元組 |
| 中繼資料結構定義的序列化大小上限 | 204,800 個位元組 |
Vertex AI Pipelines
特定專案在各個區域的 Vertex AI Pipelines 適用下列配額和限制。
| 配額 | 值 |
|---|---|
| 平行執行管道工作* | 600 |
| 並行管道執行作業* | 300 |
* 超過此限制的管道執行和工作要求會排入佇列,直到資源可用為止。
Vertex AI Pipelines 設有下列限制。請注意,與配額不同,您無法要求提高限制。
| 限制 | 值 |
|---|---|
| 每個工作的工作管線工作數 | 10,000 |
| 每個管道工作的輸入和輸出構件 | 100 |
| 每個管道作業的輸入和輸出構件 | 10,000 |
| 每個管道工作包含輸出參數和構件的 JSON 酬載大小上限 | 131,072 個位元組 |
| 管道工作的執行時間上限** | 7 天 |
* 如果管道工作超出這項限制,系統會取消工作。
Colab Enterprise 配額與限制
Colab Enterprise 的配額和限制會另外列出。請參閱「Colab Enterprise 配額與限制」。
增加配額
如要增加任何 Vertex AI 的配額,可以透過 Google Cloud 控制台申請提高配額。
如要進一步瞭解如何提交配額提高要求,請參閱「查看及管理配額」的下列章節:
各區域和模型的配額
在 Google Cloud 控制台中查看及編輯配額
如要在 Google Cloud 控制台中查看及編輯配額,請按照下列步驟操作:- 前往「配額與系統限制」頁面。
- 如要調整配額,請複製並貼上「Filter」(篩選器) 中的
aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model屬性。按下 Enter 鍵。 - 按一下資料列末尾的三點圖示,然後選取「編輯配額」。
- 在窗格中輸入新的配額值,然後按一下「提交要求」。
依區域和模型查看每分鐘要求數 (RPM) 配額
根據預設,Gemini 模型 2.0 以上版本會使用動態共用配額 (DSQ)。
下表列出各模型的每分鐘要求數。除非另有規定,否則所有區域的配額均相同。
| 基礎模型 | 每分鐘要求數 |
|---|---|
| base_model:gemini-2.0-flash-001 | 請參閱動態共用配額 (DSQ)。 |
| base_model : gemini-2.0-flash-lite-001 | 請參閱動態共用配額 (DSQ)。 |
| base_model : imagegeneration | 100 |
| base_model : imagetext | 500 |
| base_model:multimodalembedding | 120 |
| base_model:text-embedding | 1500 |
| base_model : gemini-embedding | 100000 |
| base_model:videotext | 愛荷華州 (us-central1):120 所有其他地區:不適用 |
| base_model : medlm-medium | 愛荷華州 (us-central1):3 所有其他區域:不適用 |
| base_model : medlm-large | 愛荷華州 (us-central1):3 所有其他區域:不適用 |
提高配額
如要增加任何 Vertex AI 的生成式 AI 配額,可以透過 Google Cloud 控制台申請提高配額。
RAG Engine 配額
如要讓各項服務使用 RAG 引擎執行檢索增強生成 (RAG),請遵守下列配額規定,配額以每分鐘要求數 (RPM) 計算。| 服務 | 配額 | 指標 |
|---|---|---|
| RAG Engine 資料管理 API | 60 RPM | VertexRagDataService requests per minute per region |
RetrievalContexts 個 API |
600 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1,500 RPM | Online prediction requests per base model per minute per region per base_model您可以指定的額外篩選條件為 base_model: textembedding-gecko |
| 服務 | 限制 | 指標 |
|---|---|---|
並行 ImportRagFiles 要求 |
3 RPM | VertexRagService concurrent import requests per region |
每個 ImportRagFiles 要求的檔案數量上限 |
10,000 | VertexRagService import rag files requests per region |
如要瞭解更多頻率限制和配額,請參閱 Vertex AI 的生成式 AI 頻率限制。
批次要求
所有區域的批次推論工作配額和限制都相同。Gemini 模型並行批次推論工作限制
Gemini 模型沒有預先定義的批次推論配額限制。而是提供大量共用資源,並根據模型即時可用性,以及所有客戶對該模型的需求,動態分配資源。如果模型容量已達上限,且有大量顧客處於活躍狀態,系統可能會將批次要求排入佇列,等待容量空出。非 Gemini 模型並行批次推論工作配額
下表列出並行批次推論工作數量的配額,不適用於 Gemini 模型:| 配額 | 值 |
|---|---|
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs |
4 |
自訂訓練模型配額
特定專案和區域的 Generative AI on Vertex AI 微調模型適用下列配額:| 配額 | 值 |
|---|---|
| 每個地區的受限圖片訓練 TPU V3 Pod 核心 * 支援的地區 - europe-west4 |
64 |
| 每個區域的受限圖片訓練 Nvidia A100 80GB GPU * 支援的區域 - us-central1 * 支援的區域 - us-east4 |
8 2 |
文字嵌入限制
每個要求最多可有 250 個輸入文字 (每個輸入文字產生 1 個嵌入) 和 20,000 個權杖。系統只會使用每個輸入文字的前 2,048 個符記來計算嵌入。如果是gemini-embedding-001,配額會列在 gemini-embedding 名稱下方。每分鐘每個基礎模型嵌入內容輸入的權杖數
與先前主要受 RPM 配額限制的嵌入模型不同,Gemini Embedding 模型的配額會限制每個專案每分鐘可傳送的權杖數量。
| 配額 | 值 |
|---|---|
| 每分鐘嵌入內容輸入權杖數 | 5,000,000 |
Gen AI Evaluation Service 服務配額
Gen AI Evaluation Service 會使用gemini-2.0-flash 做為以模型為基礎的指標的預設評估模型。以模型為基礎的指標單一評估要求,可能會導致對 Gen AI Evaluation Service 提出多項基礎要求。系統會根據每個專案計算各模型的配額,也就是說,凡是導向 gemini-2.0-flash 的模型推論和模型評估要求,都會計入配額。下表列出 Gen AI Evaluation Service 和基礎評估模型適用的配額:| 要求配額 | 預設配額 |
|---|---|
| 每分鐘的 Gen AI Evaluation Service 要求數 | 每個區域每項專案 1,000 個要求 |
每分鐘線上預測要求數 (base_model: gemini-2.0-flash) |
請參閱各區域和模型的配額。 |
| 並行評估執行作業 | 每個區域每項專案的並行評估執行次數上限為 20 次 |
如果您在使用 Gen AI 評估服務時收到配額相關錯誤,可能需要提出配額提高要求。詳情請參閱「查看及管理配額」。
| 限制 | 值 |
|---|---|
| Gen AI Evaluation Service 請求逾時 | 60 秒 |
在新的專案中首次使用生成式 AI 評估服務時,初始設定可能會延遲最多兩分鐘。如果第一次要求失敗,請稍候幾分鐘再重試。後續的評估要求通常會在 60 秒內完成。
模型式指標的輸入和輸出權杖上限取決於用來做為評估模型的模型。如需型號清單,請參閱 Google 型號。
管道評估配額
如果在評估管道服務中收到配額相關錯誤,可能需要提出配額增加要求。詳情請參閱「查看及管理配額」。 評估管道服務會使用 Vertex AI Pipelines 執行PipelineJobs。請參閱 Vertex AI Pipelines 的相關配額。以下是一般配額建議:
| 服務 | 配額 | 建議 |
|---|---|---|
| Vertex AI API | 每個區域的並行 LLM 批次預測工作 | 逐點:1 * num_concurrent_pipelines 逐對:2 * num_concurrent_pipelines |
| Vertex AI API | 每個區域每分鐘的評估要求數量 | 1000 * num_concurrent_pipelines |
| Tasks | 配額 | 基礎模型 | 建議 |
|---|---|---|---|
summarizationquestion_answering |
每個基礎模型、每個區域、每個 base_model 每分鐘的線上預測要求數 | text-bison |
60 * num_concurrent_pipelines |
Vertex AI Agent Engine 配額
下列配額適用於每個區域的特定專案 Vertex AI Agent Engine:| 說明 | 配額 | 指標 |
|---|---|---|
| 每分鐘建立、刪除或更新 Vertex AI Agent Engine 資源 | 10 | aiplatform.googleapis.com/reasoning_engine_service_write_requests |
| 每分鐘建立、刪除或更新 Vertex AI Agent Engine 工作階段 | 100 | aiplatform.googleapis.com/session_write_requests |
Query 或 StreamQuery Vertex AI Agent Engine 每分鐘 |
90 | aiplatform.googleapis.com/reasoning_engine_service_query_requests |
| 每分鐘將事件附加至 Vertex AI Agent Engine 工作階段 | 300 | aiplatform.googleapis.com/session_event_append_requests |
| Vertex AI Agent Engine 資源數量上限 | 100 | aiplatform.googleapis.com/reasoning_engine_service_entities |
| 每分鐘建立、刪除或更新 Vertex AI Agent Engine 記憶體資源 | 100 | aiplatform.googleapis.com/memory_bank_write_requests |
| 每分鐘從 Vertex AI Agent Engine Memory Bank 取得、列出或擷取資料 | 300 | aiplatform.googleapis.com/memory_bank_read_requests |
| 沙箱環境 (程式碼執行) 每分鐘的執行要求數 | 1000 | aiplatform.googleapis.com/sandbox_environment_execute_requests |
| 每個區域的沙箱環境 (程式碼執行) 實體 | 1000 | aiplatform.googleapis.com/sandbox_environment_entities |
每分鐘的 A2A Agent POST 要求,例如 sendMessage 和 cancelTask |
60 | aiplatform.googleapis.com/a2a_agent_post_requests |
每分鐘的 A2A 代理程式 get 要求,例如 getTask 和 getCard |
600 | aiplatform.googleapis.com/a2a_agent_get_requests |
每分鐘使用 BidiStreamQuery API 的並行即時雙向連線數 |
10 | aiplatform.googleapis.com/reasoning_engine_service_concurrent_query_requests |
排解錯誤代碼 429
如要排解 429 錯誤,請參閱「錯誤代碼 429」。
後續步驟
- 進一步瞭解 Vertex AI 的生成式 AI 配額和限制。