這份文件列出 Document AI 適用的配額和系統限制。
- 「配額」有預設值,但通常可以申請調整。
- 「系統限制」是固定值,無法變更。
Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。
Cloud Quotas 系統具備以下功能:
如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。
配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。
詳情請參閱「Cloud Quotas 總覽」。
如要增加專案的可用容量,請參閱容量預留要求。
服務級別
Document AI 支援兩種服務層級和相關配額,可供線上處理對生成式 AI 處理器版本的請求:預先佈建和盡力服務層級。
在佈建層級配額中,基本處理器版本 (例如自訂擷取器 v1.4 和 v1.5) 每分鐘可處理 120 頁,基本處理器版本 (例如自訂擷取器 v1.5 Pro) 則為每分鐘 30 頁。
盡力服務層級配額為基本處理器版本提供 120 個配額,例如自訂擷取器 v1.4 和 v1.5;為 Pro 處理器版本提供 60 個配額,例如自訂擷取器 v1.5 Pro。只有在已用盡佈建配額時,才會使用盡力服務層級配額。這適用於控制台中的配額 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (指標 best_effort_online_process_document_pages_us) 和 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (指標 best_effort_online_process_document_pages_eu)。
| 附註 | 自訂擷取器 1.4 版 (以 Gemini 2.0 Flash 為基礎) | 自訂擷取器 1.5 版 (以 Gemini 2.5 Flash 為基礎) | 自訂擷取器 1.5 Pro 版 (以 Gemini 2.5 Pro 為基礎) |
|---|---|---|---|
| 已佈建 | 120 | 120 | 30 |
| 盡可能取得容量 | 120 | 120 | 60 |
| 機構層級佈建 | 240 | 240 | 60 |
如果需要超過盡可能清除重複配額的上限,請與銷售團隊聯絡,提出配額增加要求 (QIR)。
如要在高流量期間確保有足夠的可用容量,請參閱提出容量預留要求一節。
最佳盡力服務層級不適用服務水準協議。
配額清單
Document AI 適用下列配額規定。 每項 Google Cloud 控制台專案都會受到這些配額規定的限制,且使用同一項專案的所有應用程式和 IP 位址會共用這些配額。
如要處理更多要求,請在Google Cloud 控制台中,為專案提交 Document AI 配額要求。
在要求中提供您的具體需求和用途資訊。
| 要求配額 | 預設值 | 附註 |
|---|---|---|
| 每分鐘要求數 | 每位使用者 1,800 個 | 在 Google Cloud 控制台中查看配額 |
| 每分鐘線上處理要求數 (美國) | 每項專案每種處理器類型 120 個 | 在 Google Cloud 控制台中查看配額 |
| 每分鐘線上處理要求數 (歐盟) | 每項專案每種處理器類型 120 個 | 在 Google Cloud 控制台中查看配額 |
| 每分鐘每種處理器類型和模型版本 (僅限使用 Gemini 2.0 Flash 的 Custom Extractor v1.4) 的線上處理文件頁數 (美國) | 每分鐘 120 頁* | 在 Google Cloud 控制台中查看配額 |
| 每分鐘線上處理的文件頁數 (歐盟),依處理器類型和模型版本計算 (僅限搭配 Gemini 2.0 Flash 的 Custom Extractor v1.4) | 每分鐘 120 頁* | 在 Google Cloud 控制台中查看配額 |
| 每分鐘每個處理器類型和模型版本 (僅限使用 Gemini 2.5 Flash 的自訂擷取器 v1.5) 的線上處理文件頁數 (美國) | 每分鐘 120 頁* | 在 Google Cloud 控制台中查看配額 |
| 每分鐘的線上處理文件頁數 (歐盟),依處理器類型和模型版本計算 (僅限搭配 Gemini 2.5 Flash 的自訂擷取器 v1.5) | 每分鐘 120 頁* | 在 Google Cloud 控制台中查看配額 |
| 每分鐘每種處理器類型和模型版本可處理的線上盡力處理文件頁數 (美國) | 每分鐘 120 頁‡ | 在 Google Cloud 控制台中查看配額 |
| 每分鐘每種處理器類型和模型版本可處理的線上盡力處理文件頁數 (歐盟) | 每分鐘 120 頁‡ | 在 Google Cloud 控制台中查看配額 |
| 每分鐘每個處理器類型和模型版本可處理的線上盡力處理文件頁數 (單一區域) | 每分鐘 120 頁‡ | 在 Google Cloud 控制台中查看配額 |
| 每分鐘線上處理要求數 (單一區域) | 每種處理器類型每項專案 6 個 | 在 Google Cloud 控制台中查看配額 |
| 每項專案和區域 (美國) 的並行批次處理要求數 | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
| 每個專案和區域的並行批次處理要求數 (歐盟) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
| 每個處理器的並行批次處理要求數 (單一區域) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
| 並行處理器版本訓練要求數 (美國) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
| 並行處理器版本訓練要求數 (歐盟) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
| 並行處理器版本訓練要求 (單一區域) | 每項專案 1 個† | 在 Google Cloud 控制台中查看配額 |
| 已部署的自訂處理器版本 (美國) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
| 已部署的自訂處理器版本 (歐盟) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
| 已部署的自訂處理器版本 (單一區域) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
| 已部署的生成式處理器版本 (美國) | 每項專案每個自訂擷取處理器 100 個 | 在 Google Cloud 控制台中查看配額 |
| 已部署的生成式處理器版本 (歐盟) | 每項專案每個自訂擷取處理器 100 個 | 在 Google Cloud 控制台中查看配額 |
| 已部署的生成式處理器版本 (單一區域) | 每項專案每個自訂擷取處理器 100 個 | 在 Google Cloud 控制台中查看配額 |
| 並行匯入文件要求 (美國) | 每項專案 3 個 | 在 Google Cloud 控制台中查看配額 |
| 並行匯入文件要求 (歐盟) | 每項專案 3 個 | 在 Google Cloud 控制台中查看配額 |
| 並行匯入文件要求 (單一區域) | 每項專案 3 個 | 在 Google Cloud 控制台中查看配額 |
| 並行匯出文件要求 (美國) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
| 並行匯出文件要求 (歐盟) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
| 並行匯出文件要求 (單一區域) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
* 這個版本目前不支援配額調整要求。
† australia-southeast1 支援配額調整要求。
‡ 視 Gemini 版本而異,請參閱服務層級。請參閱如何提出容量預留要求。
如果專案需要更多容量,請參閱容量預留。