這份文件列出 Gemini Enterprise 適用的配額和系統限制。
- 「配額」有預設值,但通常可以申請調整。
- 「系統限制」是固定值,無法變更。
Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。
Cloud Quotas 系統具備以下功能:
如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。
配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。
詳情請參閱「Cloud Quotas 總覽」。
Gemini Enterprise 資源也有「系統限制」, 而且無法變更。
如要瞭解 Gemini Enterprise 的超量費用,請參閱「配額與超量」。
分配配額
下表列出 Discovery Engine API 的配額。這些配額不會在一段時間後重設。而是會在您釋放資源時釋出。如果預設配額不足,可以申請提高配額。
| 配額 | 值 |
|---|---|
| 每項專案的資料儲存區總數 | 100* |
| 每個專案的引擎總數 | 150† |
| 每個專案在各個位置 (全球、美國、歐盟) 的資料儲存庫數量 | 100 |
| 每個位置 (全球、美國、歐盟) 每項專案的區域文件數 | 10,000,000 |
| 每個專案在每個位置 (全球、美國、歐盟) 的引擎數量上限 | 150 |
* 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。
† 由於技術限制,每個專案的引擎配額上限為 500 個。如需更多引擎,請使用新專案。
頻率配額
下列配額適用於 Discovery Engine API 要求。 如果預設配額不足,可以申請提高配額。
| 配額 | 值 |
|---|---|
| 每項專案每分鐘的完整查詢要求數 | 300 |
| 每個位置 (全球、美國、歐盟) 每項專案每分鐘的區域搜尋要求數 | 300 |
申請提高配額
如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。