這份文件列出 Gemini Enterprise 適用的配額和系統限制。
- 「配額」有預設值,但通常可以申請調整。
- 「系統限制」是固定值,無法變更。
Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。
Cloud Quotas 系統具備以下功能:
如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。
配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。
詳情請參閱「Cloud Quotas 總覽」。
Gemini Enterprise 資源也有「系統限制」, 而且無法變更。
如要瞭解 Gemini Enterprise 的超量費用,請參閱「配額與超量」。
分配配額
下表列出 Discovery Engine API 的配額。這些配額不會隨時間重設。而是會在您釋放資源時釋出。如果預設配額不足,您可以申請提高配額。
| 配額 | 值 |
|---|---|
| 每項專案的資料儲存區總數 | 100* |
| 每個專案的引擎總數 | 150† |
| 每項專案待處理的匯入長時間執行作業數 | 300 |
| 每個專案待處理的清除文件長時間執行作業數量 | 100 |
| 每項專案的放送控制項數量 | 1,000 |
| 每個供應設定的放送控制項數量 | 100 |
| 每個供應設定的篩選供應控制項數量 | 100 |
| 每個供應設定的重新導向供應控制項數量 | 100 |
| 每個服務設定的同義字服務控制項數量 | 100 |
| 每個專案在各個位置 (全球、美國、歐盟) 的資料儲存庫數量 | 100 |
| 每個位置 (全球、美國、歐盟) 每項專案的區域文件數 | 10,000,000 |
| 每個專案在每個位置 (全球、美國、歐盟) 的引擎數量上限 | 150 |
| 每個位置每項專案的使用者事件區域數量 (全球、美國、歐盟) | 40,000,000,000 |
* 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。
† 由於技術限制,每個專案的引擎配額上限為 500 個。如需更多引擎,請使用新專案。
頻率配額
下列配額適用於 Discovery Engine API 要求。 如果預設配額不足,可以申請提高配額。
| 配額 | 值 |
|---|---|
| 每項專案每分鐘的完整查詢要求數 | 300 |
| 每項專案每分鐘的對話式搜尋讀取要求數 | 300 |
| 每項專案每分鐘的對話式搜尋寫入要求數 | 300 |
| 每項專案每分鐘的文件批次要求數 (例如內嵌匯入和清除) | 100 |
| 每項專案每分鐘的文件非同步匯入 (Cloud Storage、BigQuery 等) 要求數 | 5 |
| 每項專案每分鐘的文件清除要求數 | 100 |
| 每項專案每分鐘的文件讀取要求數 | 300 |
| 每項專案每分鐘的文件寫入要求數 | 12,000 |
| 每項專案每日的評估建立要求數 | 5 |
| 每項專案每分鐘的評估讀取要求數 | 100 |
| 每項專案每分鐘的評估寫入要求數 | 100 |
| 每項專案每分鐘的基礎生成檢查基礎要求數 | 300 |
| 每項專案每分鐘的 LLM 查詢要求數 (搜尋摘要、多輪搜尋) | 60 |
| 每分鐘待處理的 FHIR 或 BigQuery 串流寫入次數 | 6,000 |
| 每個專案的範例查詢集數量 | 100 |
| 每個專案每分鐘的 Ranking API 要求數 | 500 |
| 每項專案每分鐘的建議要求數 | 60,000 |
| 每項專案每分鐘的樣本查詢讀取要求數 | 200 |
| 每項專案每分鐘的樣本查詢集讀取要求數 | 100 |
| 每項專案每分鐘的樣本查詢集寫入要求數 | 100 |
| 每項專案每分鐘的查詢寫入要求數範例 | 200 |
| 每項專案每分鐘的結構定義讀取要求數 | 100 |
| 每項專案每分鐘的結構定義寫入要求數 | 100 |
| 每項專案每分鐘每個位置 (全球、美國、歐盟) 的區域搜尋要求數 | 300 |
| 每項專案每分鐘的使用者事件批次要求 (例如匯入和清除) | 100 |
| 每位使用者每項專案每分鐘的使用者事件收集要求數 | 240 |
| 每項專案每分鐘的使用者事件寫入要求數 | 60,000 |
申請提高配額
如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。