配額與系統限制

本文列出 Gemini Enterprise 適用的配額和系統限制。

  • 配額有預設值,但您通常可以申請調整。
  • 系統限制是無法變更的固定值。

Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性突然暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。

Cloud Quotas 系統會執行下列操作:

在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。

配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。

Gemini Enterprise 資源也有系統限制。 系統限制無法變更。

如要瞭解 Gemini Enterprise 的超量費用,請參閱「配額與超量」一文。

分配配額

下表列出 Discovery Engine API 的配額。這些配額不會在一段時間後重設。而是會在您釋放資源時釋出。如果預設配額不足,可以申請提高配額

配額
每項專案的資料儲存區總數 100*
每個專案的引擎總數 150
每項專案待處理的匯入長時間執行作業數 300
每個專案待處理的清除文件長時間執行作業數量 100
每項專案的放送控制項數量 1,000
每個供應設定的放送控制項數量 100
每個供應設定的篩選供應控制項數量 100
每個供應設定的重新導向供應控管機制數量 100
每個服務設定的同義字服務控制項數量 100
每個專案在各個位置 (全球、美國、歐盟) 的資料儲存庫數量 100
每個位置 (全球、美國、歐盟) 每項專案的區域文件數 10,000,000
每個專案在每個位置 (全球、美國、歐盟) 的引擎數量上限 150
每個位置每項專案的使用者事件區域數 (全球、美國、歐盟) 40,000,000,000

* 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。

由於技術限制,每個專案的引擎配額上限為 500 個。如需更多引擎,請使用新專案。

頻率配額

下列配額適用於 Discovery Engine API 要求。 如果預設配額不足,可以申請提高配額

配額
每項專案每分鐘的完整查詢要求數 300
每項專案每分鐘的對話式搜尋讀取要求數 300
每項專案每分鐘的對話式搜尋寫入要求數 300
每項專案每分鐘的文件批次要求 (例如內嵌匯入和清除) 100
每項專案每分鐘的文件非同步匯入 (Cloud Storage、BigQuery 等) 要求數 5
每項專案每分鐘的文件清除要求數 100
每項專案每分鐘的文件讀取要求數 300
每項專案每分鐘的文件寫入要求數 12,000
每項專案每日的評估建立要求數 5
每項專案每分鐘的評估讀取要求數 100
每項專案每分鐘的評估寫入要求數 100
每項專案每分鐘的基礎生成檢查基礎要求數 300
每項專案每分鐘的 LLM 查詢要求數 (搜尋摘要、多輪搜尋) 60
每分鐘待處理的 FHIR 或 BigQuery 串流寫入次數 6,000
每個專案的範例查詢集數量 100
每項專案每分鐘的 Ranking API 要求數 500
每項專案每分鐘的建議要求數 60,000
每項專案每分鐘的查詢讀取要求數範例 200
每項專案每分鐘的樣本查詢集讀取要求數 100
每項專案每分鐘的樣本查詢集寫入要求數 100
每項專案每分鐘的查詢寫入要求數範例 200
每項專案每分鐘的結構定義讀取要求數 100
每項專案每分鐘的結構定義寫入要求數 100
每項專案每分鐘每個位置 (全球、美國、歐盟) 的區域搜尋要求數 300
每項專案每分鐘的使用者事件批次要求 (例如匯入和清除) 100
每位使用者每項專案每分鐘的使用者事件收集要求數 240
每項專案每分鐘的使用者事件寫入要求數 60,000

申請提高配額

如要調整大部分配額,請使用 Google Cloud 控制台。 詳情請參閱「要求調整配額」。