配額與系統限制

這份文件列出 Gemini Enterprise 適用的配額和系統限制。

  • 「配額」有預設值,但通常可以申請調整。
  • 「系統限制」是固定值,無法變更。

Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。

Cloud Quotas 系統具備以下功能:

如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。

配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。

詳情請參閱「Cloud Quotas 總覽」。

Gemini Enterprise 資源也有「系統限制」, 而且無法變更。

如要瞭解 Gemini Enterprise 的超量費用,請參閱「配額與超量」。

分配配額

下表列出 Discovery Engine API 的配額。這些配額不會隨時間重設。而是會在您釋放資源時釋出。如果預設配額不足,您可以申請提高配額

配額
每項專案的資料儲存區總數 100*
每個專案的引擎總數 150
每項專案待處理的匯入長時間執行作業數 300
每個專案待處理的清除文件長時間執行作業數量 100
每項專案的放送控制項數量 1,000
每個供應設定的放送控制項數量 100
每個供應設定的篩選供應控制項數量 100
每個供應設定的重新導向供應控制項數量 100
每個服務設定的同義字服務控制項數量 100
每個專案在各個位置 (全球、美國、歐盟) 的資料儲存庫數量 100
每個位置 (全球、美國、歐盟) 每項專案的區域文件數 10,000,000
每個專案在每個位置 (全球、美國、歐盟) 的引擎數量上限 150
每個位置每項專案的使用者事件區域數量 (全球、美國、歐盟) 40,000,000,000

* 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。

由於技術限制,每個專案的引擎配額上限為 500 個。如需更多引擎,請使用新專案。

頻率配額

下列配額適用於 Discovery Engine API 要求。 如果預設配額不足,可以申請提高配額

配額
每項專案每分鐘的完整查詢要求數 300
每項專案每分鐘的對話式搜尋讀取要求數 300
每項專案每分鐘的對話式搜尋寫入要求數 300
每項專案每分鐘的文件批次要求數 (例如內嵌匯入和清除) 100
每項專案每分鐘的文件非同步匯入 (Cloud Storage、BigQuery 等) 要求數 5
每項專案每分鐘的文件清除要求數 100
每項專案每分鐘的文件讀取要求數 300
每項專案每分鐘的文件寫入要求數 12,000
每項專案每日的評估建立要求數 5
每項專案每分鐘的評估讀取要求數 100
每項專案每分鐘的評估寫入要求數 100
每項專案每分鐘的基礎生成檢查基礎要求數 300
每項專案每分鐘的 LLM 查詢要求數 (搜尋摘要、多輪搜尋) 60
每分鐘待處理的 FHIR 或 BigQuery 串流寫入次數 6,000
每個專案的範例查詢集數量 100
每個專案每分鐘的 Ranking API 要求數 500
每項專案每分鐘的建議要求數 60,000
每項專案每分鐘的樣本查詢讀取要求數 200
每項專案每分鐘的樣本查詢集讀取要求數 100
每項專案每分鐘的樣本查詢集寫入要求數 100
每項專案每分鐘的查詢寫入要求數範例 200
每項專案每分鐘的結構定義讀取要求數 100
每項專案每分鐘的結構定義寫入要求數 100
每項專案每分鐘每個位置 (全球、美國、歐盟) 的區域搜尋要求數 300
每項專案每分鐘的使用者事件批次要求 (例如匯入和清除) 100
每位使用者每項專案每分鐘的使用者事件收集要求數 240
每項專案每分鐘的使用者事件寫入要求數 60,000

申請提高配額

如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。