配額與系統限制

這份文件列出 Gemini Enterprise 適用的配額和系統限制。

  • 「配額」有預設值,但通常可以申請調整。
  • 「系統限制」是固定值,無法變更。

Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。

Cloud Quotas 系統具備以下功能:

如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。

配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。

詳情請參閱「Cloud Quotas 總覽」。

Gemini Enterprise 資源也有「系統限制」, 而且無法變更。

如要瞭解 Gemini Enterprise 的超量費用,請參閱「配額與超量」。

分配配額

下表列出 Discovery Engine API 的配額。這些配額不會在一段時間後重設。而是會在您釋放資源時釋出。如果預設配額不足,可以申請提高配額

配額
每項專案的資料儲存區總數 100*
每個專案的引擎總數 150
每個專案在各個位置 (全球、美國、歐盟) 的資料儲存庫數量 100
每個位置 (全球、美國、歐盟) 每項專案的區域文件數 10,000,000
每個專案在每個位置 (全球、美國、歐盟) 的引擎數量上限 150

* 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。

由於技術限制,每個專案的引擎配額上限為 500 個。如需更多引擎,請使用新專案。

頻率配額

下列配額適用於 Discovery Engine API 要求。 如果預設配額不足,可以申請提高配額

配額
每項專案每分鐘的完整查詢要求數 300
每個位置 (全球、美國、歐盟) 每項專案每分鐘的區域搜尋要求數 300

申請提高配額

如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。