配額與系統限制

本文列出 Gemini Enterprise 的配額和系統限制。系統限制是固定值,無法變更。與其他服務不同,Gemini Enterprise 配額不需要手動申請提高。 Google Cloud系統會根據您購買的授權或席位數量,自動調整配額。

Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。

Cloud Quotas 系統具備以下功能:

如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。

配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。

詳情請參閱「Cloud Quotas 總覽」。

Gemini Enterprise 資源也有「系統限制」,而且無法變更。

如要瞭解 Gemini Enterprise 的超量費用,請參閱「配額與超量」。

分配配額

下表列出 Discovery Engine API 的配額。這些配額不會在一段時間後重設。而是會在您釋放資源時釋出。

配額
每個專案的資料儲存區總數 1001
每項專案的引擎總數 1502
每個專案在各個位置 (全球、美國、歐盟) 的資料儲存庫數量 100
每個位置 (全球、美國、歐盟) 每項專案的區域文件數 10,000,000
每個專案在每個位置 (全球、美國、歐盟) 的引擎數量上限 150

1 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。
資料儲存庫中的每個實體都會計為資料儲存庫例項,因此會計入這項配額。舉例來說,如果資料儲存庫有三個實體,就會計入配額的三個資料儲存庫。

2 由於技術限制,每個專案的引擎配額上限為 500。如需更多引擎,請使用新專案。

eu

頻率配額

下列配額適用於 Discovery Engine API 要求。

配額
每項專案每分鐘的完整查詢要求數 300
每個位置 (全球、美國、歐盟) 每項專案每分鐘的區域搜尋要求數 300