配額與限制

本文列出 Vertex AI Search 適用的配額和系統限制。

  • 「配額」有預設值,但通常可以申請調整。
  • 「系統限制」是固定值,無法變更。

Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。

Cloud Quotas 系統具備以下功能:

如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。

配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。

詳情請參閱「Cloud Quotas 總覽」。

Vertex AI Search 資源也設有系統限制, 而且無法變更。

分配配額

下表列出 Discovery Engine API 的配額。這些配額不會隨時間重設。而是會在您釋放資源時釋出。如果預設配額不足,您可以申請提高配額

配額
每項專案的資料儲存區總數 100*
每個專案的引擎總數 150
每項專案待處理的匯入長時間執行作業數 300
每個專案待處理的清除文件長時間執行作業數量 100
每項專案的放送控制項數量 1,000
每個供應設定的放送控制項數量 100
每個供應設定的篩選供應控制項數量 100
每個供應設定的重新導向供應控制項數量 100
每個服務設定的同義字服務控制項數量 100
每個專案在各個位置 (全球、美國、歐盟) 的資料儲存庫數量 100
每個位置 (全球、美國、歐盟) 每項專案的區域文件數 10,000,000
每個專案在每個位置 (全球、美國、歐盟) 的引擎數量上限 150
每個位置每項專案的使用者事件區域數量 (全球、美國、歐盟) 40,000,000,000

* 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。

由於技術限制,每個專案的引擎配額上限為 500 個。如需更多引擎,請使用新專案。

頻率配額

下列配額適用於 Discovery Engine API 要求。 如果預設配額不足,可以申請提高配額

配額
每項專案每分鐘的完整查詢要求數 300
每項專案每分鐘的對話式搜尋讀取要求數 300
每項專案每分鐘的對話式搜尋寫入要求數 300
每項專案每分鐘的文件批次要求數 (例如內嵌匯入和清除) 100
每項專案每分鐘的文件非同步匯入 (Cloud Storage、BigQuery 等) 要求數 5
每項專案每分鐘的文件清除要求數 100
每項專案每分鐘的文件讀取要求數 300
每項專案每分鐘的文件寫入要求數 12,000
每項專案每日的評估建立要求數 5
每項專案每分鐘的評估讀取要求數 100
每項專案每分鐘的評估寫入要求數 100
每項專案每分鐘的基礎生成檢查基礎要求數 300
每項專案每分鐘的 LLM 查詢要求數 (搜尋摘要、多輪搜尋) 60
每分鐘待處理的 FHIR 或 BigQuery 串流寫入次數 6,000
每個專案的範例查詢集數量 100
每個專案每分鐘的 Ranking API 要求數 500
每項專案每分鐘的建議要求數 60,000
每項專案每分鐘的樣本查詢讀取要求數 200
每項專案每分鐘的樣本查詢集讀取要求數 100
每項專案每分鐘的樣本查詢集寫入要求數 100
每項專案每分鐘的查詢寫入要求數範例 200
每項專案每分鐘的結構定義讀取要求數 100
每項專案每分鐘的結構定義寫入要求數 100
每項專案每分鐘每個位置 (全球、美國、歐盟) 的區域搜尋要求數 300
每項專案每分鐘的使用者事件批次要求 (例如匯入和清除) 100
每位使用者每項專案每分鐘的使用者事件收集要求數 240
每項專案每分鐘的使用者事件寫入要求數 60,000

網頁索引配額

如果資料存放區已啟用進階網站索引,您索引的每個網頁都會計入「每個專案的文件數量」配額,並顯示在「配額分配」清單中。您也可以在資料儲存庫的「Data」(資料) 頁面中,透過「Project pages vs quota」(專案頁面與配額) 欄位,查看專案中的頁面數量和該專案的頁面配額。

如果您在專案的資料存放區中新增網站,且這些網站中的網頁超出專案配額,系統就不會為這些網站建立索引。如果資料儲存庫中已有建立索引的網站,這些網站會繼續照常建立索引。您可以隨時要求升級配額

申請提高配額

如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。