本文列出 Vertex AI Search 適用的配額和系統限制。
- 「配額」有預設值,但通常可以申請調整。
- 「系統限制」是固定值,無法變更。
Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。
Cloud Quotas 系統具備以下功能:
如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。
配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。
詳情請參閱「Cloud Quotas 總覽」。
Vertex AI Search 資源也設有系統限制, 而且無法變更。
分配配額
下表列出 Discovery Engine API 的配額。這些配額不會隨時間重設。而是會在您釋放資源時釋出。如果預設配額不足,您可以申請提高配額。
| 配額 | 值 |
|---|---|
| 每項專案的資料儲存區總數 | 100* |
| 每個專案的引擎總數 | 150† |
| 每項專案待處理的匯入長時間執行作業數 | 300 |
| 每個專案待處理的清除文件長時間執行作業數量 | 100 |
| 每項專案的放送控制項數量 | 1,000 |
| 每個供應設定的放送控制項數量 | 100 |
| 每個供應設定的篩選供應控制項數量 | 100 |
| 每個供應設定的重新導向供應控制項數量 | 100 |
| 每個服務設定的同義字服務控制項數量 | 100 |
| 每個專案在各個位置 (全球、美國、歐盟) 的資料儲存庫數量 | 100 |
| 每個位置 (全球、美國、歐盟) 每項專案的區域文件數 | 10,000,000 |
| 每個專案在每個位置 (全球、美國、歐盟) 的引擎數量上限 | 150 |
| 每個位置每項專案的使用者事件區域數量 (全球、美國、歐盟) | 40,000,000,000 |
* 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。
† 由於技術限制,每個專案的引擎配額上限為 500 個。如需更多引擎,請使用新專案。
頻率配額
下列配額適用於 Discovery Engine API 要求。 如果預設配額不足,可以申請提高配額。
| 配額 | 值 |
|---|---|
| 每項專案每分鐘的完整查詢要求數 | 300 |
| 每項專案每分鐘的對話式搜尋讀取要求數 | 300 |
| 每項專案每分鐘的對話式搜尋寫入要求數 | 300 |
| 每項專案每分鐘的文件批次要求數 (例如內嵌匯入和清除) | 100 |
| 每項專案每分鐘的文件非同步匯入 (Cloud Storage、BigQuery 等) 要求數 | 5 |
| 每項專案每分鐘的文件清除要求數 | 100 |
| 每項專案每分鐘的文件讀取要求數 | 300 |
| 每項專案每分鐘的文件寫入要求數 | 12,000 |
| 每項專案每日的評估建立要求數 | 5 |
| 每項專案每分鐘的評估讀取要求數 | 100 |
| 每項專案每分鐘的評估寫入要求數 | 100 |
| 每項專案每分鐘的基礎生成檢查基礎要求數 | 300 |
| 每項專案每分鐘的 LLM 查詢要求數 (搜尋摘要、多輪搜尋) | 60 |
| 每分鐘待處理的 FHIR 或 BigQuery 串流寫入次數 | 6,000 |
| 每個專案的範例查詢集數量 | 100 |
| 每個專案每分鐘的 Ranking API 要求數 | 500 |
| 每項專案每分鐘的建議要求數 | 60,000 |
| 每項專案每分鐘的樣本查詢讀取要求數 | 200 |
| 每項專案每分鐘的樣本查詢集讀取要求數 | 100 |
| 每項專案每分鐘的樣本查詢集寫入要求數 | 100 |
| 每項專案每分鐘的查詢寫入要求數範例 | 200 |
| 每項專案每分鐘的結構定義讀取要求數 | 100 |
| 每項專案每分鐘的結構定義寫入要求數 | 100 |
| 每項專案每分鐘每個位置 (全球、美國、歐盟) 的區域搜尋要求數 | 300 |
| 每項專案每分鐘的使用者事件批次要求 (例如匯入和清除) | 100 |
| 每位使用者每項專案每分鐘的使用者事件收集要求數 | 240 |
| 每項專案每分鐘的使用者事件寫入要求數 | 60,000 |
網頁索引配額
如果資料存放區已啟用進階網站索引,您索引的每個網頁都會計入「每個專案的文件數量」配額,並顯示在「配額分配」清單中。您也可以在資料儲存庫的「Data」(資料) 頁面中,透過「Project pages vs quota」(專案頁面與配額) 欄位,查看專案中的頁面數量和該專案的頁面配額。
如果您在專案的資料存放區中新增網站,且這些網站中的網頁超出專案配額,系統就不會為這些網站建立索引。如果資料儲存庫中已有建立索引的網站,這些網站會繼續照常建立索引。您可以隨時要求升級配額。
申請提高配額
如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。