在 Spanner 部署模式中,Vertex AI RAG 引擎會使用 RagManagedDb,這是全代管的企業級 Google Cloud Spanner 執行個體,Vertex AI RAG 引擎會將資源儲存在這個執行個體中。您也可以選擇將其做為 RAG 語料庫的向量資料庫。
透過 Spanner,Vertex AI RAG Engine 提供一致、高可用性且高度可擴充的專屬資料庫,支援您的應用程式。如要進一步瞭解 Google Cloud Spanner,請參閱「Spanner」。
資料儲存和向量搜尋
無論您選擇哪種向量資料庫,Vertex AI RAG 引擎都會將 RAG 語料庫和 RAG 檔案資源中繼資料儲存在 RagManagedDb 中。向量資料庫僅用於儲存及擷取嵌入內容。除了儲存資源,RagManagedDb 也可用於儲存及管理文件的向量表示法。接著,系統會根據文件與指定查詢的語意相似度,從向量資料庫擷取相關文件。
可用的等級
Vertex AI RAG 引擎提供兩種級別,可讓您根據用量和效能需求擴充 RagManagedDb 執行個體。您也可以使用第三層刪除 Vertex AI RAG 引擎資料。
層級是 RagEngineConfig 資源中提供的專案層級設定,會影響使用 RagManagedDb 的 RAG 語料庫。RagEngineConfig 提供下列層級:
擴充層級:這個層級提供正式環境規模的效能,以及自動調度資源功能。適合用於大量資料或易受效能影響的工作負載。在內部,這個層級會將 Spanner 執行個體設為自動調度資源設定,最少 1 個節點 (1,000 個處理單元),最多 10 個節點 (10,000 個處理單元)。
基本級別 (預設):這個級別的成本效益高,運算資源需求低,可能適合下列情況:
- 與下列對象一同進行實驗:
RagManagedDb - 資料量少
- 不易受延遲影響的工作負載
- 僅搭配使用 Vertex AI RAG 引擎與其他向量資料庫
- 與下列對象一同進行實驗:
如要提供基本級,RagManagedDb 會將基礎 Spanner 執行個體設為 100 個處理單元的固定設定,相當於 0.1 個節點。
- 未佈建層級:這個層級會刪除
RagManagedDb和底層的 Spanner 執行個體。「未佈建」層級會停用 Vertex AI RAG Engine 服務,並刪除這項服務中保存的資料,無論RagCorpora使用的向量資料庫為何。這樣一來,系統就會停止收取服務費用。如要進一步瞭解帳單,請參閱「Vertex AI RAG 引擎帳單」。
資料刪除後即無法復原。如要再次使用 Vertex AI RAG Engine,請呼叫 UpdateRagEngineConfig API 更新層級,或將模式切換為無伺服器。
管理等級
如要讀取及更新層級,請使用 GetRagEngineConfig 和 UpdateRagEngineConfig API。如需如何使用這些 API 的程式碼範例,請參閱「在模式之間切換」頁面。