無伺服器模式

建議您使用無伺服器模式,開始使用 Vertex AI RAG 引擎。這項服務提供全代管且高度可擴充的資料庫,可支援 Vertex AI RAG Engine 資源,不必費心佈建或管理任何基礎架構設定。可快速上手,適合大多數使用者,包括企業規模。

無伺服器模式為預先發布版功能,僅適用於 us-central1。這項服務適用於所有使用者,不需要加入許可清單。

在無伺服器模式下,Vertex AI RAG Engine CUJ 與 Spanner 模式完全相同,但有以下主要差異:

  1. 使用無伺服器模式時,無法選擇 RagManagedDb 做為向量資料庫。新的預設向量資料庫是全代管且具備高擴充性的 RagManagedVertexVectorSearch。如要進一步瞭解這個向量資料庫,請參閱「運用 RAG 進行 Vector Search 2.0」。
  2. 無伺服器模式不支援客戶自行管理的加密金鑰 (CMEK)。

切換為無伺服器模式

如要切換為無伺服器模式,請參閱「切換模式」頁面。

刪除資料

如要從無伺服器部署模式刪除資料,請按照下列步驟操作:

  1. 確認有效模式已設為「無伺服器」。
  2. 呼叫 ListRagCorpora API,查看此模式下的資源。
  3. 使用 DeleteRagCorpus API 刪除每個語料庫。

定價

使用無伺服器部署模式不會產生額外費用,不過,如果 Spanner 模式仍處於啟用狀態,系統可能還是會向你收費。此外,您在 Vertex AI RAG 引擎上選擇的模型、重新排序和向量儲存空間,也可能會產生費用。詳情請參閱 Vertex AI RAG Engine 帳單頁面。