无服务器模式

建议使用无服务器模式开始使用 Vertex AI RAG 引擎。它提供了一个全托管且高度可伸缩的数据库来支持您的 Vertex AI RAG 引擎资源,而无需配置或管理任何基础架构配置。它提供快速的入门体验,适合大多数用户,包括企业级用户。

无服务器模式是一项预览版功能,仅在 us-central1 中提供。所有人都可以使用,无需任何许可名单。

在无服务器模式下,您的 Vertex AI RAG 引擎 CUJ 与 Spanner 模式下的 CUJ 保持一致,但存在以下主要区别:

  1. 使用无服务器模式时,RagManagedDb 不可用作向量数据库选项。相反,新的默认向量数据库是全托管且高度可伸缩的 RagManagedVertexVectorSearch。如需详细了解此向量数据库,请参阅将 Vector Search 2.0 与 RAG 搭配使用
  2. 无服务器模式不支持客户管理的加密密钥 (CMEK)。

切换到无服务器模式

如需切换到无服务器模式作为部署模式选项,请参阅切换模式页面。

删除您的数据

如需从无服务器部署模式中删除数据,请按以下步骤操作:

  1. 确保您的活动模式设置为无服务器。
  2. 调用 ListRagCorpora API 以查看此模式下的资源,
  3. 使用 DeleteRagCorpus API 删除每个语料库。

价格

使用无服务器部署模式不会产生额外费用。但是,如果您处于 Spanner 模式,可能仍需支付相关费用。此外,您还可能需要为在 Vertex AI RAG 引擎上选择的模型、重新排名和向量存储支付费用。如需了解详情,请参阅 Vertex AI RAG 引擎结算 页面。