使用 RAG 将回答接地

接地是一项技术,可用于帮助模型生成更值得信赖、更有帮助且更符合事实的回答。当您对生成式 AI 模型的回答进行接地时,就是将其连接到可验证的信息来源。如要实现接地,通常必须检索相关来源数据。建议的最佳实践是使用检索增强生成 (RAG) 技术。检索通常通过搜索引擎完成,该引擎会使用一种嵌入了源文本语义的索引。

此外,也有一些服务和组件 API 可实现 RAG 生命周期,例如 Vertex AI Search Builder API,该 API 支持混合搭配式构建。通过混合搭配式构建,您可以使用以下任意服务或 API 实现 RAG 解决方案:

  • Grounding Generation API:您可以使用此 API 实现接地,也可以链接到检索提供方来完成 RAG 生命周期。
  • 文档布局解析器:此解析器融合了 Document AI 和 Gemini 在文档理解领域的精华技术。如需详细了解布局解析器,请参阅使用布局解析器
  • Vertex AI Vector Search:此搜索服务性能出色,并使用高质量的向量数据库。
  • Check Grounding API:此 API 会将 RAG 输出与检索到的事实进行比较,确保所有陈述均已接地,之后才会向用户返回回答。

使用 Vertex AI RAG Engine 将回答接地

如要使用 Vertex AI RAG Engine 将回答接地,您必须创建提示。执行以下操作:

  1. 在 Google Cloud 控制台中,使用 Vertex AI Studio 前往创建提示页面。

    前往“创建提示”

  2. 选择接地:自有数据

  3. 选择 RAG Engine 接地来源。

  4. 语料库列表中,选择您的语料库名称。

  5. Top-K 相似度字段中,选择默认值 20

  6. 点击保存

后续步骤