接地是一项技术,可用于帮助模型生成更值得信赖、更有帮助且更符合事实的回答。当您对生成式 AI 模型的回答进行接地时,就是将其连接到可验证的信息来源。如要实现接地,通常必须检索相关来源数据。建议的最佳实践是使用检索增强生成 (RAG) 技术。检索通常通过搜索引擎完成,该引擎会使用一种嵌入了源文本语义的索引。
此外,也有一些服务和组件 API 可实现 RAG 生命周期,例如 Vertex AI Search Builder API,该 API 支持混合搭配式构建。通过混合搭配式构建,您可以使用以下任意服务或 API 实现 RAG 解决方案:
- Grounding Generation API:您可以使用此 API 实现接地,也可以链接到检索提供方来完成 RAG 生命周期。
- 文档布局解析器:此解析器融合了 Document AI 和 Gemini 在文档理解领域的精华技术。如需详细了解布局解析器,请参阅使用布局解析器。
- Vertex AI Vector Search:此搜索服务性能出色,并使用高质量的向量数据库。
- Check Grounding API:此 API 会将 RAG 输出与检索到的事实进行比较,确保所有陈述均已接地,之后才会向用户返回回答。
使用 Vertex AI RAG Engine 将回答接地
如要使用 Vertex AI RAG Engine 将回答接地,您必须创建提示。执行以下操作:
在 Google Cloud 控制台中,使用 Vertex AI Studio 前往创建提示页面。
选择接地:自有数据。
选择 RAG Engine 接地来源。
从语料库列表中,选择您的语料库名称。
在 Top-K 相似度字段中,选择默认值 20。
点击保存。
后续步骤
- 如需详细了解 Responsible AI 及其安全性过滤机制,请参阅 Responsible AI 最佳实践和 Vertex AI 的安全性过滤机制。
- 如需详细了解 RAG Engine 如何实现 RAG,请参阅 RAG Engine。