本页面介绍了检索和排名如何协同工作,以便在 Vertex AI Search 应用中提供相关 搜索结果。
概览
简而言之,检索是查找相关文档,而排名是 对检索到的文档进行排序。对所有可用文档进行排名 可能需要大量计算资源。因此,检索和排名是按顺序进行的 。
首先,搜索模型会理解查询并重写查询。 然后,根据可用的数据源以及数据存储区中已编入索引的 文档数量,模型 会检索数千个文档。系统会为 检索到的文档分配相关性得分。
然后,排名模型会对检索到的文档进行排序 并提供排名前 400 的结果。下图展示了 这两个过程在搜索工作流中的位置。
检索方法
检索是指从数据存储区中选择与用户查询相关的文档子集的过程 。Vertex AI Search 模型 会根据不同的信号(例如 以下信号)管理搜索应用的检索,并分配相关性得分:
主题性:包括关键字匹配、知识图谱和网络 信号。
嵌入:包括用于查找概念上相似内容的嵌入。
交叉注意力机制:允许模型考虑 查询与文档之间的关系,以便为文档分配相关性得分。
新鲜度:涉及确定数据 存储区中文档的创建时间。
用户事件:包括用于个性化的转化信号。
此外,在搜索请求中,您可以为网站数据 以及 结构化或非结构化数据提供 相关性过滤器和 元数据过滤器,以 缩小相关文档列表的范围。
排名方法
排名会获取在检索阶段选择的文档, 根据以下条件为这些文档分配新的相关性得分,然后 对它们重新排序:
- 提升:根据自定义属性或 新鲜度提升和降低某些结果的排名。这会影响前 1,000 个检索到的文档,并对排名前 400 的文档进行排名。 如需了解详情,请参阅提升搜索结果。
- 自定义排名:使用基于公式的排名算法来控制、调整和替换默认排名逻辑 以满足您的特定要求。 在提供结果时,自定义排名分配的相关性得分优先。 如需了解详情,请参阅 自定义搜索结果排名。
- 排序:应用排序说明,例如按日期排序。
- 搜索调参:影响模型对 文档语义相关性的感知方式,并更改嵌入相关性得分。如需了解更多 信息,请参阅 利用搜索调参,提高搜索结果的准确性。
- 基于事件的重新排名:使用 基于用户事件的个性化模型在提供结果时更新结果。