关于检索和排名

本页面介绍了检索和排名如何协同工作,以便在 Vertex AI Search 应用中提供相关 搜索结果。

概览

简而言之,检索是查找相关文档,而排名是 对检索到的文档进行排序。对所有可用文档进行排名 可能需要大量计算资源。因此,检索和排名是按顺序进行的 。

首先,搜索模型会理解查询并重写查询。 然后,根据可用的数据源以及数据存储区中已编入索引的 文档数量,模型 会检索数千个文档。系统会为 检索到的文档分配相关性得分。

然后,排名模型会对检索到的文档进行排序 并提供排名前 400 的结果。下图展示了 这两个过程在搜索工作流中的位置。

搜索中的检索和排名
图 1.搜索工作流中的检索和排名

检索方法

检索是指从数据存储区中选择与用户查询相关的文档子集的过程 。Vertex AI Search 模型 会根据不同的信号(例如 以下信号)管理搜索应用的检索,并分配相关性得分:

  • 主题性:包括关键字匹配、知识图谱和网络 信号。

  • 嵌入:包括用于查找概念上相似内容的嵌入。

  • 交叉注意力机制:允许模型考虑 查询与文档之间的关系,以便为文档分配相关性得分。

  • 新鲜度:涉及确定数据 存储区中文档的创建时间。

  • 用户事件:包括用于个性化的转化信号。

此外,在搜索请求中,您可以为网站数据 以及 结构化或非结构化数据提供 相关性过滤器和 元数据过滤器,以 缩小相关文档列表的范围。

排名方法

排名会获取在检索阶段选择的文档, 根据以下条件为这些文档分配新的相关性得分,然后 对它们重新排序:

  • 提升:根据自定义属性或 新鲜度提升和降低某些结果的排名。这会影响前 1,000 个检索到的文档,并对排名前 400 的文档进行排名。 如需了解详情,请参阅提升搜索结果
  • 自定义排名:使用基于公式的排名算法来控制、调整和替换默认排名逻辑 以满足您的特定要求。 在提供结果时,自定义排名分配的相关性得分优先。 如需了解详情,请参阅 自定义搜索结果排名
  • 排序:应用排序说明,例如按日期排序。
  • 搜索调参:影响模型对 文档语义相关性的感知方式,并更改嵌入相关性得分。如需了解更多 信息,请参阅 利用搜索调参,提高搜索结果的准确性
  • 基于事件的重新排名:使用 基于用户事件的个性化模型在提供结果时更新结果。