Vector Search 2.0

Vector Search 2.0 是一款 Google Cloud 从头开始设计的产品,是一款可自行调优的全托管式 AI 原生搜索引擎。虽然 Google Cloud现有的 Vector Search 是一种强大的近似最近邻 (ANN) 索引即服务系统,但 Vector Search 2.0 将这一概念发展为全面的存储和检索系统。您将使用数据对象集合,而不是将索引作为主要资源进行管理。

搜索引擎架构提供复制的可扩缩存储引擎,使 Vector Search 2.0 成为 AI 应用的单一统一数据源,并消除了对辅助数据存储的需求。

这种新架构的主要优势包括:

  • 开发者友好:使用直观的客户端库快速入门,只需极少的代码。系统经过自动调优,可保持高性能,并抽象化底层基础架构,因此您无需配置虚拟机或副本。

  • 快速完成初始配置和评估:创建集合、添加数据,然后快速开始搜索。

  • 统一的数据存储:在一个位置存储、检索和过滤文档,按向量相似度和载荷数据进行过滤。

  • 强大的功能:使用内置模型自动填充嵌入字段、利用丰富的查询功能探索数据、自带嵌入 (BYOE),以及快速创建索引以提升性能。

  • 简化的价格:自适应价格提供两种模式:基于用量的价格(适用于较小的工作负载)和基于资源的价格(适用于经过调优的性能)。

Vector Search 2.0 沿用了 Vector Search 1.0 中的高性能和大规模扩缩能力,让您可以轻松上手并进行扩缩。

概念

在开始之前,最好先了解以下 Vector Search 2.0 概念:

  • 集合一组相关 JSON 对象的容器。这类似于关系型数据库中的表。您可以在单个数据库中创建多个集合。

  • 数据对象存储在集合中的单个 JSON 对象。

  • 集合:架构定义集合内数据对象的结构和限制条件。可以配置为进行严格和宽松的架构验证。

  • 集合索引:可在集合内的数据对象中高效执行近似最近邻 (ANN) 搜索。一个集合可以有多个索引,例如数据对象中每个向量字段都有一个索引。

后续步骤