Vector Search 2.0 是一款 Google Cloud 从头开始设计的产品,是一款可自行调优的全托管式 AI 原生搜索引擎。虽然 Google Cloud现有的 Vector Search 是一种强大的近似最近邻 (ANN) 索引即服务系统,但 Vector Search 2.0 将这一概念发展为全面的存储和检索系统。您将使用数据对象的集合,而不是将索引作为主要资源进行管理。
搜索引擎架构提供复制的可扩缩存储引擎,使 Vector Search 2.0 成为 AI 应用的单一统一数据源,并消除了对辅助数据存储的需求。
这种新架构的主要优势包括:
开发者友好:使用直观的客户端库快速入门,只需极少的代码。系统经过自动调优,可保持高性能,并抽象化底层基础架构,因此您无需配置虚拟机或副本。
快速完成初始配置和评估:创建集合、添加数据,然后快速开始搜索。
统一的数据存储:在一个位置存储、检索和过滤文档,按向量相似度和载荷数据进行过滤。
强大的功能:使用内置模型自动填充嵌入字段、利用丰富的查询功能探索数据、自带嵌入 (BYOE),以及快速创建索引以提升性能。
简化的价格:自适应价格提供两种模式:基于用量的价格(适用于较小的工作负载)和基于资源的价格(适用于经过调优的性能)。
Vector Search 2.0 沿用了 Vector Search 1.0 中的高性能和大规模扩缩能力,让您可以轻松上手并进行扩缩。
概念
在开始之前,最好先了解以下 Vector Search 2.0 概念:
集合:一组相关 JSON 对象的容器。这类似于关系型数据库中的表。您可以在单个数据库中创建多个集合。
数据对象:存储在集合中的单个 JSON 对象。
集合:架构:定义集合内数据对象的结构和限制条件。可以配置为进行严格和宽松的架构验证。
集合索引:可在集合内的数据对象中高效执行近似最近邻 (ANN) 搜索。一个集合可以有多个索引,例如数据对象中每个向量字段都有一个索引。
后续步骤
- 了解如何创建集合。