向量索引简介

向量索引是一种数据结构,旨在使 VECTOR_SEARCH 函数AI.SEARCH 函数 更高效地执行,尤其是在大型数据集上。

使用场景

向量索引可提高向量搜索的效率,向量搜索通常对数据的文本或多模态嵌入执行。BigQuery 向量索引可帮助您更高效地执行以下任务:

  • 执行语义搜索
  • 检测相似或重复的图片、音频或视频
  • 执行聚簇、定位或分类
  • 构建推荐系统
  • 查找与给定输入最相似的前 K 个图片或评价

如需了解详情,请参阅向量搜索简介

价格

CREATE VECTOR INDEX 语句使用 BigQuery 计算价格。 只要编入索引的表数据的总大小低于每个组织的限制,构建和刷新向量索引所需的处理就无需付费。为支持超出此限制的索引,您必须提供自己的预留来处理索引管理作业。

存储也是索引需要考虑的因素。以索引形式存储的字节数会产生活跃存储费用

  • 矢量索引在处于活跃状态时会产生存储费用。
  • 您可以使用 INFORMATION_SCHEMA.VECTOR_INDEXES 视图查找索引存储大小。如果向量索引尚未达到 100% 覆盖率,您仍需要为已编入索引的内容付费。您可以使用 INFORMATION_SCHEMA.VECTOR_INDEXES 视图检查索引覆盖率。

配额和限制

如需了解详情,请参阅矢量索引限制

后续步骤