向量索引简介
向量索引是一种数据结构,旨在使 VECTOR_SEARCH 函数和 AI.SEARCH 函数 更高效地执行,尤其是在大型数据集上。
使用场景
向量索引可提高向量搜索的效率,向量搜索通常对数据的文本或多模态嵌入执行。BigQuery 向量索引可帮助您更高效地执行以下任务:
- 执行语义搜索
- 检测相似或重复的图片、音频或视频
- 执行聚簇、定位或分类
- 构建推荐系统
- 查找与给定输入最相似的前 K 个图片或评价
如需了解详情,请参阅向量搜索简介。
价格
CREATE VECTOR INDEX 语句使用 BigQuery 计算价格。
只要编入索引的表数据的总大小低于每个组织的限制,构建和刷新向量索引所需的处理就无需付费。为支持超出此限制的索引,您必须提供自己的预留来处理索引管理作业。
存储也是索引需要考虑的因素。以索引形式存储的字节数会产生活跃存储费用。
- 矢量索引在处于活跃状态时会产生存储费用。
- 您可以使用
INFORMATION_SCHEMA.VECTOR_INDEXES视图查找索引存储大小。如果向量索引尚未达到 100% 覆盖率,您仍需要为已编入索引的内容付费。您可以使用INFORMATION_SCHEMA.VECTOR_INDEXES视图检查索引覆盖率。
配额和限制
如需了解详情,请参阅矢量索引限制。