本页介绍了 Vertex AI RAG Engine 支持的向量数据库。您还可以了解如何将向量数据库(向量存储区)连接到 RAG 语料库。
向量数据库在实现 RAG 应用的检索方面发挥着至关重要的作用。向量数据库提供了一种专门的方式来存储和查询向量嵌入,向量嵌入是文本或其他数据的数学表示法,用于捕获语义含义和关系。借助向量嵌入,RAG 系统能够在庞大的知识库中快速准确地找到相关性最高的信息,即使处理复杂或细致的查询也是如此。与嵌入模型结合使用时,矢量数据库可以帮助克服 LLM 的局限性,并提供更准确、更相关且更全面的回答。
支持的矢量数据库
创建 RAG 语料库时,Vertex AI RAG Engine 会提供适用于企业的 RagManagedDb
作为默认向量数据库,无需额外预配或管理。RagManagedDb
同时提供 KNN 和 ANN 搜索选项,并允许切换到基本层级,以便快速制作原型和进行实验。如需详细了解如何在 RagManagedDb
上选择检索策略或更新层级,请参阅将 RagManagedDb
与 RAG 搭配使用。如需让 Vertex AI RAG 引擎自动为您创建和管理向量数据库,请参阅创建 RAG 语料库。
除了默认的 RagManagedDb
之外,Vertex AI RAG Engine 还允许您在 RAG 语料库中预配和使用向量数据库。在这种情况下,您负责矢量数据库的生命周期和可伸缩性。
比较向量数据库选项
下表列出了 Vertex AI RAG 引擎支持的向量数据库选项,并提供了指向说明如何在 RAG 语料库中使用向量数据库的页面的链接。
向量数据库 | 优势 | 最适合 | 缺点 | 支持的距离指标 | 搜索类型 | 发布阶段 |
---|---|---|---|---|---|---|
RagManagedDb (默认)是一种区域分布式可伸缩数据库服务,可提供极高的一致性和高可用性,并且可用于矢量搜索。
简单易行 |
|
|
|
cosine |
KNN(默认)和 ANN | 预览 |
Vector Search 是 Vertex AI 中针对机器学习任务进行了优化的向量数据库服务。 |
|
|
|
cosine dot-product |
ANN | 已全面推出 |
Vertex AI Feature Store 是一项代管式服务,用于整理、存储和提供机器学习特征。 |
|
|
|
cosine dot-product L2 squared |
ANN | 预览 |
Weaviate 是一个灵活且模块化的开源矢量数据库。 |
|
|
|
cosine dot-product L2 squared hamming manhattan |
ANN + 混合搜索支持 | 预览 |
Pinecone 是一种全代管式云原生向量数据库,专为高性能相似度搜索而设计。 |
|
|
|
cosine euclidean dot-product |
ANN | 已全面推出 |
后续步骤
- 如需创建 RAG 语料库,请参阅创建 RAG 语料库示例。
- 如需列出所有 RAG 语料库,请参阅列出 RAG 语料库示例。