En esta página, se presentan las bases de datos de vectores compatibles con el motor RAG. También puedes ver cómo conectar una base de datos de vectores (almacén de vectores) a tu corpus RAG.
Las bases de datos de vectores desempeñan un rol fundamental para habilitar la recuperación de aplicaciones RAG. Las bases de datos de vectores ofrecen una forma especializada de almacenar y consultar embeddings de vectores, que son representaciones matemáticas de texto o de otros datos que capturan el significado y las relaciones semánticas. Los embeddings de vectores permiten que los sistemas RAG encuentren de forma rápida y precisa la información más pertinente dentro de una amplia base de conocimientos, incluso cuando se trata de consultas complejas o matizadas. Cuando se combinan con un modelo de embedding, las bases de datos de vectores pueden ayudar a superar las limitaciones de los LLM y proporcionar respuestas más precisas, pertinentes y completas.
Bases de datos de vectores compatibles
Cuando se crea un corpus RAG, el motor RAG ofrece RagManagedDb, que está listo para la empresa, como la base de datos de vectores predeterminada, que no requiere aprovisionamiento ni administración adicionales. RagManagedDb ofrece opciones de búsqueda KNN y ANN, y permite cambiar a un nivel básico para la creación rápida de prototipos y la experimentación. Para obtener más información sobre cómo elegir una estrategia de recuperación en
RagManagedDb o para actualizar el nivel, consulta Cómo usar RagManagedDb con
RAG. Para que el motor RAG cree y administre automáticamente la base de datos de vectores, consulta Recurso REST:
projects.locations.ragCorpora
.
Además de RagManagedDb predeterminado, el motor RAG te permite aprovisionar y usar tu base de datos de vectores dentro de tu corpus RAG. En este caso, eres responsable del ciclo de vida y la escalabilidad de tu base de datos de vectores.
Compara las opciones de bases de datos de vectores
En esta tabla, se enumeran las opciones de bases de datos de vectores compatibles con el motor RAG y se proporcionan vínculos a páginas que explican cómo usar las bases de datos de vectores dentro de tu corpus RAG.
| Base de datos de vectores | Beneficios | Ideal para | Desventajas | Métricas de distancia admitidas | Tipo de búsqueda | Etapa de lanzamiento |
|---|---|---|---|---|---|---|
RagManagedDb (predeterminado) es un servicio de base de datos escalable distribuido regionalmente que ofrece una coherencia muy alta y alta disponibilidad, y se puede usar para una búsqueda de vectores.
fácil simple rápido |
|
|
|
cosine |
KNN (predeterminado) y ANN | Disponible de manera general |
| Vector Search es el servicio de base de datos de vectores dentro de Agent Platform que está optimizado para tareas de aprendizaje automático. |
|
|
|
cosinedot-product |
ANN | Disponible de manera general |
| Vertex AI Feature Store es un servicio administrado para organizar, almacenar y entregar atributos de aprendizaje automático. |
|
|
|
cosinedot-productL2 squared |
ANN | Vista previa |
| Weaviate es una base de datos de vectores de código abierto que es flexible y modular. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
ANN + compatibilidad con la búsqueda híbrida | Vista previa |
| Pinecone es una base de datos de vectores nativa de la nube completamente administrada diseñada para una búsqueda de similitud de alto rendimiento. |
|
|
|
cosineeuclideandot-product |
ANN | Disponible de manera general |
¿Qué sigue?
Para crear un corpus RAG, consulta Método: ragCorpora.create.
Para enumerar el corpus RAG, consulta Método: ragCorpora.list.