En esta página, se presentan las bases de datos vectoriales compatibles con el motor de RAG de la plataforma de agentes de Gemini Enterprise. También puedes ver cómo conectar una base de datos de vectores (almacén de vectores) a tu corpus de RAG.
Las bases de datos vectoriales desempeñan un papel fundamental en la recuperación de información para las aplicaciones de RAG. Las bases de datos de vectores ofrecen una forma especializada de almacenar y consultar embeddings de vectores, que son representaciones matemáticas de texto o de otros datos que capturan el significado y las relaciones semánticas. Los embeddings de vectores permiten que los sistemas de RAG encuentren de forma rápida y precisa la información más pertinente dentro de una vasta base de conocimiento, incluso cuando se trata de consultas complejas o matizadas. Cuando se combinan con un modelo de embedding, las bases de datos vectoriales pueden ayudar a superar las limitaciones de los LLM y proporcionar respuestas más precisas, pertinentes y completas.
Bases de datos vectoriales compatibles
Cuando creas un corpus de RAG, el motor de RAG de la plataforma de agentes de Gemini Enterprise ofrece RagManagedDb listo para la empresa como la base de datos de vectores predeterminada, que no requiere aprovisionamiento ni administración adicionales. RagManagedDb ofrece opciones de búsqueda de KNN y ANN, y permite cambiar a un nivel básico para realizar prototipos y experimentos rápidos. Para obtener más información sobre cómo elegir una estrategia de recuperación en RagManagedDb o para actualizar el nivel, consulta Usa RagManagedDb con RAG. Para que el motor de RAG de la plataforma de agentes de Gemini Enterprise cree y administre automáticamente la base de datos de vectores por ti, consulta Recurso de REST: projects.locations.ragCorpora
.
Además del RagManagedDb predeterminado, el motor de RAG de la plataforma de agentes de Gemini Enterprise te permite aprovisionar y usar tu base de datos vectorial dentro de tu corpus de RAG. En este caso, eres responsable del ciclo de vida y la escalabilidad de tu base de datos de vectores.
Compara las opciones de bases de datos vectoriales
En esta tabla, se enumeran las bases de datos vectoriales compatibles con el motor de RAG de la plataforma de agentes de Gemini Enterprise y se proporcionan vínculos a páginas que explican cómo usar las bases de datos vectoriales en tu corpus de RAG.
| Base de datos de vectores | Beneficios | Ideal para | Desventajas | Métricas de distancia admitidas | Tipo de búsqueda | Etapa de lanzamiento |
|---|---|---|---|---|---|---|
RagManagedDb (predeterminado) es un servicio de base de datos escalable distribuido regionalmente que ofrece una coherencia muy alta y alta disponibilidad, y se puede usar para una búsqueda de vectores.
fácil simple rápido |
|
|
|
cosine |
KNN (predeterminado) y ANN | Disponible de manera general |
| Vector Search es el servicio de base de datos de vectores dentro de Agent Platform que está optimizado para las tareas de aprendizaje automático. |
|
|
|
cosinedot-product |
ANN | Disponible de manera general |
| Vertex AI Feature Store es un servicio administrado para organizar, almacenar y entregar atributos de aprendizaje automático. |
|
|
|
cosinedot-productL2 squared |
ANN | Vista previa |
| Weaviate es una base de datos de vectores de código abierto que es flexible y modular. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
Compatibilidad con la búsqueda híbrida y la ANN | Vista previa |
| Pinecone es una base de datos de vectores nativa de la nube y completamente administrada, diseñada para una búsqueda de similitud de alto rendimiento. |
|
|
|
cosineeuclideandot-product |
ANN | Disponible de manera general |
¿Qué sigue?
Para crear un corpus de RAG, consulta Método: ragCorpora.create
Para enumerar el corpus de RAG, consulta Método: ragCorpora.list