Opciones de bases de datos de vectores en RAG Engine

En esta página, se presentan las bases de datos de vectores compatibles con el motor RAG. También puedes ver cómo conectar una base de datos de vectores (almacén de vectores) a tu corpus RAG.

Las bases de datos de vectores desempeñan un rol fundamental para habilitar la recuperación de aplicaciones RAG. Las bases de datos de vectores ofrecen una forma especializada de almacenar y consultar embeddings de vectores, que son representaciones matemáticas de texto o de otros datos que capturan el significado y las relaciones semánticas. Los embeddings de vectores permiten que los sistemas RAG encuentren de forma rápida y precisa la información más pertinente dentro de una amplia base de conocimientos, incluso cuando se trata de consultas complejas o matizadas. Cuando se combinan con un modelo de embedding, las bases de datos de vectores pueden ayudar a superar las limitaciones de los LLM y proporcionar respuestas más precisas, pertinentes y completas.

Bases de datos de vectores compatibles

Cuando se crea un corpus RAG, el motor RAG ofrece RagManagedDb, que está listo para la empresa, como la base de datos de vectores predeterminada, que no requiere aprovisionamiento ni administración adicionales. RagManagedDb ofrece opciones de búsqueda KNN y ANN, y permite cambiar a un nivel básico para la creación rápida de prototipos y la experimentación. Para obtener más información sobre cómo elegir una estrategia de recuperación en RagManagedDb o para actualizar el nivel, consulta Cómo usar RagManagedDb con RAG. Para que el motor RAG cree y administre automáticamente la base de datos de vectores, consulta Recurso REST: projects.locations.ragCorpora .

Además de RagManagedDb predeterminado, el motor RAG te permite aprovisionar y usar tu base de datos de vectores dentro de tu corpus RAG. En este caso, eres responsable del ciclo de vida y la escalabilidad de tu base de datos de vectores.

Compara las opciones de bases de datos de vectores

En esta tabla, se enumeran las opciones de bases de datos de vectores compatibles con el motor RAG y se proporcionan vínculos a páginas que explican cómo usar las bases de datos de vectores dentro de tu corpus RAG.

Base de datos de vectores Beneficios Ideal para Desventajas Métricas de distancia admitidas Tipo de búsqueda Etapa de lanzamiento
RagManagedDb (predeterminado) es un servicio de base de datos escalable distribuido regionalmente que ofrece una coherencia muy alta y alta disponibilidad, y se puede usar para una búsqueda de vectores. fácil simple rápido
  • No requiere configuración.
  • Es adecuado para casos de uso a gran y pequeña escala.
  • Ofrece una coherencia muy alta.
  • Ofrece alta disponibilidad.
  • Ofrece baja latencia.
  • Es excelente para cargas de trabajo transaccionales.
  • Tiene CMEK habilitada.
  • Generar documentos de gran volumen
  • Crear RAG a escala empresarial
  • Desarrollar una prueba de concepto rápida
  • Proporcionar una sobrecarga baja de aprovisionamiento y mantenimiento
  • Usar con chatbots
  • Crear aplicaciones RAG
  • Para una recuperación óptima, la función ANN requiere que se vuelva a compilar el índice después de realizar cambios importantes en tus datos.
cosine KNN (predeterminado) y ANN Disponible de manera general
Vector Search es el servicio de base de datos de vectores dentro de Agent Platform que está optimizado para tareas de aprendizaje automático.
  • Se integra con otros Google Cloud servicios.
  • La escalabilidad y la confiabilidad son compatibles con la Google Cloud infraestructura.
  • Usa precios de pago por uso.
  • Generar documentos de gran volumen
  • Crear RAG a escala empresarial
  • Administrar la infraestructura de la base de datos de vectores
  • Clientes existentes o cualquier persona que desee usar varios servicios Google Cloud Google Cloud
  • Las actualizaciones no se reflejan de inmediato.
  • Compromiso con un solo proveedor con Google Cloud.
  • Podría ser más costoso según tus casos de uso.
cosine

dot-product
ANN Disponible de manera general
Vertex AI Feature Store es un servicio administrado para organizar, almacenar y entregar atributos de aprendizaje automático.
  • Se integra con Gemini Enterprise Agent Platform y otros Google Cloud servicios.
  • La escalabilidad y la confiabilidad son compatibles con la Google Cloud infraestructura.
  • Aprovecha la infraestructura de BigQuery existente.
  • Generar documentos de gran volumen
  • Crear RAG a escala empresarial
  • Administrar la infraestructura de la base de datos de vectores
  • Clientes existentes o clientes que deseen usar varios servicios Google Cloud Google Cloud
  • Los cambios solo están disponibles en la tienda en línea después de que se realiza una sincronización manual.
  • Compromiso con un solo proveedor con Google Cloud.
cosine

dot-product

L2 squared
ANN Vista previa
Weaviate es una base de datos de vectores de código abierto que es flexible y modular.
  • Admite varios tipos de datos y ofrece capacidades de gráficos integradas.
  • Proporciona código abierto y una comunidad activa.
  • Es muy flexible y personalizable.
  • Admite diversos tipos de datos y módulos para diferentes modalidades, como texto e imágenes.
  • Puedes elegir entre proveedores de servicios en la nube, como Google CloudAWS y Azure.
  • Generar documentos de gran volumen
  • Crear RAG a escala empresarial
  • Administrar la infraestructura de la base de datos de vectores
  • Clientes existentes de Weaviate
  • Las actualizaciones no se reflejan de inmediato.
  • Puede ser más complejo de configurar y administrar.
  • El rendimiento puede variar según la configuración.
cosine

dot-product

L2 squared

hamming

manhattan
ANN + compatibilidad con la búsqueda híbrida Vista previa
Pinecone es una base de datos de vectores nativa de la nube completamente administrada diseñada para una búsqueda de similitud de alto rendimiento.
  • Comienza rápidamente.
  • Excelente escalabilidad y rendimiento.
  • Se enfoca en la búsqueda de vectores con funciones avanzadas, como el filtrado y la búsqueda de metadatos.
  • Puedes elegir entre proveedores de servicios en la nube, como Google CloudAWS y Azure.
  • Generar documentos de gran volumen
  • Crear RAG a escala empresarial
  • Administrar la infraestructura de la base de datos de vectores
  • Clientes existentes de Pinecone
  • Las actualizaciones no se reflejan de inmediato.
  • Puede ser más costosa que las otras opciones.
  • Las cuotas y los límites restringen la escala y el rendimiento.
  • Control limitado sobre la infraestructura subyacente.
cosine

euclidean

dot-product
ANN Disponible de manera general

¿Qué sigue?