Choix de bases de données vectorielles dans le moteur RAG

Cette page présente les bases de données vectorielles compatibles avec le moteur RAG. Vous pouvez également découvrir comment connecter une base de données vectorielle (magasin de vecteurs) à votre corpus RAG.

Les bases de données vectorielles jouent un rôle essentiel dans l'activation de la récupération pour les applications RAG. Elles offrent un moyen spécialisé de stocker et d'interroger des embeddings vectoriels, qui sont des représentations mathématiques de texte ou d'autres données qui capturent la signification et les relations sémantiques. Les embeddings vectoriels permettent aux systèmes RAG de trouver rapidement et précisément les informations les plus pertinentes dans une vaste base de connaissances, même lorsqu'il s'agit de requêtes complexes ou nuancées. Combinées à un modèle d'embedding, les bases de données vectorielles peuvent aider à surmonter les limites des LLM et fournir des réponses plus précises, pertinentes et complètes.

Bases de données vectorielles compatibles

Lors de la création d'un corpus RAG, le moteur RAG propose RagManagedDb, une base de données vectorielle prête à l'emploi pour les entreprises, qui ne nécessite aucun provisionnement ni aucune gestion supplémentaires. RagManagedDb propose des options de recherche KNN et ANN, et permet de passer à un niveau de base pour un prototypage et une expérimentation rapides. Pour en savoir plus sur le choix d'une stratégie de récupération sur RagManagedDb ou sur la mise à jour du niveau, consultez Utiliser RagManagedDb avec RAG. Pour que le moteur RAG crée et gère automatiquement la base de données vectorielle pour vous, consultez la ressource REST : projects.locations.ragCorpora .

En plus de la base de données RagManagedDb par défaut, le moteur RAG vous permet de provisionner et d'utiliser votre base de données vectorielle dans votre corpus RAG. Dans ce cas, vous êtes responsable du cycle de vie et de l'évolutivité de votre base de données vectorielle.

Comparer les options de base de données vectorielles

Ce tableau présente les bases de données vectorielles compatibles avec le moteur RAG et fournit des liens vers des pages expliquant comment les utiliser dans votre corpus RAG.

Base de données vectorielle Avantages Idéal pour Inconvénients Métriques de distance compatibles Type de recherche Étape de lancement
RagManagedDb (par défaut) est un service de base de données évolutif distribué à l'échelle régionale qui offre une cohérence et une disponibilité très élevées, et qui peut être utilisé pour une recherche vectorielle. facile simple rapide
  • Aucune configuration requise.
  • Convient aux cas d'utilisation à grande et à petite échelle.
  • Cohérence très élevée.
  • Haute disponibilité.
  • Faible latence.
  • Excellent pour les charges de travail transactionnelles.
  • CMEK activé.
  • Génération de documents en grand volume.
  • Création d'un RAG à l'échelle de l'entreprise.
  • Développement d'une preuve de concept rapide.
  • Faibles coûts de provisionnement et de maintenance.
  • Utilisation avec des chatbots.
  • Création d'applications RAG.
  • Pour un rappel optimal, la fonctionnalité ANN nécessite que l'index soit recréé après des modifications majeures apportées à vos données.
cosine KNN (par défaut) et ANN Disponibilité générale
Vector Search est le service de base de données vectorielles d'Agent Platform, optimisé pour les tâches de machine learning.
  • S'intègre à d'autres Google Cloud services.
  • L'évolutivité et la fiabilité sont assurées par l' Google Cloud infrastructure.
  • Utilise la tarification à l'usage.
  • Génération de documents en grand volume.
  • Création d'un RAG à l'échelle de l'entreprise.
  • Gestion de l'infrastructure de base de données vectorielles.
  • Clients existants Google Cloud ou toute personne souhaitant utiliser plusieurs Google Cloud services.
  • Les mises à jour ne sont pas immédiatement prises en compte.
  • Dépendance vis-à-vis d'un fournisseur avec Google Cloud.
  • Peut être plus coûteux selon vos cas d'utilisation.
cosine

dot-product
ANN Disponibilité générale
Vertex AI Feature Store est un service géré permettant d'organiser, de stocker et de diffuser des caractéristiques de machine learning.
  • S'intègre à Gemini Enterprise Agent Platform et à d'autres Google Cloud services.
  • L'évolutivité et la fiabilité sont assurées par l' Google Cloud infrastructure.
  • Exploite l'infrastructure BigQuery existante.
  • Génération de documents en grand volume.
  • Création d'un RAG à l'échelle de l'entreprise.
  • Gestion de l'infrastructure de base de données vectorielles.
  • Clients existants Google Cloud ou clients souhaitant utiliser plusieurs Google Cloud services.
  • Les modifications ne sont disponibles dans la boutique en ligne qu'après une synchronisation manuelle.
  • Dépendance vis-à-vis d'un fournisseur avec Google Cloud.
cosine

dot-product

L2 squared
ANN Aperçu
Weaviate est une base de données vectorielles Open Source flexible et modulaire.
  • Compatible avec différents types de données et offre des fonctionnalités de graphe intégrées.
  • Fournit une solution Open Source et une communauté dynamique.
  • Très flexible et personnalisable.
  • Compatible avec différents types de données et modules pour différentes modalités, telles que le texte et les images.
  • Vous pouvez choisir parmi les fournisseurs cloud, tels que Google CloudAWS et Azure.
  • Génération de documents en grand volume.
  • Création d'un RAG à l'échelle de l'entreprise.
  • Gestion de l'infrastructure de base de données vectorielles.
  • Clients Weaviate existants.
  • Les mises à jour ne sont pas immédiatement prises en compte.
  • Peut être plus complexe à configurer et à gérer.
  • Les performances peuvent varier en fonction de la configuration.
cosine

dot-product

L2 squared

hamming

manhattan
ANN + compatibilité avec la recherche hybride Aperçu
Pinecone est une base de données vectorielles cloud native entièrement gérée, conçue pour une recherche de similarité hautes performances.
  • Démarrage rapide.
  • Excellente évolutivité et performances.
  • Concentrez-vous sur la recherche vectorielle avec des fonctionnalités avancées telles que le filtrage et la recherche de métadonnées.
  • Vous pouvez choisir parmi les fournisseurs cloud, tels que Google CloudAWS et Azure.
  • Génération de documents en grand volume.
  • Création d'un RAG à l'échelle de l'entreprise.
  • Gestion de l'infrastructure de base de données vectorielles.
  • Clients Pinecone existants.
  • Les mises à jour ne sont pas immédiatement prises en compte.
  • Peut s'avérer plus coûteux que d'autres options.
  • Les quotas et les limites restreignent l'évolutivité et les performances.
  • Contrôle limité sur l'infrastructure sous-jacente.
cosine

euclidean

dot-product
ANN Disponibilité générale

Étape suivante