Cette page présente les bases de données vectorielles compatibles avec le moteur RAG de la plate-forme d'agents Gemini Enterprise. Vous pouvez également découvrir comment connecter une base de données vectorielle (magasin de vecteurs) à votre corpus RAG.
Les bases de données vectorielles jouent un rôle essentiel dans la récupération pour les applications RAG. Les bases de données vectorielles offrent un moyen spécialisé de stocker et d'interroger les embeddings vectoriels, qui sont des représentations mathématiques de texte ou d'autres données capturant la signification sémantique et les relations. Les embeddings vectoriels permettent aux systèmes RAG de trouver rapidement et précisément les informations les plus pertinentes dans une vaste base de connaissances, même lorsqu'il s'agit de requêtes complexes ou nuancées. Combinées à un modèle d'embedding, les bases de données vectorielles peuvent aider à surmonter les limites des LLM et à fournir des réponses plus précises, pertinentes et complètes.
Bases de données vectorielles compatibles
Lorsque vous créez un corpus RAG, le moteur RAG Gemini Enterprise Agent Platform propose RagManagedDb comme base de données vectorielle par défaut, qui ne nécessite aucun provisionnement ni gestion supplémentaires. RagManagedDb propose des options de recherche KNN et ANN, et permet de passer à un niveau de base pour un prototypage et des tests rapides. Pour savoir comment choisir une stratégie de récupération sur RagManagedDb ou comment modifier le niveau, consultez Utiliser RagManagedDb avec RAG. Pour que le moteur RAG de la plate-forme d'agents Gemini Enterprise crée et gère automatiquement la base de données vectorielle pour vous, consultez Ressource REST : projects.locations.ragCorpora
.
En plus de RagManagedDb par défaut, le moteur RAG de la plate-forme d'agents Gemini Enterprise vous permet de provisionner et d'utiliser votre base de données vectorielle dans votre corpus RAG. Dans ce cas, vous êtes responsable du cycle de vie et de la scalabilité de votre base de données vectorielle.
Comparer les options de base de données vectorielles
Ce tableau liste les bases de données vectorielles compatibles avec le moteur RAG de la plate-forme d'agents Gemini Enterprise. Il fournit également des liens vers des pages expliquant comment utiliser les bases de données vectorielles dans votre corpus RAG.
| Base de données vectorielle | Avantages | Utilisation recommandée | Inconvénients | Métriques de distance acceptées | Type de recherche | Étape de lancement |
|---|---|---|---|---|---|---|
RagManagedDb (par défaut) est un service de base de données évolutif distribué au niveau régional qui offre une cohérence et une disponibilité très élevées, et qui peut être utilisé pour la recherche vectorielle.
easy simple fast quick |
|
|
|
cosine |
KNN (par défaut) et ANN | Disponibilité générale |
| Vector Search est le service de base de données vectorielles d'Agent Platform, optimisé pour les tâches de machine learning. |
|
|
|
cosinedot-product |
ANN | Disponibilité générale |
| Vertex AI Feature Store est un service géré permettant d'organiser, de stocker et de diffuser des caractéristiques de machine learning. |
|
|
|
cosinedot-productL2 squared |
ANN | Aperçu |
| Weaviate est une base de données vectorielle Open Source flexible et modulaire. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
Compatibilité avec ANN et la recherche hybride | Aperçu |
| Pinecone est une base de données vectorielles native dans le cloud et entièrement gérée, conçue pour la recherche de similarités hautes performances. |
|
|
|
cosineeuclideandot-product |
ANN | Disponibilité générale |
Étapes suivantes
Pour créer un corpus RAG, consultez Méthode : ragCorpora.create.
Pour lister les corpus RAG, consultez Méthode : ragCorpora.list.