Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Présentation du moteur RAG sur Gemini Enterprise Agent Platform

Cette page décrit le moteur RAG et son fonctionnement.

Description	Console
Pour savoir comment utiliser le SDK Vertex AI pour exécuter des tâches du moteur RAG sur la plate-forme Gemini Enterprise Agent, consultez le démarrage rapide RAG pour Python.	Essayer le moteur RAG

Présentation

Le moteur RAG, un composant de la plate-forme d'agents Gemini Enterprise, facilite la génération augmentée par récupération (RAG). Le moteur RAG est également un framework de données permettant de développer des applications de grand modèle de langage (LLM) augmentées par le contexte. L'augmentation par le contexte se produit lorsque vous appliquez un LLM à vos données. Cette approche implémente la génération augmentée par récupération (RAG).

Un problème courant avec les LLM est qu'ils ne comprennent pas les connaissances privées, c'est-à-dire les données de votre organisation. Avec le moteur RAG, vous pouvez enrichir le contexte LLM avec des informations privées supplémentaires afin que le modèle puisse réduire les hallucinations et répondre aux questions plus précisément.

En combinant des sources de connaissances supplémentaires avec les connaissances existantes des LLM, un meilleur contexte est fourni. Le contexte amélioré associé à la requête améliore la qualité de la réponse du LLM.

L'image suivante illustre les concepts clés pour comprendre le moteur RAG.

Concepts clés d'Agent Platform RAG

Ces concepts sont listés dans l'ordre du processus de génération augmentée par récupération (RAG).

Ingestion de données : ingérez des données provenant de différentes sources. Par exemple, les fichiers locaux, Cloud Storage et Google Drive.
Transformation des données : conversion des données en préparation pour l'indexation. Par exemple, les données sont divisées en blocs.
Embedding : représentations numériques de mots ou de textes. Ces nombres capturent la signification sémantique et le contexte du texte. Les mots ou textes similaires ou connexes ont tendance à avoir des embeddings similaires, ce qui signifie qu'ils sont plus proches les uns des autres dans l'espace vectoriel de grande dimension.
Indexation des données : le moteur RAG crée un index appelé corpus. L'index structure la base de connaissances afin qu'il soit optimisé pour la recherche. Par exemple, l'index s'apparente à une table des matières détaillée pour un immense livre de référence.
Récupération : lorsqu'un utilisateur pose une question ou fournit un prompt, le composant de récupération du moteur RAG effectue une recherche dans sa base de connaissances afin de trouver des informations pertinentes pour la requête.
Génération : les informations récupérées deviennent le contexte ajouté à la requête utilisateur d'origine. Elles servent de guide au modèle d'IA générative pour générer des réponses factuellement ancrées et pertinentes.

Régions où le service est disponible

RAG Engine est disponible dans les régions suivantes :

Région	Emplacement	Description	Étape de lancement
`us-central1`	Iowa	Les versions `v1` et `v1beta1` sont compatibles.	Liste d'autorisation, GA
`us-east4`	Virginie	Les versions `v1` et `v1beta1` sont compatibles.	Liste d'autorisation, GA
`us-east1`	Moncks Corner, Caroline du Sud	Les versions `v1` et `v1beta1` sont compatibles.	Liste d'autorisation, Aperçu
`europe-west3`	Francfort, Allemagne	Les versions `v1` et `v1beta1` sont compatibles.	DG
`europe-west4`	Eemshaven, Pays-Bas	Les versions `v1` et `v1beta1` sont compatibles.	DG
`asia-east1`	Taïwan	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`asia-northeast1`	Tokyo	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`asia-northeast3`	Séoul	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`asia-south1`	Mumbai	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`asia-southeast1`	Singapour	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`europe-central2`	Varsovie	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`europe-north1`	Finlande	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`europe-southwest1`	Madrid	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`europe-west1`	Belgique	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`europe-west2`	Londres	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`europe-west6`	Zurich	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`europe-west8`	Milan	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`europe-west9`	Paris	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`us-east5`	Columbus, Ohio	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`us-south1`	Dallas, TX	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`us-west1`	Oregon	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu
`us-west4`	Las Vegas, NV	Les versions `v1` et `v1beta1` sont compatibles.	Aperçu

us-central1, us-east1 et us-east4 sont remplacés par Allowlist. Si vous souhaitez tester le moteur RAG, essayez d'autres régions.

Supprimer le moteur RAG

Pour en savoir plus sur la suppression d'un moteur RAG, consultez les ressources suivantes :

Paramètres de l'API version 1 (v1)
Paramètres de l'API v1beta1

Étapes suivantes

Pour savoir comment utiliser le SDK Vertex AI pour exécuter des tâches du moteur RAG sur la plate-forme d'agents Gemini Enterprise, consultez le guide de démarrage rapide RAG pour Python.
Pour en savoir plus sur l'ancrage, consultez la présentation de l'ancrage.
Pour en savoir plus sur les réponses du moteur RAG, consultez GenerateContentResponse.