Ancrer les réponses à l'aide de la RAG

L'ancrage est une technique qui vous permet de générer des réponses de modèle plus fiables, utiles et factuelles. Lorsque vous ancrez les réponses d'un modèle d'IA générative, vous les connectez à des sources d'information vérifiables. Pour implémenter l'ancrage, vous devez généralement récupérer les données sources pertinentes. Il est recommandé d'utiliser la technique de génération augmentée par récupération (RAG). La récupération est généralement effectuée à l'aide d'un moteur de recherche, qui utilise un index intégré aux significations sémantiques du texte source.

Il existe également des services et des API de composants qui implémentent le cycle de vie de la RAG, comme l'API Agent Search Builder, qui permet de combiner des éléments. Avec la création mixte, vous pouvez implémenter une solution RAG à l'aide de l'un des services ou API suivants:

  • API Grounding Generation : vous pouvez l'utiliser pour implémenter l'ancrage ou associer un fournisseur de récupération pour l'ensemble du cycle de vie de la RAG.
  • Analyseur de mise en page de documents : cet analyseur représente le meilleur de Document AI et Gemini pour la compréhension des documents. Pour en savoir plus sur l'analyseur de mise en page, consultez Utiliser l'analyseur de mise en page.
  • Vertex AI Vector Search : ce service de recherche est très performant et utilise une base de données vectorielle de haute qualité.
  • API Check Grounding : cette API compare la sortie RAG avec les faits récupérés et permet de s'assurer que toutes les affirmations sont ancrées avant de renvoyer la réponse à l'utilisateur.

Ancrer les réponses à l'aide du moteur RAG de Vertex AI

Pour ancrer les réponses à l'aide du moteur RAG de Vertex AI, vous devez créer une invite. Procédez comme suit :

  1. Dans la Google Cloud console, accédez à la page Créer une invite à l'aide de Vertex AI Studio.

    Accéder à la page Créer une invite

  2. Sélectionnez Ancrage : vos données.

  3. Sélectionnez la source d'ancrage Moteur RAG.

  4. Dans la liste Corpus, sélectionnez le nom de votre corpus.

  5. Dans le champ Top-K Similarity (Similitude Top-K), sélectionnez 20, qui est la valeur par défaut.

  6. Cliquez sur Enregistrer.

Étape suivante