Filtrer les recherches par pertinence au niveau du document (ancienne version)

Lorsque vous effectuez une recherche dans votre application Gemini Enterprise, vous pouvez appliquer un seuil de pertinence afin que seuls les documents qui répondent à ce seuil soient renvoyés comme résultats. Cette page explique comment spécifier un seuil de pertinence afin de réduire le nombre de documents renvoyés dans les requêtes.

À propos du filtrage par pertinence au niveau du document

Chaque document renvoyé par une requête de recherche reçoit un niveau de pertinence, qui indique la pertinence du document renvoyé par rapport à la requête. Lorsque vous effectuez une requête via un appel d'API, vous pouvez définir un seuil de pertinence. La définition d'un seuil de pertinence élevé peut réduire le nombre de documents renvoyés par une requête.

Par exemple, si vous constatez que la recherche renvoie trop de documents dont la pertinence est insuffisante pour vos utilisateurs, définissez le seuil de pertinence sur "Élevé" pour limiter les résultats aux plus pertinents. Si le paramètre "Élevé" est trop restrictif, essayez le paramètre "Moyen".

Types de données et applications compatibles avec le filtre de pertinence au niveau du document

Le filtre de pertinence au niveau du document peut être appliqué aux datastores contenant les types de données suivants :

  • Données de site Web avec indexation avancée de site Web
  • Données non structurées personnalisées
  • Données structurées personnalisées

Le filtre de pertinence au niveau du document ne fonctionne pas pour les datastores avec indexation de base de site Web, les données multimédias ni les données de santé.

De plus, le filtre de pertinence au niveau du document ne peut pas être utilisé avec les applications de recherche combinée. Les applications de recherche combinée sont des applications connectées à plusieurs datastores.

Autres types de filtres

Le filtre de pertinence au niveau du document n'est pas le seul moyen de filtrer les données renvoyées par les requêtes. Vous pouvez également utiliser des expressions de filtre pour filtrer les résultats en fonction des métadonnées (dans les datastores de données non structurées avec métadonnées) et des valeurs de champ (dans les datastores de données structurées).

Pour en savoir plus, consultez Filtrer la recherche avec des métadonnées.

Si vous utilisez à la fois une expression de filtre et le filtre de pertinence au niveau du document, l'expression de filtre est appliquée en premier aux résultats, puis le filtre de pertinence au niveau du document.

Avant de commencer

Assurez-vous d'avoir créé une application et data store, et d'avoir ingéré des données dans votre data store. Pour en savoir plus, consultez Créer une application propriétaire. Consultez également Types de données et applications compatibles avec le filtre de pertinence au niveau du document.

Pour filtrer par pertinence, procédez comme suit :

  1. Recherchez l'ID de votre application. Si vous disposez déjà de l'ID de votre application, passez à l'étape suivante.

    1. Dans la Google Cloud console, accédez à la Gemini Enterprise page.

      Accédez à "Applications".

    2. Sur la page Applications, recherchez le nom de votre application et obtenez son ID dans la colonne ID.

  2. Pour filtrer la recherche par pertinence au niveau du document, utilisez le relevanceThreshold champ avec la engines.servingConfigs.search méthode.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    

    Remplacez les éléments suivants :

    • PROJECT_ID : par l'ID du projet.
    • APP_ID : par l'ID de l'application que vous souhaitez interroger.
    • QUERY : par le texte de la requête à rechercher.
    • RELEVANCE_THRESHOLD : par l'une des valeurs suivantes : HIGH, MEDIUM, LOW, LOWEST.
  3. Testez plusieurs requêtes avec différents seuils pour déterminer les meilleurs paramètres de seuil pour vos données et votre application.