Cette page explique comment la récupération et le classement fonctionnent ensemble pour fournir des résultats de recherche pertinents dans les applications Vertex AI Search.
Présentation
En bref, la récupération consiste à trouver des documents pertinents, tandis que le classement consiste à ordonner ces documents récupérés. Le classement de tous les documents disponibles peut être coûteux en termes de calcul. Par conséquent, la récupération et le classement fonctionnent de manière séquentielle.
Tout d'abord, le modèle de recherche comprend la requête et la réécrit. Ensuite, en fonction des sources de données disponibles et du nombre de documents indexés dans votre data store, le modèle récupère des milliers de documents. Un score de pertinence est attribué aux documents récupérés.
Le modèle de classement ordonne ensuite les documents récupérés et affiche les 400 premiers résultats classés. L'image suivante montre comment ces deux processus s'intègrent dans le workflow de recherche.
Méthodes de récupération
La récupération est le processus de sélection d'un sous-ensemble de documents de votre data store qui sont pertinents pour la requête d'un utilisateur. Le modèle Vertex AI Search gère la récupération pour vos applications de recherche en fonction de différents signaux, tels que les suivants, et attribue des scores de pertinence :
Thématique : inclut la correspondance de mots clés, les graphes de connaissances et les signaux Web.
Embeddings : inclut des embeddings pour trouver du contenu conceptuellement similaire.
Attention croisée : permet à un modèle de prendre en compte la relation entre une requête et un document pour attribuer un score de pertinence au document.
Fraîcheur : consiste à déterminer l'ancienneté des documents dans le data store.
Événements utilisateur : inclut les signaux de conversion utilisés pour la personnalisation.
De plus, dans une requête de recherche, vous pouvez fournir des filtres de pertinence et des filtres de métadonnées pour les données de site Web et les données structurées ou non structurées afin de limiter la liste des documents pertinents.
Méthodes de classement
Le classement prend les documents sélectionnés lors de la phase de récupération, leur attribue un nouveau score de pertinence en fonction des conditions suivantes et les réordonne :
- Booster : promeut et rétrograde certains résultats en fonction d'attributs personnalisés ou de la fraîcheur. Cela a un impact sur les 1 000 premiers documents récupérés et classe les 400 premiers. Pour en savoir plus, consultez la page Booster les résultats de recherche.
- Classement personnalisé : contrôle, ajuste et remplace la logique de classement par défaut par un algorithme de classement basé sur une formule pour répondre à vos besoins spécifiques. Le score de pertinence attribué par le classement personnalisé est prioritaire lors de la diffusion des résultats. Pour en savoir plus, consultez la page Personnaliser le classement des résultats de recherche.
- Ordre : applique des instructions de tri, par exemple par date.
- Ajustement de la recherche : a un impact sur la façon dont le modèle perçoit la pertinence sémantique de vos documents et modifie les scores de pertinence des embeddings. Pour en savoir plus, consultez la page Améliorer les résultats de recherche grâce à l'ajustement de la recherche.
- Reclassement basé sur les événements : met à jour les résultats au moment de la diffusion à l'aide d'un modèle de personnalisation basé sur les événements utilisateur.