En esta página, se describe cómo la recuperación y la clasificación funcionan en conjunto para ofrecer resultados de la búsqueda pertinentes en las apps de Vertex AI Search.
Descripción general
En resumen, la recuperación consiste en encontrar documentos pertinentes, mientras que la clasificación consiste en ordenar esos documentos recuperados. La clasificación de todos los documentos disponibles puede ser costosa desde el punto de vista computacional. Por lo tanto, la recuperación y la clasificación funcionan de forma secuencial.
Primero, el modelo de búsqueda comprende la consulta y la reescribe. Luego, según las fuentes de datos disponibles y la cantidad de documentos indexados en tu almacén de datos, el modelo recupera documentos en el orden de miles. Se asigna una puntuación de pertinencia a los documentos recuperados.
Luego, el modelo de clasificación ordena los documentos recuperados y muestra los 400 resultados mejor clasificados. En la siguiente imagen, se muestra cómo encajan estos dos procesos en el flujo de trabajo de búsqueda.
Métodos de recuperación
La recuperación es el proceso de seleccionar un subconjunto de documentos de tu almacén de datos que sean pertinentes para la consulta de un usuario. El modelo de Vertex AI Search administra la recuperación de tus apps de búsqueda en función de diferentes indicadores, como los siguientes, y asigna puntuaciones de pertinencia:
Temática: Incluye la coincidencia de palabras clave, los gráficos de conocimiento y los indicadores web.
Incorporaciones: Incluye incorporaciones para encontrar contenido conceptualmente similar.
Atención cruzada: Permite que un modelo considere la relación entre una consulta y un documento para asignar una puntuación de pertinencia al documento.
Actualidad: Implica determinar la antigüedad de los documentos en el almacén de datos.
Eventos del usuario: Incluye indicadores de conversión que se usan para la personalización.
Además, en una solicitud de búsqueda, puedes proporcionar filtros de pertinencia y filtros de metadatos para datos de sitios web y datos estructurados o no estructurados para reducir la lista de documentos pertinentes.
Métodos de clasificación
La clasificación toma los documentos que se seleccionan durante la fase de recuperación, les asigna una nueva puntuación de pertinencia según las siguientes condiciones y los reordena:
- Mejora: Promueve y degrada ciertos resultados según los atributos personalizados o la actualidad. Esto afecta los primeros 1,000 documentos recuperados y clasifica los 400 principales. Para obtener más información, consulta Mejora los resultados de la búsqueda.
- Clasificación personalizada: Controla, ajusta y anula la lógica de clasificación predeterminada con un algoritmo de clasificación basado en fórmulas para satisfacer tus requisitos específicos. La puntuación de pertinencia que asigna la clasificación personalizada tiene prioridad cuando se muestran los resultados. Para obtener más información, consulta Personaliza la clasificación de los resultados de la búsqueda.
- Ordenamiento: Aplica instrucciones de ordenamiento, por ejemplo, por fecha.
- Ajuste de la búsqueda: Afecta la forma en que el modelo percibe la pertinencia semántica de tus documentos y cambia las puntuaciones de pertinencia de la incorporación. Para obtener más información, consulta Mejora los resultados de la búsqueda con el ajuste de la búsqueda.
- Reclasificación basada en eventos: Actualiza los resultados en el momento de la publicación con el modelo de personalización basado en eventos del usuario.