Questa pagina descrive come il recupero e la classificazione funzionano insieme per fornire risultati di ricerca pertinenti nelle app di Vertex AI Search.
Panoramica
In breve, il recupero consiste nel trovare documenti pertinenti, mentre la classificazione consiste nel ordinare i documenti recuperati. La classificazione di tutti i documenti disponibili può essere costosa dal punto di vista computazionale. Pertanto, il recupero e la classificazione funzionano in sequenza.
Innanzitutto, il modello di ricerca comprende la query e la riscrive. Poi, a seconda delle origini dati disponibili e del numero di documenti indicizzati documenti nel datastore, il modello recupera documenti nell'ordine di migliaia. Ai documenti recuperati viene assegnato un punteggio di pertinenza.
Il modello di classificazione ordina quindi i documenti recuperati e mostra i primi 400 risultati classificati. L'immagine seguente mostra come questi due processi si inseriscono nel flusso di lavoro di ricerca.
Metodi di recupero
Il recupero è il processo di selezione di un sottoinsieme di documenti dal datastore pertinenti alla query di un utente. Il modello di Vertex AI Search gestisce il recupero per le app di ricerca in base a diversi indicatori, come i seguenti, e assegna punteggi di pertinenza:
Pertinenza: include la corrispondenza delle parole chiave, i grafici della conoscenza e gli indicatori web.
Incorporamenti: include gli incorporamenti per trovare contenuti concettualmente simili.
Attenzione incrociata: consente a un modello di considerare la relazione tra una query e un documento per assegnare un punteggio di pertinenza al documento.
Aggiornamento: comporta l'accertamento dell'età dei documenti nel data store.
Eventi utente: include gli indicatori di conversione utilizzati per la personalizzazione.
Inoltre, in una richiesta di ricerca, puoi fornire filtri di pertinenza e filtri di metadati per i dati del sito web e i dati strutturati o non strutturati per restringere l'elenco dei documenti pertinenti.
Metodi di classificazione
La classificazione prende i documenti selezionati durante la fase di recupero, assegna loro un nuovo punteggio di pertinenza in base alle seguenti condizioni e li riordina:
- Aumento: promuove e declassa determinati risultati in base ad attributi personalizzati o all' aggiornamento. Questo influisce sui primi 1000 documenti recuperati e classifica i primi 400. Per saperne di più, consulta Aumentare i risultati di ricerca.
- Classificazione personalizzata: controlla, ottimizza e sostituisce la logica di classificazione predefinita con un algoritmo di classificazione basato su formule per soddisfare i tuoi requisiti specifici. Il punteggio di pertinenza assegnato dalla classificazione personalizzata ha la precedenza quando vengono mostrati i risultati. Per saperne di più, consulta Personalizzare la classificazione dei risultati di ricerca.
- Ordinamento: applica le istruzioni di ordinamento, ad esempio per data.
- Ottimizzazione della ricerca: influisce sul modo in cui il modello percepisce la pertinenza semantica dei documenti e modifica i punteggi di pertinenza degli incorporamenti. Per saperne di più, consulta Migliorare i risultati di ricerca con l'ottimizzazione della ricerca.
- Riclassificazione basata sugli eventi: aggiorna i risultati al momento della pubblicazione utilizzando il modello di personalizzazione basato sugli eventi utente.