Abruf und Ranking

Auf dieser Seite wird beschrieben, wie Abruf und Ranking zusammenarbeiten, um relevante Suchergebnisse in Vertex AI Search-Apps zu liefern.

Übersicht

Kurz gesagt: Beim Abrufen werden relevante Dokumente gefunden, während beim Ranking die abgerufenen Dokumente sortiert werden. Das Ranking aller verfügbaren Dokumente kann rechenintensiv sein. Abruf und Ranking erfolgen daher sequenziell.

Zuerst wird die Anfrage vom Suchmodell verstanden und umformuliert. Anschließend ruft das Modell je nach verfügbaren Datenquellen und Anzahl der indexierten Dokumente in Ihrem Datenspeicher Tausende von Dokumenten ab. Den abgerufenen Dokumenten wird ein Relevanzwert zugewiesen.

Das Ranking-Modell sortiert dann die abgerufenen Dokumente und gibt die 400 besten Ergebnisse aus. Die folgende Abbildung zeigt, wie diese beiden Prozesse in den Suchworkflow passen.

Abrufen und Ranking in der Suche — **Abbildung 1.** Abruf und Ranking im Suchworkflow

Abrufmethoden

Beim Abrufen wird eine Teilmenge von Dokumenten aus Ihrem Datenspeicher ausgewählt, die für die Anfrage eines Nutzers relevant sind. Das Vertex AI Search-Modell verwaltet den Abruf für Ihre Suchanwendungen basierend auf verschiedenen Signalen, z. B. den folgenden, und weist Relevanzbewertungen zu:

Relevanz: Hierzu gehören Keyword-Abgleich, Knowledge Graphs und Websignale.
Einbettungen: Enthält Einbettungen, um konzeptionell ähnliche Inhalte zu finden.
Cross-Attention: Ermöglicht es einem Modell, die Beziehung zwischen einer Anfrage und einem Dokument zu berücksichtigen, um dem Dokument einen Relevanzwert zuzuweisen.
Aktualität: Hierbei wird das Alter der Dokumente im Datenspeicher ermittelt.
Nutzerereignisse: Hierzu gehören Conversion-Signale, die für die Personalisierung verwendet werden.

Außerdem können Sie in einer Suchanfrage Relevanzfilter und Metadatenfilter für Websitedaten und strukturierte oder unstrukturierte Daten angeben, um die Liste der relevanten Dokumente einzugrenzen.

Ranking-Methoden

Beim Ranking werden die Dokumente, die in der Abrufphase ausgewählt wurden, anhand der folgenden Bedingungen neu bewertet und neu sortiert:

Boost: Bestimmte Ergebnisse werden anhand von benutzerdefinierten Attributen oder Aktualität höher oder niedriger eingestuft. Dies wirkt sich auf die ersten 1.000 abgerufenen Dokumente aus und die 400 besten werden gerankt. Weitere Informationen finden Sie unter Suchergebnisse optimieren.
Benutzerdefiniertes Ranking: Die Standard-Rankinglogik wird mit einem formelbasierten Rankingalgorithmus gesteuert, optimiert und überschrieben, um Ihren spezifischen Anforderungen gerecht zu werden. Der Relevanzwert, der beim benutzerdefinierten Ranking zugewiesen wird, hat Vorrang, wenn die Ergebnisse präsentiert werden. Weitere Informationen finden Sie unter Ranking der Suchergebnisse anpassen.
Sortieren: Wendet Sortieranweisungen an, z. B. nach Datum.
Suchoptimierung: Wirkt sich darauf aus, wie das Modell die semantische Relevanz Ihrer Dokumente wahrnimmt, und ändert die Relevanzwerte für Einbettungen. Weitere Informationen finden Sie unter Suchergebnisse mit der Suchoptimierung verbessern.
Ereignisbasiertes Neusortieren: Die Ergebnisse werden zum Zeitpunkt der Bereitstellung anhand eines auf Nutzerereignissen basierenden Personalisierungsmodells aktualisiert.

Abruf und Ranking Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Übersicht

Abrufmethoden

Ranking-Methoden

Abruf und Ranking