Auf dieser Seite wird beschrieben, wie Abruf und Ranking zusammenarbeiten, um relevante Suchergebnisse in Vertex AI Search-Apps zu liefern.
Übersicht
Kurz gesagt: Beim Abruf werden relevante Dokumente gesucht, während beim Ranking die abgerufenen Dokumente sortiert werden. Das Ranking aller verfügbaren Dokumente kann rechenintensiv sein. Daher arbeiten Abruf und Ranking sequenziell.
Zuerst versteht das Suchmodell die Abfrage und schreibt sie neu. Je nach den verfügbaren Datenquellen und der Anzahl der indexierten Dokumente in Ihrem Datenspeicher ruft das Modell dann Tausende von Dokumenten ab. Den abgerufenen Dokumenten wird ein Relevanzwert zugewiesen.
Das Ranking-Modell sortiert dann die abgerufenen Dokumente und liefert die 400 am besten bewerteten Ergebnisse. Die folgende Abbildung zeigt, wie diese beiden Prozesse in den Suchworkflow passen.
Abrufmethoden
Beim Abruf wird eine Teilmenge von Dokumenten aus Ihrem Datenspeicher ausgewählt, die für die Abfrage eines Nutzers relevant sind. Das Vertex AI Search-Modell verwaltet den Abruf für Ihre Such-Apps anhand verschiedener Signale wie der folgenden und weist Relevanzwerte zu:
Aktualität: Umfasst Keyword-Matching, Knowledge-Graphen und Web signale.
Einbettungen: Umfasst Einbettungen, um konzeptionell ähnliche Inhalte zu finden.
Cross-Attention: Ermöglicht es einem Modell, die Beziehung zwischen einer Abfrage und einem Dokument zu berücksichtigen, um dem Dokument einen Relevanzwert zuzuweisen.
Aktualität: Ermittelt das Alter der Dokumente im Daten speicher.
Nutzerereignisse: Umfasst Conversion-Signale, die für die Personalisierung verwendet werden.
Außerdem können Sie in einer Suchanfrage Relevanzfilter und Metadatenfilter für Websitedaten sowie strukturierte oder unstrukturierte Daten angeben, um die Liste der relevanten Dokumente einzugrenzen.
Ranking-Methoden
Beim Ranking werden die in der Abrufphase ausgewählten Dokumente verwendet, ihnen wird gemäß den folgenden Bedingungen ein neuer Relevanzwert zugewiesen und sie werden neu sortiert:
- Boost: Bestimmte Ergebnisse werden anhand benutzerdefinierter Attribute oder der Aktualität höher oder niedriger eingestuft. Dies wirkt sich auf die ersten 1.000 abgerufenen Dokumente aus und die 400 besten werden eingestuft. Weitere Informationen finden Sie unter Suchergebnisse optimieren.
- Benutzerdefiniertes Ranking: Steuert, optimiert und überschreibt die Standard-Rankinglogik mit einem formelbasierten Ranking-Algorithmus, um Ihren spezifischen Anforderungen gerecht zu werden. Der Relevanzwert, der beim benutzerdefinierten Ranking zugewiesen wird, hat Vorrang, wenn die Ergebnisse bereitgestellt werden. Weitere Informationen finden Sie unter Ranking der Suchergebnisse anpassen.
- Sortierung: Wendet Sortieranweisungen an, z. B. nach Datum.
- Suchoptimierung: Wirkt sich darauf aus, wie das Modell die semantische Relevanz von Ihren Dokumenten wahrnimmt, und ändert die Relevanzwerte für die Einbettung. Weitere Informationen finden Sie unter Suchergebnisse mit der Suchoptimierung verbessern.
- Ereignisbasiertes Reranking: Aktualisiert die Ergebnisse zum Zeitpunkt der Bereitstellung mithilfe eines auf Nutzerereignissen basierenden Personalisierungsmodells.