Suchanfragen nach Relevanz auf Dokumentebene filtern

Bei der Suche in der Gemini Enterprise-Anwendung können Sie einen Schwellenwert für die Relevanz festlegen, sodass nur die Dokumente, die diesen Schwellenwert erreichen, als Ergebnisse zurückgegeben werden. Auf dieser Seite wird beschrieben, wie Sie einen Relevanzschwellenwert angeben, um die Anzahl der in Abfragen zurückgegebenen Dokumente zu reduzieren.

Nach Relevanz auf Dokumentebene filtern

Jedes von einer Suchanfrage zurückgegebene Dokument erhält ein Relevanzniveau, das angibt, wie relevant das zurückgegebene Dokument für die Anfrage ist. Wenn Sie eine Abfrage über einen API-Aufruf stellen, können Sie einen Schwellenwert für die Relevanz festlegen. Ein hoher Relevanzschwellenwert kann die Anzahl der von einer Abfrage zurückgegebenen Dokumente reduzieren.

Werden bei einer Suche beispielsweise zu viele Dokumente zurückgegeben, die für Ihre Nutzer nicht relevant genug sind, legen Sie den hohen Relevanzschwellenwert fest, um die Ergebnisse auf die wenigen Dokumente einzugrenzen, die am relevantesten sind. Wenn die hohe Einstellung zu restriktiv ist, versuchen Sie es mit der mittleren Einstellung.

Datentypen und Anwendungen, die für den Relevanzfilter auf Dokumentebene unterstützt werden

Der Relevanzfilter auf Dokumentebene kann auf Datenspeicher mit den folgenden Arten von Daten angewendet werden:

  • Websitedaten mit erweiterter Websiteindexierung
  • Benutzerdefinierte unstrukturierte Daten
  • Benutzerdefinierte strukturierte Daten

Der Relevanzfilter auf Dokumentebene eignet sich nicht für Datenspeicher mit einfacher Websiteindexierung, Mediendaten oder Gesundheitsdaten.

Außerdem kann der Relevanzfilter auf Dokumentebene nicht mit zusammengeführten Suchanwendungen verwendet werden. Zusammengeführte Suchanwendungen sind Anwendungen, die mit mehreren Datenspeichern verbunden sind.

Andere Arten von Filtern

Der Relevanzfilter auf Dokumentebene ist nicht die einzige Möglichkeit, die von Abfragen zurückgegebenen Daten zu filtern. Sie können auch Filterausdrücke verwenden, um Ergebnisse basierend auf Metadaten (in Datenspeichern mit unstrukturierten Daten mit Metadaten) und Feldwerten (in Datenspeichern mit strukturierten Daten) zu filtern.

Weitere Informationen finden Sie unter Suche nach Metadaten filtern.

Wenn Sie sowohl einen Filterausdruck als auch den Relevanzfilter auf Dokumentebene verwenden, wird zuerst der Filterausdruck auf die Ergebnisse angewendet und dann der Relevanzfilter auf Dokumentebene.

Hinweis

Achten Sie darauf, dass Sie eine Anwendung und einen Datenspeicher erstellt und Daten in den Datenspeicher aufgenommen haben. Weitere Informationen finden Sie unter Erstanbieter-Anwendung erstellen und Datentypen und Anwendungen, die für den Relevanzfilter auf Dokumentebene unterstützt werden.

So filtern Sie nach Relevanz:

  1. App-ID suchen. Wenn Sie Ihre App-ID bereits haben, fahren Sie mit dem nächsten Schritt fort.

    1. Rufen Sie in der Google Cloud Console die Seite Gemini Enterprise auf.

      Gehen Sie zu Apps

    2. Suchen Sie auf der Seite Apps nach dem Namen Ihrer App und entnehmen Sie die App-ID der Spalte ID.

  2. Zum Filtern einer Suche nach Relevanz auf Dokumentebene verwenden Sie das Feld relevanceThreshold mit der Methode engines.servingConfigs.search.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die Projekt-ID.
    • APP_ID: die ID der App, die Sie abfragen möchten.
    • QUERY: der Abfragetext für die Suche.
    • RELEVANCE_THRESHOLD: eine der folgenden Optionen: HIGH, MEDIUM, LOW, LOWEST.
  3. Testen Sie mehrere Abfragen mit unterschiedlichen Grenzwerten, um die besten Einstellungen für Ihre Daten und Anwendung herauszufinden.