Antworten streamen

Auf dieser Seite erhalten Sie eine Einführung in die Methode zum Streamen von Antworten.

Die Methode zum Streamen von Antworten funktioniert in vielerlei Hinsicht wie die Methode für Antworten, hat aber eine zusätzliche Funktion: das Streamen. Wenn Sie eine Antwort streamen, wird die generierte Antwort in mehrere Teile unterteilt, die nacheinander gesendet werden.

Das Streamen von Antworten ist besonders nützlich, wenn die generierten Antworten lang sind, sodass das Senden der gesamten Antwort auf einmal zu einer Verzögerung führen würde. Durch das Streamen von Antworten wird die Latenz reduziert.

Beschränkungen

Die Methode zum Streamen von Antworten funktioniert in vielerlei Hinsicht wie die Methode für Antworten, aber mit den folgenden Ausnahmen:

  • Das Streamen von Antworten wird nur auf Englisch unterstützt.

  • Es gibt nur einen Umformulierungsschritt. Sie können das Umformulieren nicht deaktivieren und auch die maximale Anzahl von Schritten nicht ändern.

  • Für das Streamen von Antworten gibt es keine Fundierungs-Scores. Außerdem können Sie nicht festlegen, dass nur gut fundierte Antworten zurückgegeben werden.

  • Nur Gemini-Modelle können mit der Methode zum Streamen von Antworten verwendet werden. Eine Liste der Modelle finden Sie unter Verfügbare Modelle.

Antwort streamen

Dieser Befehl zeigt, wie Sie die Methode streamingAnswer aufrufen und eine generierte Antwort in einer Reihe von JSON-Antworten zurückgeben. Normalerweise enthält jede Antwort einen Satz der Antwort.

Dieser einfache Befehl zeigt nur die erforderliche Eingabe. Die Antwortmöglichkeiten werden mit den Standardwerten belassen.

Beispiele für andere Antwortmöglichkeiten finden Sie unter Antworten und weiterführende Fragen. Einige Antwortmöglichkeiten sind für das Streaming von Antworten nicht verfügbar. Weitere Informationen finden Sie auf dieser Seite unter Einschränkungen.

REST

So suchen Sie und erhalten Ergebnisse mit einer gestreamten generierten Antwort:

  1. Führen Sie den folgenden curl-Befehl aus:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die Projekt-ID.
    • APP_ID: die ID der App, die Sie abfragen möchten.
    • QUERY: Ein Freitextstring mit der Frage oder Suchanfrage. Beispiel: „Welche Datenbank ist schneller: BigQuery oder Spanner?“

Weitere Beispiele

Der in Antwort streamen gezeigte einfache Befehl ist der einfachste Befehl ohne angegebene Antwortmöglichkeiten. Sie können jedoch dieselben Antwortmöglichkeiten wie bei der Methode für Antworten anwenden, mit Ausnahme der auf dieser Seite aufgeführten Einschränkungen.

Das Streamen von Antworten können auch mit Sitzungen mit weiterführenden Fragen verwendet werden.