Respuestas de transmisión

En esta página, se presenta el método de respuesta de transmisión.

El método de respuesta de transmisión tiene muchas de las mismas funciones que el método de respuesta, además de una función adicional: transmisión. Cuando transmites una respuesta, la respuesta generada se divide en varias partes que se envían en secuencia.

La transmisión de respuestas es particularmente útil si las respuestas generadas son largas, de modo que enviar la respuesta completa a la vez causa una demora. La transmisión de respuestas reduce la apariencia de latencia.

Limitaciones

El método de respuesta de transmisión tiene las mismas funciones que el método de respuesta, con las siguientes excepciones:

  • La cantidad de pasos de reformulación es uno. No puedes inhabilitar la reformulación ni cambiar la cantidad máxima de pasos.

  • Solo se pueden usar modelos de Gemini con el método de respuesta de transmisión. Para obtener una lista de los modelos, consulta Modelos disponibles.

Transmite una respuesta

En el siguiente comando, se muestra cómo llamar al método de respuesta de transmisión streaming answer y mostrar una respuesta generada en forma de una serie de respuestas JSON. Por lo general, cada respuesta contiene una oración de la respuesta.

Este comando básico solo muestra la entrada obligatoria. Las opciones se dejan con sus valores predeterminados.

Para ver ejemplos de otras opciones, consulta Obtén respuestas y seguimientos. Algunas opciones de respuesta no están disponibles para la transmisión de respuestas. Consulta las limitaciones en esta página.

REST

Para buscar y obtener resultados con una respuesta generada transmitida, haz lo siguiente:

  1. Ejecuta el siguiente comando de curl:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Reemplaza lo siguiente:

    • PROJECT_ID: Es el ID de tu Google Cloud proyecto.
    • APP_ID: Es el ID de la app de Agent Search que deseas consultar.
    • QUERY: Es una cadena de texto libre que contiene la pregunta o la consulta de búsqueda. Por ejemplo, "¿Qué base de datos es más rápida, BigQuery o Spanner?".

Otros ejemplos

El comando básico que se muestra en Transmite una respuesta es el comando más simple sin opciones especificadas. Sin embargo, puedes aplicar las mismas opciones disponibles con el método de respuesta, con la excepción de las limitaciones que se enumeran en esta página.

Las respuestas de transmisión también se pueden usar con sesiones de seguimiento.