逐字逐句给出回答

本页面介绍了流式回答方法。

流式回答方法具有与 回答方法相同的许多功能,外加一项额外功能:流式传输。当您流式传输回答时,生成的回答会分解为多个部分,并按顺序发送。

如果生成的回答很长,导致一次发送整个回答会造成延迟,那么流式传输回答就特别有用。流式传输回答可以减少延迟的出现。

限制

流式回答方法具有与回答方法相同的功能,但有以下例外情况:

  • 改述步骤的数量为 1。您无法停用改述,也无法更改最大步骤数。

  • 只有 Gemini 模型可以与流式回答方法搭配使用。 如需查看模型列表,请参阅可用模型

流式传输回答

以下命令展示了如何调用流式回答方法,并以一系列 JSON 响应的形式返回生成的回答。通常,每个响应都包含回答中的一句话。

此基本命令仅显示必需的输入。选项保留为默认值。

如需查看其他选项的示例,请参阅获取回答和 后续问题。某些回答选项不适用于 回答流式传输;请参阅本页面的限制

REST

如需搜索并获取流式生成的回答,请执行以下操作:

  1. 运行以下 curl 命令:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    替换以下内容:

    • PROJECT_ID:您的 Google Cloud 项目的 ID。
    • APP_ID:您要查询的 Agent Search 应用的 ID。
    • QUERY:包含问题或搜索查询的自由文本字符串。例如,“哪个数据库更快,bigquery 还是 spanner?”。

其他示例

流式传输回答中显示的基本命令是最简单的命令,未指定任何选项。不过,您可以应用与回答方法相同的 选项,但本页面列出的 限制除外。

流式传输回答也可用于后续会话