Cloud Storage 数据存储区工具

此工具用于通过连接到填充了您自己文件的数据存储区,从非结构化文档或常见问题解答内容中搜索和检索信息。

首次创建工具时,您需要提供以下信息:

  • 名称:描述性名称,可帮助 AI 了解工具的用途。名称应以动词开头(例如 search_internal_docsquery_product_manuals)。
  • 说明:(可选)对工具的功能以及 AI 应何时使用该工具的说明。这有助于模型确定此特定数据存储区是否包含用户提示的答案。
  • 模拟工具响应:一种可选配置,用于在数据完全编入索引之前模拟工具的输出,以进行测试。
  • 位置:数据存储区托管的区域(例如全球)。
  • 数据类型:您要导入的内容的格式:

    • 非结构化数据:最适合 PDF、HTML 文件或文本文件等文档。
    • FAQ:最适合结构化问答对。
  • 选择文件夹或文件:Google Cloud Storage 中的数据路径 (gs://*)。您可以选择导入单个文件或整个文件夹

  • 同步频率:该工具检查源文件中更新的频率。

    • 一次性:一次性导入当前数据。
    • 定期:在源文件发生更改时自动更新数据存储区(创建后无法更改此设置)。

常见问题解答数据存储区

FAQ 数据存储区可以包含常见问题解答 (FAQ)。 如果用户问题与上传的问题高度匹配,代理会返回该问题的答案,而不会进行任何修改。您可以为代理显示的问题和答案对提供标题和网址。

数据必须以 CSV 格式上传到数据存储区。每个文件都必须包含一个描述列的标题行。

例如:

"question","answer","title","url"
"Why is the sky blue?","The sky is blue because of Rayleigh scattering.","Rayleigh scattering","https://en.wikipedia.org/wiki/Rayleigh_scattering"
"What is the meaning of life?","42","",""

titleurl 列是可选的,可以省略:

"answer","question"
"42","What is the meaning of life?"

在上传过程中,您可以选择一个文件夹,其中每个文件都被视为 CSV 文件,无论其扩展名是什么。

限制:

  • , 后面添加多余的空格字符会导致错误。
  • 空白行(即使位于文件末尾)也会导致错误。

非结构化数据存储区

非结构化数据存储区可以包含以下格式的内容:

  • HTML
  • PDF
  • TXT
  • CSV

从其他项目的 Cloud Storage 存储桶导入文件是可行的(但并不常见)。为此,您需要向导入流程授予明确的访问权限。按照错误消息中的说明操作,其中会包含需要对相应存储桶拥有读取权限才能执行导入操作的用户的名称。

限制:

  • 文本格式的文件大小上限为 2.5MB,其他格式为 100MB。

另请参阅从 Cloud Storage 导入