配置 Web 应用

准备工作

  1. 您需要是项目的管理员才能配置 Web 应用。

  2. 按照快速入门指南中的操作来设置必要的 API、授予权限并为您的项目预配实例。

  3. 如需访问该 Web 应用,请填写以下表单

使用 Google Cloud 控制台配置项目

  1. 在 Document AI Warehouse 设置视图(即完成配置后的最终视图)中,点击显示详情

  2. 前往第 3 步。选择

    1. 如果您的项目已配置为文档级访问权限控制模式,则需要创建服务账号和密钥:

      1. 点击创建以创建服务账号。

      2. 创建服务账号后,点击创建以创建服务账号密钥。

      3. 您可以点击下载按钮来保存密钥凭据。然后,点击授予,向您的账号和服务账号授予 Content Warehouse Admin 角色。

      4. 点击 Save Config(保存配置)以保存配置。

    2. 如果您的项目使用通用访问模式,请直接点击保存配置

  3. 保存配置后,前往最后一步以打开链接。

  4. 在打开的窗口中,请务必登录。

  5. 选中第一个复选框,以授予 Document AI Warehouse 对您的 Google Cloud 数据的访问权限。

  6. 如果您收到代码 400(实参无效)或 401(身份验证范围不足),请点击右上角的用户部分退出账号,然后重新登录,确保您拥有 OAuth 权限。

  7. 如果您无法按预期打开项目,请在 3 到 5 分钟后刷新页面。保存的配置需要一段时间才能传播。

设置项目级访问权限控制

向用户授予项目级访问权限控制 (ACL)。Document AI Warehouse 角色共有四种,包括 Document CreatorDocument ViewerDocument EditorDocument Admin。以下有关角色的信息非常重要:

  • Document Creator 角色通常会授予给所有用户,以便用户创建文档。

    • 我们建议您将此角色分配给一组用户(例如 Doc Owners),这些用户应能够在 Document AI Warehouse 中创建文档并管理相应群组。
    • 创建者默认会自动获得其所创建文档的文档级 Document Admin 角色。
  • 必须谨慎使用 Document ViewerDocument EditorDocument Admin 角色,并且仅向部分管理员授予这些角色。建议仅在需要清理或审核时临时授予操作员权限。与这些角色一样,用户有权查看、修改、共享或删除项目中的所有文档。

  • 文档级 ACL 可由每个文档的 Document Admin 稍后授予。

配置架构

为文档和文件夹配置架构。文档架构用于在 Document AI Warehouse 中定义文档结构。如需详细了解文档架构,请参阅管理文档架构

(可选)使用 Document AI 处理文档

客户可以将 Document AI 处理器映射到 Document AI Warehouse 架构,并使用 Document AI 处理器提取文本和数据。这样一来,当上传具有特定 Document AI Warehouse 架构的文档时,Document AI Warehouse 会使用相应的 Document AI 处理器根据映射提取文档属性。为此,您需要满足以下要求并遵循以下建议:

  • 这需要同一项目中的 Document AI 处理器。

  • 为了使上传的文档支持全文搜索,我们建议您针对没有专用处理器的 PDF 文档类型使用 Document AI OCR 处理器。然后,您可以在 Document AI Warehouse 中对这些文档执行全文搜索。

  • 多个处理器可以映射到一个架构,用户可以在上传文档时指定要使用哪个处理器进行提取。

    manageStepFour

  • Document AI 处理器的吞吐量配额较低(约为 10 qps)。因此,与 Document AI Warehouse Create API 支持的典型提取吞吐量相比,批量流水线或多个并发用户上传场景的运行速度较慢。

  • 如果您需要使用自定义模型进行分类和注入,请将注入的数据转换为 Document AI Warehouse API JSON 格式,并使用 Create API 注入数据。

    管理第 4 步

问题排查

  • 如需让非管理员用户访问 Document AI Warehouse Web 应用,请让管理员将您添加到许可名单群组。

  • 如果您看到“您无权访问 Partner Dash”之类的消息,请按照此步骤解决问题

后续步骤

如需了解详情,请参阅如何上传文档