设置 Confluence Cloud 数据存储区

本页介绍了如何创建数据存储区并将 Confluence Cloud 关联到 Gemini Enterprise。

准备工作

在设置 Confluence Cloud 联合连接之前,请确保满足以下条件:

  • 授予 Discovery Engine Editor 角色 (roles/discoveryengine.editor)。用户必须具有此角色才能创建数据存储区。如需授予此角色,请执行以下操作:

    1. 在 Google Cloud 控制台中,前往 IAM 页面。

      进入 IAM

    2. 找到相应用户账号,然后点击修改图标 修改
    3. 向用户授予 Discovery Engine Editor 角色。如需了解详情,请参阅 IAM 角色和权限

  • 如需在 Google Gemini Enterprise 中强制执行数据源访问权限控制并保护数据安全,请配置身份提供方

  • 如需设置 Confluence Cloud 连接器,您必须使用新的集中式 Atlassian 用户管理模型。如果您使用的是旧版模型,则需要先迁移用户管理,再继续操作。如需了解详情,请参阅网站管理员角色

  • 创建 OAuth 2.0 应用获取客户端 ID 和密钥,并在 Confluence Cloud 管理员的同意下配置最低应用权限

  • 可选:如需从 Confluence Cloud 中检索用户电子邮件地址(即使设置限制了电子邮件地址的可见性),请使用 Confluence 网站管理员权限安装 User Identity Accessor for Confluence Cloud 应用,然后对其进行配置,以安全地检索用户电子邮件地址。如果邮箱信息已可供公开访问,则无需安装此应用。

创建 Confluence Cloud 数据存储区

如需创建 Confluence Cloud 数据存储区,请执行以下步骤:

  1. 在 Google Cloud 控制台中,前往 Gemini Enterprise 页面。

    Gemini Enterprise

  2. 选择或创建 Google Cloud 项目。

  3. 在导航菜单中,点击数据存储区

  4. 点击 创建数据存储区

  5. 来源部分中,搜索 Confluence Cloud,然后点击选择

  6. 数据部分:

    1. 连接器模式部分,选择数据注入联合搜索作为连接模式。
    2. 点击继续

    3. 身份验证设置部分中,根据您选择的连接模式配置身份验证。

      1. 如果您选择了数据提取

        1. 选择 OAuth 2.0 客户端凭据API 令牌作为身份验证方法。
        2. 如果您选择 OAuth 2.0 客户端凭据,请输入以下详细信息:
          • 客户端 ID (Client ID)
          • 客户端密钥 (Client Secret)
          • 实例 URI
          • 实例 ID
        3. 如果您选择 API 令牌,请输入以下详细信息:
          • 实例 URI
          • 用户账号
          • API 令牌
      2. 如果您选择了联合搜索

        1. OAuth 2.0 客户端凭据是唯一适用的方法。提供以下详细信息:
          • 客户端 ID (Client ID)
          • 客户端密钥 (Client Secret)
          • 实例 URI

      如需详细了解凭据,请参阅 Confluence Cloud 配置

      1. 点击登录,然后完成 Atlassian 登录。
    4. 点击继续

    5. 目的地部分中,输入 Confluence Cloud 端点的网址。

    6. 点击继续

    7. 要同步的实体(如果您选择了数据提取)或要搜索的实体(如果您选择了联合搜索)部分:

      1. 选择所有必需的实体。
      2. 可选:如需同步特定项目,请执行以下操作:
        1. 点击过滤
        2. 如需将实体从索引中排除,请选择从索引中排除;如需确保实体被纳入索引中,请选择纳入索引中
        3. 输入空间键。每次按空间键后按 Enter 键。
        4. 点击保存
      3. 如果您选择了数据提取,请执行以下操作来配置同步时间表:

        1. 同步频率列表中,选择同步频率。

          • 如需分开安排实体数据和身份数据的完全同步,请展开完全同步部分中的菜单,然后选择自定义选项
        2. 增量同步频率列表中,选择增量同步频率。

      如需了解详情,请参阅同步计划

  7. 点击继续

  8. 配置部分中:

    1. 多区域列表中,选择数据连接器的位置。
    2. 数据连接器名称字段中,为连接器输入名称。
    3. 如果您选择 USEU 作为位置,请配置加密设置
      • 可选:如果您尚未配置单区域密钥,请点击前往设置页面进行配置。如需了解详情,请参阅为第三方连接器注册单区域密钥
      • 选择 Google-managed encryption keyCloud KMS key
      • 如果您选择的是 Cloud KMS 密钥
        • 密钥管理类型列表中,选择相应的类型。
        • Cloud KMS 密钥列表中,选择相应密钥。
      如需了解详情,请参阅客户管理的加密密钥

  9. 点击继续

  10. 结算部分中,选择一般价格可配置的价格。如需了解详情,请参阅验证项目的结算状态许可

  11. 点击创建。Gemini Enterprise 会为您创建数据存储区,并在数据存储区页面上显示您的数据存储区。

数据存储区页面上,点击数据存储区名称以查看状态。当数据存储区状态从正在创建变为活跃后,Confluence Cloud 连接器即可供使用。

对于使用 Confluence Cloud 创建的提取连接器,数据存储区状态会在同步开始时从正在创建变为正在运行。提取完成后,状态会变为活跃,表明数据存储区已完全配置完毕。根据数据量,提取过程可能需要数小时才能完成。

创建数据存储区后,请创建应用将其连接到 Confluence Cloud 数据存储区,并在执行任何查询之前授权 Gemini Enterprise 访问 Confluence Cloud。

为数据提取启用实时同步

实时同步只会同步文档实体,不会同步与身份实体相关的数据。下表显示了哪些文档事件支持实时同步。

Confluence 实体 创建 更新 删除 权限更改
空间
页面
博客
附件
评论
白板

在创建 Confluence Cloud 数据存储区 20 分钟后启用实时同步。 如需为 Confluence 数据源启用实时同步,请按以下步骤操作:

生成网络钩子网址

  1. 前往 Gemini Enterprise 页面,在导航菜单中点击数据存储区
  2. 选择一个 Confluence 数据存储区。
  3. 实时同步行中,点击查看/修改
  4. 查看和修改实时同步参数对话框中,执行以下操作:
    1. 如需开启实时同步,请点击启用实时同步切换开关。
    2. 客户端密钥字段中,输入一个占位值,例如 clientsecret
    3. 点击保存
  5. 实时同步的状态变为 Running 后,点击查看/修改
  6. 查看和修改实时同步参数对话框中,执行以下操作:
    1. 复制 Webhook 网址
    2. 点击关闭

使用 API 订阅事件

如需接收来自 Confluence 的实时更新,您必须使用 POST 请求订阅特定事件。如需进行 API 调用,请使用在 Confluence 中设置身份验证和权限所用的同一管理员账号来创建数据存储区。

      curl -X POST \
        INSTANCE_URL/wiki/rest/webhooks/1.0/webhook \
        -H "Content-Type: application/json" \
        -u "USERNAME:API_TOKEN" \
        -d '{
          "name": "SUBSCRIPTION_NAME",
          "url": "LISTENER_URL",
          "events": [
            "EVENT_TYPE_1",
            "EVENT_TYPE_2"
          ],
          "active": true
        }'
  • INSTANCE_URL:Atlassian Cloud 网站的基本网址。

  • USERNAME:Atlassian Cloud 用户名。

  • API_TOKEN:从您的 Atlassian 账号生成的 API 令牌。如需了解详情,请参阅在 Confluence 中设置 API 令牌

  • SUBSCRIPTION_NAME:您的事件订阅的唯一名称。

  • LISTENER_URL:在数据存储区中启用实时同步 (RTS) 后,从 Google Cloud 控制台中复制的网络钩子网址。

  • EVENT_TYPE:您要订阅的事件类型。您可以订阅附件、博文、页面、空间和评论的创建、更新和删除事件。

    用户可以订阅以下事件:

    • space_created
    • space_updated
    • page_created
    • page_updated
    • attachment_created
    • attachment_updated
    • comment_created
    • comment_updated
    • blog_created
    • blog_updated

API 错误代码

下表列出了用户在创建网络钩子时遇到的常见 API 错误代码。

错误类 错误代码 错误消息 问题排查
403 FORBIDDEN 当前用户无权使用 Confluence。 确保管理员账号中的令牌有效且 API 端点正确。

数据处理和查询执行

本部分介绍了 Gemini Enterprise 如何管理您的查询,以及使用联合数据存储区所涉及的隐私权问题。

查询执行

在您授权 Confluence Cloud 并向 Gemini Enterprise 发送搜索查询后:

  • Gemini Enterprise 会将您的搜索查询直接发送给 Atlassian API。
  • Gemini Enterprise 会将获得的结果与其他关联数据源的结果融合,然后显示全面的搜索结果。

数据处理

使用第三方联合搜索时,请遵循以下数据处理规则:

  • 您的查询字符串会发送到第三方搜索后端 (Atlassian API)。
  • 这些第三方可能会将查询与您的身份相关联。
  • 如果启用了多个联合搜索数据源,查询可能会发送到所有这些数据源。
  • 数据到达第三方系统后,将受该系统的服务条款和隐私权政策的约束。

后续步骤