本页面介绍了如何创建数据存储区并将 Box 关联到 Gemini Enterprise。
准备工作
在设置 Box 连接之前,确保您已执行以下操作:
- 授予 Discovery Engine Editor 角色 (roles/discoveryengine.editor)。用户必须具有此角色才能创建数据存储区。如需授予此角色,请执行以下操作:
- 创建 Box 应用账号并向其授权。
- 配置 Box 并设置必要的权限。如需查看搜索和数据注入所需的范围列表,请参阅所需权限。
- 获取在创建数据存储区期间使用的身份验证信息。
- 设置一个 Google Cloud 项目,并使用能够管理组织级配置的管理员账号,确保组织可以设置员工池。
- 确保您的组织已设置为能够管理员工池。
创建 Box 数据存储区
如需创建 Box 数据存储区,请执行以下步骤:
在 Google Cloud 控制台中,前往 Gemini Enterprise 页面。
选择或创建 Google Cloud 项目。
在导航菜单中,点击数据存储区。
点击 创建数据存储区。
在来源部分中,搜索 Box,然后点击选择。
在数据部分中:
- 在连接器模式部分中,选择联合搜索或数据注入作为连接模式。
点击继续。
在身份验证设置部分中,根据您选择的连接模式配置身份验证。
如果您选择了联合搜索,请输入以下详细信息:
- 客户端 ID:Box 应用的唯一标识符。
- 客户端密钥:与您的 Box 应用关联的密钥。
如果您选择了数据注入,请输入以下详细信息:
- 企业 ID:Box 企业的唯一标识符。
- 客户端 ID:Box 应用的公开标识符。
- 客户端密钥:与您的 Box 应用关联的密钥。
- 实例 URI:Box 实例 API 的基础网址。
- 私钥:用于对 Box 应用进行身份验证的私钥。
- 密钥 ID:私钥的标识符。
- 口令:用于解密私钥的口令。
如需查看搜索和数据注入所需的范围列表,请参阅所需范围。如需了解如何获取身份验证信息,请参阅获取 Box 身份验证信息。
如果您选择了联合搜索,请点击登录并完成登录。
点击继续。
在高级选项部分中:
- 如果您选择了联合搜索,请选择模拟用户模式作为
Admin或User,然后点击继续。 - 可选。如果您选择了数据注入,请选中启用静态 IP 地址复选框,以允许系统使用一组静态 IP 地址。
- 如果您选择了联合搜索,请选择模拟用户模式作为
点击继续。
在要搜索的实体(如果您选择了联合搜索)或要同步的实体(如果您选择了数据注入)部分:
- 选择所有必需的实体。
- 如果您选择了数据注入,请继续执行以下步骤:
- 可选:如需同步特定项目,请执行以下操作:
- 点击过滤。
- 如需将实体从索引中排除,请选中从索引中排除复选框;如需确保实体包含在索引中,请选中包含到索引中复选框。
- 输入键。每次输入键后按 Enter 键。
- 点击保存。
- 如需配置同步时间表,请执行以下操作:
- 在同步频率列表中,选择同步频率。
- 如需分开安排实体数据和身份数据的完全同步,请展开完全同步部分中的菜单,然后选择自定义选项。
- 在增量同步频率列表中,选择增量同步频率。 如需了解详情,请参阅同步计划。
- 在同步频率列表中,选择同步频率。
- 可选:如需同步特定项目,请执行以下操作:
点击继续。
在配置部分中:
- 从多区域列表中,选择数据连接器的位置。
- 在数据连接器名称字段中,为连接器输入名称。
- 如果您选择
US或EU作为位置,请配置加密设置:- 可选:如果您尚未配置单区域密钥,请点击前往设置页面进行配置。如需了解详情,请参阅为第三方连接器注册单区域密钥。
- 选择 Google管理的加密密钥或 Cloud KMS 密钥。
- 如果您选择的是 Cloud KMS 密钥:
- 在密钥管理类型列表中,选择适当的类型。
- 在 Cloud KMS 密钥列表中,选择相应密钥。
点击继续。
点击创建。Gemini Enterprise 会为您创建数据存储区,并在数据存储区页面上显示您的数据存储区。
如需验证数据存储区的状态,请执行以下操作:
- 在数据存储区列表中找到相应数据存储区,并监控其状态,直到该状态更改为活跃。
- 当数据存储区状态从正在创建更改为活跃时,Box 连接器即可供使用。
对于使用 Box 创建的提取数据存储区,数据存储区状态会在同步开始时从正在创建变为正在运行。提取完成后,状态会更改为活跃,表明数据存储区已完全配置完毕。根据数据量,提取过程可能需要数小时才能完成。
如果您已创建 Box 联合数据存储区,则必须先向 Gemini Enterprise 授予对 Box 的访问权限,然后才能执行查询。
数据处理和查询执行
本部分介绍了 Gemini Enterprise 如何管理您的查询,以及使用联合数据存储区所涉及的隐私权问题。
查询执行
在您授权 Box 并向 Gemini Enterprise 发送搜索查询后:
- Gemini Enterprise 会将您的搜索查询直接发送给 Box API。
- Gemini Enterprise 会将获得的结果与其他关联数据源的结果融合,然后显示全面的搜索结果。
数据处理
使用第三方联合搜索时,遵循以下数据处理规则:
- 您的查询字符串会发送到第三方搜索后端 (Box API)。
- 这些第三方可能会将查询与您的身份关联。
- 如果启用了多个联合搜索数据源,查询可能会发送到所有这些数据源。
- 数据到达第三方系统后,将受该系统的服务条款和隐私权政策的约束。
后续步骤
- 如需提供用于查询数据的界面,请创建应用,然后将其连接到 Box 联合数据存储区。
- 如需在设置应用后预览搜索结果以了解其显示方式,请参阅获取搜索结果。
- 如需为数据存储区启用提醒,请参阅为第三方数据存储区配置提醒。