本页介绍了如何创建数据存储区并将 Microsoft SharePoint 关联到 Gemini Enterprise。
准备工作
在设置 Microsoft SharePoint 联合连接之前,请确保满足以下条件:
授予 Discovery Engine Editor 角色 (roles/discoveryengine.editor)。用户必须具有此角色才能创建数据存储区。如需授予此角色,请执行以下操作:
在 Microsoft Entra ID 中将 Gemini Enterprise 注册为 OAuth 2.0 应用,并获取以下凭据:
客户端 ID
客户端密钥
租户 ID
实例 URI
获得 Microsoft SharePoint 管理员授权,配置 Microsoft API 权限。
创建 Microsoft SharePoint 数据存储区
如需创建 Microsoft SharePoint 数据存储区,请执行以下操作:
在 Google Cloud 控制台中,前往 Gemini Enterprise 页面。
选择或创建 Google Cloud 项目。
在导航菜单中,点击数据存储区。
点击 创建数据存储区。
在来源部分中,搜索 Microsoft SharePoint,然后点击选择。
在数据部分:
在连接器模式部分,选择联合搜索或数据注入作为连接模式。
点击继续。
在身份验证设置部分中,根据您选择的连接模式配置身份验证。
根据需要提供以下身份验证详细信息:
- 客户端 ID:在贵组织的 Microsoft Entra ID 中注册的应用的唯一标识符。
- 客户端密钥:在 Microsoft Entra ID 中进行 OAuth 2.0 应用注册流程期间生成的密钥。
- 租户 ID:Microsoft Entra 管理中心内组织的唯一标识符。
- 实例 URI:Microsoft SharePoint 实例的基本网址(例如
https://{your-domain}.sharepoint.com)。
如需了解详情,请参阅获取客户端凭据。
如果您选择了联合搜索,请点击登录,然后完成第三方登录。
点击继续。
如果您选择了联合搜索,系统会显示目标位置部分。输入网站的基本网址。
点击继续。
在要搜索的实体(如果您选择了联合搜索)或要同步的实体(如果您选择了数据提取)部分:
- 选择所有必需的实体。
- 如果您选择了联合搜索,请继续执行下一步。
- 如果您选择了数据提取,请继续执行以下步骤:
- 可选:如需同步特定项目,请执行以下操作:
- 点击过滤。
- 如需将实体从索引中排除,请选中从索引中排除复选框;如需确保实体被纳入索引中,请选中纳入索引中复选框。
- 输入按键。每次输入键后按 Enter 键。
- 点击保存。
- 如需配置同步时间表,请执行以下操作:
- 在同步频率列表中,选择同步频率。
- 如需分开安排实体数据和身份数据的完全同步,请展开完全同步部分中的菜单,然后选择自定义选项。
- 在增量同步频率列表中,选择增量同步频率。 如需了解详情,请参阅同步计划。
- 在同步频率列表中,选择同步频率。
- 可选:如需同步特定项目,请执行以下操作:
点击继续。
在操作部分:
- 如果您选择了联合搜索:
- 在选择要启用的 Microsoft SharePoint 操作中,选择相应类别的操作,以针对连接器启用这些操作。
如果您选择了数据提取:
在身份验证设置部分中,根据您选择的连接模式配置身份验证。
根据需要提供以下身份验证详细信息:
- 客户端 ID:在贵组织的 Microsoft Entra ID 中注册的应用的唯一标识符。
- 客户端密钥:在 Microsoft Entra ID 中进行 OAuth 2.0 应用注册流程期间生成的密钥。
- 租户 ID:Microsoft Entra 管理中心内组织的唯一标识符。
- 实例 URI:Microsoft SharePoint 实例的基本网址(例如
https://{your-domain}.sharepoint.com)。
如需了解详情,请参阅获取客户端凭据。
点击继续。
在目的地部分中,输入网站的基本网址。
点击继续。
在选择要启用的 Microsoft SharePoint 操作中,选择相应类别的操作,以针对连接器启用这些操作。
- 如果您选择了联合搜索:
点击继续。
在配置部分中:
- 从多区域列表中,选择数据连接器的位置。
- 在数据连接器名称字段中,为连接器输入名称。
- 如果您选择
US或EU作为位置,请配置加密设置:- 可选:如果您尚未配置单区域密钥,请点击前往设置页面进行配置。如需了解详情,请参阅为第三方连接器注册单区域密钥。
- 选择 Google-managed encryption key 或 Cloud KMS key。
- 如果您选择的是 Cloud KMS 密钥:
- 在密钥管理类型列表中,选择相应的类型。
- 在 Cloud KMS 密钥列表中,选择相应密钥。
点击继续。
点击创建。Gemini Enterprise 会为您创建数据存储区,并在数据存储区页面上显示您的数据存储区。
在数据存储区页面上,点击数据存储区名称以查看状态。当数据存储区状态从正在创建变为活跃后,Microsoft SharePoint 连接器即可使用。
对于使用 Microsoft SharePoint 创建的提取连接器,数据存储区状态会在同步开始时从正在创建变为正在运行。提取完成后,状态会变为活跃,表明数据存储区已完全配置完毕。根据数据量,提取过程可能需要数小时才能完成。
创建数据存储区后,请创建应用,将其连接到 Microsoft SharePoint 数据存储区,并在执行任何查询之前授权 Gemini Enterprise 访问 Microsoft SharePoint。
为数据提取启用实时同步
实时同步只会同步文档实体,不会同步与身份实体相关的数据。下表显示了哪些文档事件支持实时同步。
| Microsoft SharePoint 实体 | 创建 | 更新 | 删除 | 权限更改 |
|---|---|---|---|---|
| 附件 | ||||
| 评论 | ||||
| 事件 | ||||
| 文件 | ||||
| 页面 |
如需为数据存储区启用实时同步,请按以下步骤操作。
在 Google Cloud 控制台中,前往 Gemini Enterprise 页面。
在导航菜单中,点击数据存储区。
点击要为其启用实时同步的 Microsoft SharePoint 数据存储区的名称。
在数据存储区的数据页面上,等待连接器状态变为活跃。
在实时同步字段中,点击查看/修改。
如需启用实时同步,请点击启用实时同步切换开关。
在客户端密钥字段中,输入一个值。此值用于验证 Microsoft SharePoint 网络钩子事件。我们建议使用 20 个字符的字符串。
点击保存。
等待实时同步字段变为正在运行。
数据处理和查询执行
本部分介绍了 Gemini Enterprise 如何管理您的查询,以及使用联合数据存储区所涉及的隐私权问题。
查询执行
在您授权 Microsoft SharePoint 并向 Gemini Enterprise 发送搜索查询后:
- Gemini Enterprise 会将您的搜索查询直接发送给 Microsoft API。
- Gemini Enterprise 会将获得的结果与其他关联数据源的结果融合,然后显示全面的搜索结果。
数据处理
使用第三方联合搜索时,请遵循以下数据处理规则:
- 您的查询字符串会发送到第三方搜索后端 (Microsoft API)。
- 这些第三方可能会将查询与您的身份相关联。
- 如果启用了多个联合搜索数据源,查询可能会发送到所有这些数据源。
- 数据到达第三方系统后,将受该系统的服务条款和隐私权政策的约束。
后续步骤
- 如需提供用于查询 Microsoft SharePoint 数据的界面,请创建应用,然后将其连接到 Microsoft SharePoint 数据存储区。
- 如需查看操作列表,请参阅查看操作。
- 如需在设置应用后预览搜索结果以了解其显示方式,请参阅获取搜索结果。
- 如需为数据存储区启用提醒,请参阅为第三方数据存储区配置提醒。