Gemini in BigQuery 在何处处理您的数据
本文档可帮助您了解 Gemini in BigQuery 在何处处理您的数据。此行为适用于以下 Gemini in BigQuery 功能:
对于这些功能,Gemini 处理会在查询位置的管辖范围内或 BigQuery 数据集的存储位置进行。例如,如果您的 BigQuery 查询位置或数据集位于 europe-west1 区域,则 Gemini 处理会在 EU 管辖范围内的某个位置进行。此设计可最大限度地减少数据移动,并遵循数据治理最佳实践。如需详细了解有关可用管辖区的限制,请参阅限制。
对于大多数 Gemini in BigQuery 功能,管理员可以使用项目级或组织级的全局默认位置设置来控制 Gemini 处理位置。BigQuery 用户可以使用 BigQuery Studio 中的查询位置设置来替换此全局默认位置。如果管理员未在配置设置中指定查询位置设置,或者用户未在查询中明确指定查询位置设置,则 Gemini in BigQuery 会使用从正在编辑的查询中派生的位置。如需详细了解 BigQuery 如何确定查询位置,请参阅运行查询。
BigQuery 中的 Gemini 会根据这些控制措施确定 US 或 EU 的管辖范围。如果无法确定管辖区,则系统会根据
Gemini 服务位置使用全球处理位置。
以下部分介绍了如何管理 BigQuery 中各项 Gemini in BigQuery 功能处理数据的位置。
SQL 编辑器和数据画布
当您使用 SQL 编辑器生成代码或使用数据画布创建数据分析工作流时,Gemini in BigQuery 会使用以下逻辑来确定处理位置:
BigQuery 管理员可以指定组织级或项目级默认位置。如需了解如何指定默认位置,请参阅指定组织级或项目级默认位置。
BigQuery 用户可以在 BigQuery Studio 中指定查询位置,以替换管理员设置。如需了解如何在 BigQuery 中指定默认查询位置设置,请参阅指定位置。
如果无法确定数据集的位置,或者用户未指定默认查询位置,BigQuery 会尝试根据预运行来确定数据集或查询的位置。例如:
- SQL 编辑器示例:如果您在 使用 Gemini 转换 SQL 的 Gemini 请求中引用了
europe-west1中的数据集,则 Gemini 会处理EU管辖范围内的相应数据。 - 数据画布示例:如果数据画布可视化了位于
us-east4中的数据集的数据,则 BigQuery 中的任何 Gemini 分析或建议都会在US管辖范围内处理。
- SQL 编辑器示例:如果您在 使用 Gemini 转换 SQL 的 Gemini 请求中引用了
指定默认的组织级或项目级位置
BigQuery 管理员可以指定组织级或项目级默认位置来处理 Gemini 请求。系统会缓存默认位置,缓存时长为用户在当前 SQL 编辑器标签页中进行编辑的会话时长。如果 Gemini in BigQuery 操作未明确指定位置,且无法从请求中推断出位置,则使用默认位置。
如需详细了解如何配置默认位置,请参阅指定全局设置。
如需详细了解如何验证默认位置配置,请参阅检索配置设置。
BigQuery 数据工程智能体
数据工程代理支持管辖区级区域化,可为 us、eu 和全球区域提供专用服务端点。系统会根据关联的 Dataform 工作区位置自动分配区域偏好设置。
在 Google Cloud 控制台中与代理互动时,所有内部处理(包括推理引擎和对话上下文的临时存储)都严格在 Dataform 工作区区域定义的管辖范围内进行。
使用公共 API 与代理互动时,请选择 us 或 eu,以确保所有处理、推理和下游服务调用都保留在该管辖区内。如果指定的 API 区域与工作区区域不一致,系统会返回错误。
如需更改处理区域,您必须创建新的 Dataform 代码库,并将其配置为更新后的区域。
BigQuery Data Science Agent
BigQuery 数据科学智能体仅在少数 Colab Enterprise 区域提供。系统会根据 Colab Enterprise 笔记本的位置自动确定区域。如需了解详情,请参阅 Colab Enterprise 位置。
当您在 Google Cloud 控制台中与数据科学智能体互动时,会话数据(包括对话记录和对话上下文的临时存储)会存储在与笔记本相同的区域中。以静态方式存储在笔记本中的数据也会存储在笔记本的位置。
Gemini 模型请求会根据模型版本和区域路由到区域端点或全球端点。此路由是动态的,可能会随着新模型版本的发布而发生变化。例如,较新的模型版本最初可能使用全球端点,然后随着时间的推移扩展到区域端点或多区域端点。
如需详细了解数据驻留,请参阅数据驻留。
BigQuery 数据洞察
如需使用 BigQuery 数据洞见生成数据分析洞见,您可以对所选表和数据集资源运行数据扫描操作。这些扫描结果是在与 BigQuery 数据集资源相同的位置创建的。在 US 或 EU 管辖区内,Gemini in BigQuery 处理仅限于运行扫描的管辖区。在US和EU管辖区之外,处理在全球范围内进行。如需了解全球 Gemini 全球数据处理的发生位置,请参阅
Gemini 服务位置。
BigQuery 数据准备
BigQuery 数据准备处理数据的位置取决于您使用的数据准备功能。
- 对于独立的数据准备,Gemini in BigQuery 处理位置是 BigQuery 数据集所在的位置。
- 如果您将数据准备作为 Dataform 或 BigQuery 流水线的一部分运行,则 Gemini in BigQuery 数据处理位置由 Dataform
defaultLocation设置(如果已设置)确定。defaultLocation设置还会决定 BigQuery 作业位置。这样可确保 Gemini in BigQuery 处理在同一司法管辖区内完成。 - 如果未设置 Dataform 的
defaultLocation或包含数据准备的 BigQuery 流水线,则 Gemini in BigQuery 处理区域将根据代码库的区域设置来确定。未指定defaultLocation设置的流水线可以根据流水线节点中使用的表的位置在不同位置运行不同的 BigQuery 作业。最佳实践是设置defaultLocation以确保处理位置一致。
限制
在确定 Gemini in BigQuery 处理数据的位置时,存在以下限制:
- Gemini in BigQuery 不会针对各个位置提供数据留存位置。您可以为
US和EU支持的司法管辖区指定数据处理位置。这些管辖区以外的数据会在全球范围内处理。 - Gemini in BigQuery 管辖区处理仅适用于正式版 (GA) Gemini in BigQuery 功能。如需查看 Gemini in BigQuery 功能列表,请参阅 Gemini in BigQuery 概览。
- Cloud Assist 对话 (GCA) 中的 Gemini 仅支持全球 Gemini 处理。您可以移除用户的
geminicloudassist.agents.invokeIdentity and Access Management (IAM) 权限,以拒绝用户访问 GCA 聊天面板。如需详细了解如何创建自定义角色,请参阅创建和管理自定义角色。
后续步骤
- 请参阅 Gemini in BigQuery 概览。
- 了解如何设置 Gemini in BigQuery。
- 了解如何在 Gemini 的协助下编写查询。
- 详细了解 Google Cloud合规性。
- 了解 Gemini in BigQuery 的安全性、隐私权和合规性。
- 详细了解 Gemini for Google Cloud 如何使用您的数据。