Gemini in BigQuery 在何处处理您的数据
本文档可帮助您了解 Gemini in BigQuery 在何处处理您的数据。此行为适用于以下 Gemini in BigQuery 功能:
对于这些功能,Gemini 处理会在查询位置的管辖范围内或 BigQuery 数据集的存储位置进行。例如,如果您的 BigQuery 查询位置或数据集位于 europe-west1 区域,则 Gemini 处理会在 EU 管辖范围内的某个位置进行。此设计可最大限度地减少数据移动,并遵循数据治理最佳实践。如需详细了解有关可用管辖区的限制,请参阅限制。
对于大多数 Gemini in BigQuery 功能,管理员可以使用项目级或组织级的全局默认位置设置来控制 Gemini 处理位置。BigQuery 用户可以使用 BigQuery Studio 中的查询位置设置来替换此全局默认位置。如果管理员未在配置设置中指定查询位置设置,或者用户未在查询中明确指定查询位置设置,则 Gemini in BigQuery 会使用从正在编辑的查询中派生的位置。如需详细了解 BigQuery 如何确定查询位置,请参阅运行查询。
BigQuery 中的 Gemini 会根据这些控制措施确定 US 或 EU 的管辖范围。如果无法确定管辖区,则系统会根据 Gemini 服务位置使用全球处理位置。
以下部分介绍了如何管理 BigQuery 中各项 Gemini 功能处理数据的位置。
SQL 编辑器和数据画布
当您使用 SQL 编辑器生成代码或使用数据画布创建数据分析工作流时,Gemini in BigQuery 会使用以下逻辑来确定处理位置:
BigQuery 管理员可以指定组织级或项目级默认位置。如需了解如何指定默认位置,请参阅指定组织级或项目级默认位置。
BigQuery 用户可以在 BigQuery Studio 中指定查询位置,以替换管理员设置。如需了解如何在 BigQuery 中指定默认查询位置设置,请参阅指定位置。
如果无法确定数据集的位置,或者用户未指定默认查询位置,BigQuery 会尝试根据预运行来确定数据集或查询的位置。例如:
- SQL 编辑器示例:如果您的 Gemini 请求(用于使用 Gemini 转换 SQL)引用了
europe-west1中的数据集,则 Gemini 会在EU管辖范围内处理数据。 - 数据画布示例:如果数据画布可视化了位于
us-east4中的数据集的数据,则 Gemini in BigQuery 的任何分析或建议都会在US管辖范围内进行处理。
- SQL 编辑器示例:如果您的 Gemini 请求(用于使用 Gemini 转换 SQL)引用了
指定默认的组织级或项目级位置
BigQuery 管理员可以指定组织级或项目级默认位置来处理 Gemini 请求。在用户在当前 SQL 编辑器标签页中进行编辑时,系统会缓存默认位置,缓存时间为用户会话时长。
前提条件
如需指定组织级或项目级默认数据处理位置,BigQuery 管理员必须先填写此表单选择启用 BigQuery 功能,然后收到一封确认该功能已启用的电子邮件。
所需的角色
如需指定默认组织或项目位置,您必须获得 BigQuery Admin 角色(roles/bigquery.admin),该角色包含指定配置设置所需的 bigquery.config.update 权限。如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
设置默认位置
如需设置组织级或项目级默认位置,请完成以下步骤:
在 Google Cloud 控制台中,前往 BigQuery 页面。
在导航窗格中,点击 探索器。
选择要为其指定默认位置的组织或项目。
在 BigQuery SQL 编辑器中,输入以下语句:
- 组织级设置:
ALTER ORGANIZATION SET OPTIONS(default_location='my-default-region');
- 项目级设置:
ALTER PROJECT SET OPTIONS(default_location='my-default-region');
- 组织级设置:
此命令将 default_location 的值设置为 my-default-region。
验证数据处理的默认位置
如需验证 Gemini in BigQuery 辅助 SQL 查询的数据处理默认位置,请按以下步骤操作:
在 Google Cloud 控制台中,前往 BigQuery 页面。
在 BigQuery Studio SQL 编辑器中,运行以下查询:
SELECT COALESCE( ( SELECT option_value FROM INFORMATION_SCHEMA.PROJECT_OPTIONS WHERE option_name = 'default_location' ), ( SELECT option_value FROM INFORMATION_SCHEMA.ORGANIZATION_OPTIONS WHERE option_name = 'default_location' ));
结果显示 default_location 值已设置为您定义为 my-default-region 的值。如果已定义,此查询会返回项目的默认位置。否则,查询会返回组织的默认位置。用户未明确指定 Gemini in BigQuery 操作的运行位置。
BigQuery 数据洞见
如需使用 BigQuery 数据洞见生成数据分析洞见,您可以对所选表和数据集资源运行数据扫描操作。这些扫描结果是在与 BigQuery 数据集资源相同的位置创建的。在 US 或 EU 管辖区内,Gemini in BigQuery 处理仅限于运行扫描的管辖区。在 US 和 EU 管辖范围之外,处理在全球范围内进行。如需了解全球 Gemini 全球数据处理的发生位置,请参阅 Gemini 服务位置。
BigQuery 数据准备
BigQuery 数据准备处理数据的位置取决于您使用的数据准备功能。
- 对于独立的数据准备,Gemini in BigQuery 处理位置是 BigQuery 数据集所在的位置。
- 如果您在 Dataform 或 BigQuery 流水线中运行数据准备,则 Gemini in BigQuery 数据处理位置由 Dataform
defaultLocation设置(如果已设置)确定。defaultLocation设置还会决定 BigQuery 作业位置。这样可确保 Gemini in BigQuery 处理在同一司法管辖区内完成。 - 如果未为 Dataform 或包含数据准备的 BigQuery 流水线设置
defaultLocation,则 Gemini in BigQuery 处理区域将根据代码库的区域设置来确定。未指定defaultLocation设置的流水线可以根据流水线节点中使用的表的位置,在不同位置运行不同的 BigQuery 作业。最佳做法是,您应设置defaultLocation以确保处理位置一致。
限制
在确定 Gemini in BigQuery 处理数据的位置时,存在以下限制:
- Gemini in BigQuery 不会针对各个位置提供数据留存位置。您可以为
US和EU支持的司法管辖区指定数据处理。这些管辖区以外的数据会在全球范围内处理。 - Gemini in BigQuery 管辖区处理仅适用于正式版 (GA) 的 Gemini in BigQuery 功能。如需查看 Gemini in BigQuery 功能的列表,请参阅 Gemini in BigQuery 概览。
BigQuery Python 笔记本代码辅助功能和 BigQuery 中的 Colab Enterprise 数据科学代理只支持全球 Gemini 处理。
Cloud Assist 对话 (GCA) 中的 Gemini 仅支持全球 Gemini 处理。您可以移除用户的
cloudaicompanion.instances.completeTaskIdentity and Access Management (IAM) 权限,以拒绝用户访问 GCA 聊天面板。如需详细了解如何创建自定义角色,请参阅创建和管理自定义角色。
后续步骤
- 请参阅 Gemini in BigQuery 概览。
- 了解如何设置 Gemini in BigQuery。
- 了解如何借助 Gemini 辅助功能编写查询。
- 详细了解Google Cloud 合规性。
- 了解 Gemini in BigQuery 的安全性、隐私权和合规性。
- 详细了解 Gemini for Google Cloud 如何使用您的数据。