Gemini in BigQuery 在何处处理您的数据

本文档可帮助您了解 Gemini in BigQuery 在何处处理您的数据。此行为适用于以下 Gemini in BigQuery 功能:

对于这些功能,Gemini 处理会在查询位置的管辖范围内或 BigQuery 数据集的存储位置进行。例如,如果您的 BigQuery 查询位置或数据集位于 europe-west1 区域,则 Gemini 处理会在 EU 管辖范围内的某个位置进行。此设计可最大限度地减少数据移动,并遵循数据治理最佳实践。如需详细了解有关可用管辖区的限制,请参阅限制

对于大多数 Gemini in BigQuery 功能,管理员可以使用项目级或组织级的全局默认位置设置来控制 Gemini 处理位置。BigQuery 用户可以使用 BigQuery Studio 中的查询位置设置来替换此全局默认位置。如果管理员未在配置设置中指定查询位置设置,或者用户未在查询中明确指定查询位置设置,则 Gemini in BigQuery 会使用从正在编辑的查询中派生的位置。如需详细了解 BigQuery 如何确定查询位置,请参阅运行查询

BigQuery 中的 Gemini 会根据这些控制措施确定 USEU 的管辖范围。如果无法确定管辖区,则系统会根据 Gemini 服务位置使用全球处理位置。

以下部分介绍了如何管理 BigQuery 中各项 Gemini 功能处理数据的位置。

SQL 编辑器和数据画布

当您使用 SQL 编辑器生成代码或使用数据画布创建数据分析工作流时,Gemini in BigQuery 会使用以下逻辑来确定处理位置:

  • BigQuery 管理员可以指定组织级或项目级默认位置。如需了解如何指定默认位置,请参阅指定组织级或项目级默认位置

  • BigQuery 用户可以在 BigQuery Studio 中指定查询位置,以替换管理员设置。如需了解如何在 BigQuery 中指定默认查询位置设置,请参阅指定位置

  • 如果无法确定数据集的位置,或者用户未指定默认查询位置,BigQuery 会尝试根据预运行来确定数据集或查询的位置。例如:

    • SQL 编辑器示例:如果您的 Gemini 请求(用于使用 Gemini 转换 SQL)引用了 europe-west1 中的数据集,则 Gemini 会在 EU 管辖范围内处理数据。
    • 数据画布示例:如果数据画布可视化了位于 us-east4 中的数据集的数据,则 Gemini in BigQuery 的任何分析或建议都会在 US 管辖范围内进行处理。

指定默认的组织级或项目级位置

BigQuery 管理员可以指定组织级或项目级默认位置来处理 Gemini 请求。在用户在当前 SQL 编辑器标签页中进行编辑时,系统会缓存默认位置,缓存时间为用户会话时长。

前提条件

如需指定组织级或项目级默认数据处理位置,BigQuery 管理员必须先填写此表单选择启用 BigQuery 功能,然后收到一封确认该功能已启用的电子邮件。

所需的角色

如需指定默认组织或项目位置,您必须获得 BigQuery Admin 角色(roles/bigquery.admin),该角色包含指定配置设置所需的 bigquery.config.update 权限。如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

设置默认位置

如需设置组织级或项目级默认位置,请完成以下步骤:

  1. 在 Google Cloud 控制台中,前往 BigQuery 页面。

    转到 BigQuery

  2. 在导航窗格中,点击 探索器

  3. 选择要为其指定默认位置的组织或项目。

  4. 在 BigQuery SQL 编辑器中,输入以下语句:

    • 组织级设置:
      ALTER ORGANIZATION SET OPTIONS(default_location='my-default-region');
    • 项目级设置:
      ALTER PROJECT SET OPTIONS(default_location='my-default-region');

此命令将 default_location 的值设置为 my-default-region

验证数据处理的默认位置

如需验证 Gemini in BigQuery 辅助 SQL 查询的数据处理默认位置,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 BigQuery 页面。

    转到 BigQuery

  2. 在 BigQuery Studio SQL 编辑器中,运行以下查询:

    SELECT
        COALESCE(
            (
                SELECT
                    option_value
                FROM INFORMATION_SCHEMA.PROJECT_OPTIONS
                WHERE option_name = 'default_location'
            ),
            (
                SELECT
                    option_value
                FROM INFORMATION_SCHEMA.ORGANIZATION_OPTIONS
                WHERE option_name = 'default_location'
            ));

结果显示 default_location 值已设置为您定义为 my-default-region 的值。如果已定义,此查询会返回项目的默认位置。否则,查询会返回组织的默认位置。用户未明确指定 Gemini in BigQuery 操作的运行位置。

BigQuery 数据洞见

如需使用 BigQuery 数据洞见生成数据分析洞见,您可以对所选表和数据集资源运行数据扫描操作。这些扫描结果是在与 BigQuery 数据集资源相同的位置创建的。在 USEU 管辖区内,Gemini in BigQuery 处理仅限于运行扫描的管辖区。在 USEU 管辖范围之外,处理在全球范围内进行。如需了解全球 Gemini 全球数据处理的发生位置,请参阅 Gemini 服务位置

BigQuery 数据准备

BigQuery 数据准备处理数据的位置取决于您使用的数据准备功能。

  • 对于独立的数据准备,Gemini in BigQuery 处理位置是 BigQuery 数据集所在的位置。
  • 如果您在 Dataform 或 BigQuery 流水线中运行数据准备,则 Gemini in BigQuery 数据处理位置由 Dataform defaultLocation 设置(如果已设置)确定。defaultLocation 设置还会决定 BigQuery 作业位置。这样可确保 Gemini in BigQuery 处理在同一司法管辖区内完成。
  • 如果未为 Dataform 或包含数据准备的 BigQuery 流水线设置 defaultLocation,则 Gemini in BigQuery 处理区域将根据代码库的区域设置来确定。未指定 defaultLocation 设置的流水线可以根据流水线节点中使用的表的位置,在不同位置运行不同的 BigQuery 作业。最佳做法是,您应设置 defaultLocation 以确保处理位置一致。

限制

在确定 Gemini in BigQuery 处理数据的位置时,存在以下限制:

  • Gemini in BigQuery 不会针对各个位置提供数据留存位置。您可以为 USEU 支持的司法管辖区指定数据处理。这些管辖区以外的数据会在全球范围内处理。
  • Gemini in BigQuery 管辖区处理仅适用于正式版 (GA) 的 Gemini in BigQuery 功能。如需查看 Gemini in BigQuery 功能的列表,请参阅 Gemini in BigQuery 概览
  • BigQuery Python 笔记本代码辅助功能和 BigQuery 中的 Colab Enterprise 数据科学代理只支持全球 Gemini 处理。

  • Cloud Assist 对话 (GCA) 中的 Gemini 仅支持全球 Gemini 处理。您可以移除用户的 cloudaicompanion.instances.completeTask Identity and Access Management (IAM) 权限,以拒绝用户访问 GCA 聊天面板。如需详细了解如何创建自定义角色,请参阅创建和管理自定义角色

后续步骤