在 BigQuery 和数据洞察中使用 Colab 数据应用

借助 Colab Data Apps,您可以将 Colab 笔记本中的数据分析转换为精美的交互式应用。现在,您可以构建包含互动式可视化图表、数据表和机器学习推理的可分享体验,而无需再分享代码或静态报告。

Colab 数据应用提供以下功能:

  • 自助式数据洞见:业务用户可以调整日期范围或过滤条件等参数,以便在不修改代码的情况下查看所需的数据。
  • 无需为应用观看者进行设置:消费者可以使用网址访问您的应用。 他们无需浏览 Google Cloud 控制台或运行笔记本。
  • 灵活性:集成任何 Python 可视化库或 widget,轻松构建自定义的复杂数据应用。为节省时间,请使用集成式代理为您生成代码。
  • 受管理的生命周期:管理员和作者可以控制共享、版本和资源使用情况。

准备工作

  1. 登录您的 Google Cloud 账号。如果您是 Google Cloud新手,请 创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Verify that billing is enabled for your Google Cloud project.

  6. 启用 BigQuery API 和 Dataform API。

    启用 API 所需的角色

    如需启用 API,您需要拥有 Service Usage Admin IAM 角色 (roles/serviceusage.serviceUsageAdmin),该角色包含 serviceusage.services.enable 权限。了解如何授予角色

    启用 API

    对于新项目,BigQuery API 会自动启用。

所需的角色

如需获得创建数据应用所需的权限,请让管理员向您授予项目的以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

您也可以通过自定义角色或其他预定义角色来获取所需的权限。

如果您刚开始接触 BigQuery 中的 Colab Enterprise,请参阅创建笔记本页面上的所需权限。

限制

Colab 数据应用受到以下限制:

  • 首次打开应用时,加载时间可能需要 2 到 5 分钟,具体取决于应用的复杂程度。

  • 互动会话持续 30 分钟。30 分钟后,应用会失去与内核的连接并变为静态。如需开始新的 30 分钟会话,您可以重新加载网页或刷新数据。

  • 无论应用中显示哪些单元格,所有单元格都会按从头到尾的顺序运行。如果不可见的单元格正在运行并消耗内核资源,那么在内核资源释放之前,应用可能会显示为无响应。

  • 您无法使用服务账号或最终用户凭据 (EUC) 来访问数据或查看数据应用。

数据应用的组成部分

您可以添加到数据应用中的组件源自底层笔记本。如果您使用的是现有笔记本,则可以将任何现有单元格添加到数据应用中。

您可以在 Colab 笔记本中创建的任何受支持的单元格类型都可以添加到数据应用中,包括 SQL 单元格、代码单元格、文本单元格和可视化图表单元格。您可以手动创建单元格类型,也可以使用 Colab 数据科学智能体Gemini 为您生成单元格。

如需了解如何向笔记本添加不同类型的单元格,请参阅以下教程:

使用第三方库创建控件

数据应用支持使用第三方 widget 库创建的控件。例如:

  • 您可以使用 iPywidgets 或 AnyWidget 向笔记本添加互动式控件。这些 widget 可以使用 Colab 数据科学智能体生成。
  • 在笔记本级层,您可以串联 widget 单元格。您可以在笔记本的开头定义一个 widget,其输出可供其他单元(例如可视化单元)使用。这样,您就可以为数据应用设置全局过滤条件。

创建和发布 Data 应用

您可以使用现有笔记本或创建新笔记本,来创建 Colab Data Apps。在以下示例中,您将使用面向 Python 用户的笔记本使用入门模板生成笔记本,并从中创建数据应用。

创建数据应用后,您可以将其发布到数据洞察,将数据分析转化为可分享的互动体验。

发布数据应用时,您可以将其连接到现有的 Colab 运行时,也可以使用模板创建新的运行时。借助模板,您可以根据工作负载调整运行时的大小,还可以设置空闲关机时间,以平衡费用和应用启动时间。

如需创建和发布数据应用,请按以下步骤操作:

  1. 前往 Studio 页面。

    前往 Studio

  2. 点击 下拉箭头,然后依次选择笔记本 > 所有模板

  3. 或者,在 BigQuery Studio 首页中,点击查看笔记本库

    BigQuery Studio 首页上的“查看笔记本库”链接。

  4. 点击面向 Python 用户的笔记本使用入门卡片,或在图库中搜索该卡片。

  5. 打开模板后,点击使用此模板,将模板转换为可运行的笔记本。

  6. 依次点击信息中心 数据应用

  7. 组件窗格中,您可以使用复选框向应用添加和移除单元格。

    您可以在其中向应用添加和移除单元格的组件窗格。

  8. 如需创建新组件,请点击 keyboard_backspace 笔记本返回到笔记本,然后添加新单元格。

  9. 如果您对应用的布局感到满意,请点击发布

  10. 发布页面上,输入以下内容:

    1. 名称字段中,输入应用的名称。应用名称不必与用于创建应用的笔记本的名称相同。

    2. 运行时字段中,选择连接到现有运行时并选择运行时,或选择创建新运行时并选择相应的模板。

      如果您选择连接到现有运行时,则必须先将笔记本连接到运行时,然后才能发布应用。

      应用的“发布”页面

    3. 点击发布

    4. 如果系统提示您向数据洞察授予对您 Google 账号的访问权限,请点击允许

  11. 如果您对源笔记本和应用进行了更改,可以点击发布更改来更新应用。

  12. 或者,您也可以在数据洞察中点击 more_vert 更多选项 > 修改,以修改应用。

    系统随即会在 BigQuery Studio 中打开源笔记本。

查看和分享数据应用

您可以使用数据洞察查看 Colab 数据应用,并与他人共享应用。

当您查看应用时,互动性取决于您包含的组件。 例如,Matplotlib 图表是静态的,而使用 Colab 可视化单元格或 Plotly 等库创建的图表是交互式的。

您可以与代码中定义的 widget 进行互动,并使用它们执行过滤或更改输出等任务。这些互动是用户特定的。

如需在数据洞察中查看和分享应用,请按以下步骤操作:

  1. 如需在数据洞察中查看应用,请点击查看数据应用

  2. 如需共享应用,请在数据洞察中点击 person_add 共享

  3. 与用户和群组共享页面上,执行以下操作:

    1. 添加用户和群组字段中,输入您要授予访问权限的群组和个人。

    2. 为指定的用户和群组选择访问权限

      • 编辑者:用户可以修改应用,创建和修改日程安排及提醒,以及与他人分享应用。
      • 查看者:用户可以查看应用,但无法修改或与他人分享。
    3. 点击发送

  4. 如需邀请他人、获取报告链接或分享/下载应用,请点击分享选项旁边的arrow_drop_down,然后选择以下选项之一:

    • 邀请他人
    • 获取报告链接
    • Download report

    数据洞察中的“分享”菜单

如需详细了解如何在数据洞察中共享资源,请参阅邀请他人访问您的报告

重新连接和刷新数据应用

互动会话持续 30 分钟。30 分钟后,应用会失去与内核的连接,并变为静态。如需开始新的 30 分钟会话,您可以重新加载网页或刷新数据。

如需刷新数据,请执行以下操作:

  1. 在数据洞察中打开您的应用。在应用打开的情况下,点击查看数据应用

  2. 在数据洞察中,依次点击 more_vert 更多报告操作 > 刷新数据

用于在数据应用中运行单元格的凭据

默认情况下,数据应用使用应用创建者的凭据进行数据访问和呈现可视化图表。所有观看者都会看到根据作者的访问权限呈现的数据应用。在分享有权访问敏感数据的数据应用之前,请考虑这一点。

删除数据应用

您可以使用数据洞察删除数据应用。删除用于创建应用的笔记本不会删除应用,也不会阻止应用正常运行。

如需在数据洞察中删除数据应用,请按以下步骤操作:

  1. 登录数据洞察

  2. 最近页面上,找到您的应用。

  3. 在该行末尾,依次点击 more_vert 更多选项 > 移除

    用于删除应用的“更多选项”菜单

价格

您需要为在笔记本的运行时中运行代码付费,并为使用的任何 BigQuery 付费。如需了解详情,请参阅 Colab Enterprise 价格