在 BigQuery 和数据洞察中使用 Colab 数据应用
借助 Colab Data Apps,您可以将 Colab 笔记本中的数据分析转换为精美的交互式应用。现在,您可以构建包含互动式可视化图表、数据表和机器学习推理的可分享体验,而无需再分享代码或静态报告。
Colab 数据应用提供以下功能:
- 自助式数据洞见:业务用户可以调整日期范围或过滤条件等参数,以便在不修改代码的情况下查看所需的数据。
- 无需为应用观看者进行设置:消费者可以使用网址访问您的应用。 他们无需浏览 Google Cloud 控制台或运行笔记本。
- 灵活性:集成任何 Python 可视化库或 widget,轻松构建自定义的复杂数据应用。为节省时间,请使用集成式代理为您生成代码。
- 受管理的生命周期:管理员和作者可以控制共享、版本和资源使用情况。
准备工作
- 登录您的 Google Cloud 账号。如果您是 Google Cloud新手,请 创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
启用 BigQuery API 和 Dataform API。
启用 API 所需的角色
如需启用 API,您需要拥有 Service Usage Admin IAM 角色 (
roles/serviceusage.serviceUsageAdmin),该角色包含serviceusage.services.enable权限。了解如何授予角色。对于新项目,BigQuery API 会自动启用。
所需的角色
如需获得创建数据应用所需的权限,请让管理员向您授予项目的以下 IAM 角色:
-
BigQuery Read Session User (
roles/bigquery.readSessionUser) -
BigQuery Studio User (
roles/bigquery.studioUser)
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
如果您刚开始接触 BigQuery 中的 Colab Enterprise,请参阅创建笔记本页面上的所需权限。
限制
Colab 数据应用受到以下限制:
首次打开应用时,加载时间可能需要 2 到 5 分钟,具体取决于应用的复杂程度。
互动会话持续 30 分钟。30 分钟后,应用会失去与内核的连接并变为静态。如需开始新的 30 分钟会话,您可以重新加载网页或刷新数据。
无论应用中显示哪些单元格,所有单元格都会按从头到尾的顺序运行。如果不可见的单元格正在运行并消耗内核资源,那么在内核资源释放之前,应用可能会显示为无响应。
您无法使用服务账号或最终用户凭据 (EUC) 来访问数据或查看数据应用。
数据应用的组成部分
您可以添加到数据应用中的组件源自底层笔记本。如果您使用的是现有笔记本,则可以将任何现有单元格添加到数据应用中。
您可以在 Colab 笔记本中创建的任何受支持的单元格类型都可以添加到数据应用中,包括 SQL 单元格、代码单元格、文本单元格和可视化图表单元格。您可以手动创建单元格类型,也可以使用 Colab 数据科学智能体 或 Gemini 为您生成单元格。
如需了解如何向笔记本添加不同类型的单元格,请参阅以下教程:
使用第三方库创建控件
数据应用支持使用第三方 widget 库创建的控件。例如:
- 您可以使用 iPywidgets 或 AnyWidget 向笔记本添加互动式控件。这些 widget 可以使用 Colab 数据科学智能体生成。
- 在笔记本级层,您可以串联 widget 单元格。您可以在笔记本的开头定义一个 widget,其输出可供其他单元(例如可视化单元)使用。这样,您就可以为数据应用设置全局过滤条件。
创建和发布 Data 应用
您可以使用现有笔记本或创建新笔记本,来创建 Colab Data Apps。在以下示例中,您将使用面向 Python 用户的笔记本使用入门模板生成笔记本,并从中创建数据应用。
创建数据应用后,您可以将其发布到数据洞察,将数据分析转化为可分享的互动体验。
发布数据应用时,您可以将其连接到现有的 Colab 运行时,也可以使用模板创建新的运行时。借助模板,您可以根据工作负载调整运行时的大小,还可以设置空闲关机时间,以平衡费用和应用启动时间。
如需创建和发布数据应用,请按以下步骤操作:
前往 Studio 页面。
点击 下拉箭头,然后依次选择笔记本 > 所有模板。
或者,在 BigQuery Studio 首页中,点击查看笔记本库。
点击面向 Python 用户的笔记本使用入门卡片,或在图库中搜索该卡片。
打开模板后,点击使用此模板,将模板转换为可运行的笔记本。
依次点击信息中心 数据应用。
在组件窗格中,您可以使用复选框向应用添加和移除单元格。
如需创建新组件,请点击 keyboard_backspace 笔记本返回到笔记本,然后添加新单元格。
如果您对应用的布局感到满意,请点击发布。
在发布页面上,输入以下内容:
在名称字段中,输入应用的名称。应用名称不必与用于创建应用的笔记本的名称相同。
在运行时字段中,选择连接到现有运行时并选择运行时,或选择创建新运行时并选择相应的模板。
如果您选择连接到现有运行时,则必须先将笔记本连接到运行时,然后才能发布应用。
点击发布。
如果系统提示您向数据洞察授予对您 Google 账号的访问权限,请点击允许。
如果您对源笔记本和应用进行了更改,可以点击发布更改来更新应用。
或者,您也可以在数据洞察中点击 more_vert 更多选项 > 修改,以修改应用。
系统随即会在 BigQuery Studio 中打开源笔记本。
查看和分享数据应用
您可以使用数据洞察查看 Colab 数据应用,并与他人共享应用。
当您查看应用时,互动性取决于您包含的组件。 例如,Matplotlib 图表是静态的,而使用 Colab 可视化单元格或 Plotly 等库创建的图表是交互式的。
您可以与代码中定义的 widget 进行互动,并使用它们执行过滤或更改输出等任务。这些互动是用户特定的。
如需在数据洞察中查看和分享应用,请按以下步骤操作:
如需在数据洞察中查看应用,请点击查看数据应用。
如需共享应用,请在数据洞察中点击 person_add 共享。
在与用户和群组共享页面上,执行以下操作:
在添加用户和群组字段中,输入您要授予访问权限的群组和个人。
为指定的用户和群组选择访问权限:
- 编辑者:用户可以修改应用,创建和修改日程安排及提醒,以及与他人分享应用。
- 查看者:用户可以查看应用,但无法修改或与他人分享。
点击发送。
如需邀请他人、获取报告链接或分享/下载应用,请点击分享选项旁边的arrow_drop_down,然后选择以下选项之一:
- 邀请他人
- 获取报告链接
- Download report
如需详细了解如何在数据洞察中共享资源,请参阅邀请他人访问您的报告。
重新连接和刷新数据应用
互动会话持续 30 分钟。30 分钟后,应用会失去与内核的连接,并变为静态。如需开始新的 30 分钟会话,您可以重新加载网页或刷新数据。
如需刷新数据,请执行以下操作:
在数据洞察中打开您的应用。在应用打开的情况下,点击查看数据应用。
在数据洞察中,依次点击 more_vert 更多报告操作 > 刷新数据。
用于在数据应用中运行单元格的凭据
默认情况下,数据应用使用应用创建者的凭据进行数据访问和呈现可视化图表。所有观看者都会看到根据作者的访问权限呈现的数据应用。在分享有权访问敏感数据的数据应用之前,请考虑这一点。
删除数据应用
您可以使用数据洞察删除数据应用。删除用于创建应用的笔记本不会删除应用,也不会阻止应用正常运行。
如需在数据洞察中删除数据应用,请按以下步骤操作:
在最近页面上,找到您的应用。
在该行末尾,依次点击 more_vert 更多选项 > 移除。
价格
您需要为在笔记本的运行时中运行代码付费,并为使用的任何 BigQuery 槽付费。如需了解详情,请参阅 Colab Enterprise 价格。