创建数据代理
本文档介绍了如何在 BigQuery 中创建、修改和删除数据代理。数据代理包含表元数据和特定于使用情形的查询处理指令,这些指令定义了回答用户有关您所选的一组表的问题的最佳方式。用户可以与数据代理进行对话,使用自然语言询问有关 BigQuery 数据的问题。
准备工作
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Gemini Data Analytics, and Gemini for Google Cloud API APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
所需的角色
如需使用数据代理,您必须拥有以下 Conversational Analytics API IAM 角色之一:
- 创建、修改、共享和删除项目中的所有数据代理:项目中的 Gemini Data Analytics Data Agent Owner (
roles/geminidataanalytics.dataAgentOwner)。 - 在项目中创建、修改、共享和删除您自己的数据代理:项目中的 Gemini Data Analytics Data Agent Creator (
roles/geminidataanalytics.dataAgentCreator)。拥有此角色的用户会自动获得其创建的数据代理的 Gemini Data Analytics Data Agent Owner 角色。 - 查看和修改项目中的所有数据代理:项目级层的 Gemini Data Analytics Data Agent Editor (
roles/geminidataanalytics.dataAgentEditor)。 - 查看项目中的所有数据代理:Gemini Data Analytics Data Agent Viewer (
roles/geminidataanalytics.dataAgentViewer)
此外,创建或修改数据代理的任何用户都必须拥有以下角色:
- 针对数据代理用作数据源的任何表的 BigQuery Data Viewer (
roles/bigquery.dataViewer)。 - 项目级 DataCatalog Search Admin (
roles/datacatalog.searchAdmin) 角色。 - 如果数据源表使用列级访问权限控制,则需要对相应政策标记具有 Fine-Grained Reader (
roles/datacatalog.categoryFineGrainedReader) 权限。如需了解详情,请参阅用于列级访问权限控制的角色。 - 如果数据源表使用行级访问权限控制,您必须被授予该表的角色级访问权限政策。如需了解详情,请参阅创建或更新行级访问权限政策。
- 如果数据源表使用数据遮盖,则需要在相应的数据政策中添加 Masked Reader (
roles/bigquerydatapolicy.maskedReader)。如需了解详情,请参阅用于查询屏蔽数据的角色。
生成数据分析
您可以选择为要用作数据源的任何表生成分析洞见。生成的分析洞见提供表元数据,数据代理可以使用这些元数据来帮助生成用户问题的回答。如需了解详情,请参阅为 BigQuery 表生成分析洞见。
如果您未提前生成分析洞见,那么在创建数据代理时,当您选择表作为数据源后,系统会自动生成分析洞见。
创建数据代理
请按照以下步骤创建数据代理:
前往 BigQuery 代理页面。
选择代理标签页。
点击新建代理 (New agent)。 系统会打开新代理页面。
在编辑器部分的代理名称字段中,为数据代理输入一个描述性名称。
在数据代理说明字段中,输入数据代理的说明。 良好的说明有助于用户了解何时应与此数据代理聊天。
在数据源部分,点击添加数据。系统会打开添加数据页面。
在近期部分中,选择要用作数据源的任何表。
可选:添加未在最近部分中列出的表:
- 在搜索部分中,在搜索表字段中输入表名称,然后按 Enter 键。表名称不必完全一致。
- 在搜索结果部分中,选择一个或多个表。
点击添加数据。 系统会重新打开新代理页面。
可选:为了提高数据代理的准确性,您可以提供额外的表元数据。此元数据仅供数据代理使用,不会影响源表。
- 在数据源部分中,点击表上的提高准确性。
- 创建表说明。您可以在表说明字段中输入说明,也可以接受 Gemini 给出的建议。
- 在字段部分,查看 Gemini 建议的字段说明。选择要接受的建议,然后点击接受建议。选择要拒绝的建议,然后点击拒绝建议。
点击字段旁边的 修改,手动修改任何字段说明。系统会打开修改字段窗格。
在说明字段中,输入字段说明。
点击更新。
点击更新。系统会重新打开新代理页面。
在指令部分中,在代理指令字段中输入数据代理的指令。数据代理会使用这些指令来了解用户问题的背景信息。例如,指令可能包含以下类型的信息:
- 关键字段:用于分析的最重要字段。
- 同义词:关键字段的替代术语。
- 排除的字段:数据代理应避免使用的字段。
- 过滤和分组:代理应用于对数据进行过滤和分组的字段。
- 联接关系:两个或更多个表之间的关联方式,以及用于联接这些表的列。
点击显示示例可查看指令示例。
可选:为数据代理创建黄金查询。数据代理使用黄金查询来调整所选数据源上的数据代理。 这有助于数据代理所用的模型了解贵组织所用的业务逻辑。
选择一个或多个 Gemini 建议的黄金查询:
- 在黄金查询部分,点击查看建议。系统会打开查看建议的黄金查询页面。
- 查看建议的黄金查询。选择适用于您的使用情形的任何选项。
- 点击添加。系统会重新打开新代理页面。
如果您想创建自己的黄金查询,请点击添加查询。 系统会打开添加黄金查询页面。
- 在问题字段中,输入黄金查询旨在回答的用户问题。
- 点击生成 SQL,让 Gemini 生成与您指定的用户问题对应的黄金查询。
- 您可以根据需要修改黄金查询。
- 点击运行,并验证查询是否返回了您预期的结果。
- 点击添加。系统会重新打开新代理页面。
根据需要重复上述步骤,以创建更多黄金查询。
可选:配置数据代理,使其在生成用户问题的回答时使用 Python 而不是 SQL。在设置部分中,点击高级分析切换开关。
如果您希望数据代理回答更复杂的问题(这些问题很难或无法通过 SQL 来解决,例如涉及预测、相关性和因果关系的问题),则应使用此选项。
可选:为数据代理处理的查询设置大小限制。 在设置部分中,在结算字节数上限字段中输入一个值。
在预览部分中,在提出问题字段中输入示例用户问题,然后按 Enter 键。检查数据代理的回答,验证其是否返回了您预期的数据。如果未显示,请在 Editor 操作中更改设置,以迭代数据代理配置,直到获得令人满意的回答。您可以继续测试和修改代理,以优化代理的结果。
点击保存。
如需继续迭代数据代理,请点击 返回,返回到代理窗格。
否则,请继续下一步。
点击发布以发布数据代理,并使其可在项目中供使用。您可以使用 BigQuery Studio 与数据代理进行对话,如果您有 Looker Studio 订阅,也可以使用 Looker Studio 与数据代理进行对话。您还可以使用 Conversational Analytics API 构建自己的界面,以便与数据代理对话。
在您的代理已发布对话框中,点击分享以与其他用户分享数据代理。
在共享权限窗格中,点击添加主账号。
在新的主账号字段中,输入一个或多个主账号。
点击选择角色下拉列表。
在角色列表中,选择以下角色之一:
- Gemini Data Analytics Data Agent User (
roles/geminidataanalytics.dataAgentUser):授予与数据代理对话的权限。 - Gemini Data Analytics Data Agent Editor (
roles/geminidataanalytics.dataAgentEditor):授予修改数据代理的权限。 - Gemini Data Analytics Data Agent Viewer (
roles/geminidataanalytics.dataAgentViewer):授予查看数据代理的权限。
- Gemini Data Analytics Data Agent User (
点击保存。
如需返回新代理页面,请点击关闭。
修改数据代理
如需修改数据代理,请按以下步骤操作:
前往 BigQuery 代理页面。
选择代理标签页。
找到要修改的数据代理的代理卡片。
点击代理卡片上的 打开操作 > 修改,即可在代理编辑器中打开数据代理。
根据需要修改数据代理配置。
点击保存以保存更改。
点击发布以发布更改。
点击 返回,返回到代理窗格。
共享数据代理
如需共享数据代理,请按照以下步骤操作:
前往 BigQuery 代理页面。
选择代理标签页。
找到要修改的数据代理的代理卡片。
点击代理卡片上的 打开操作 > 修改,即可在代理编辑器中打开数据代理。
点击共享,与其他用户共享数据代理。
在共享权限窗格中,点击添加主账号。
在新的主账号字段中,输入一个或多个主账号。
点击选择角色下拉列表。
在角色列表中,选择以下角色之一:
- Gemini Data Analytics Data Agent User (
roles/geminidataanalytics.dataAgentUser):授予与数据代理对话的权限。 - Gemini Data Analytics Data Agent Editor (
roles/geminidataanalytics.dataAgentEditor):授予修改数据代理的权限。 - Gemini Data Analytics Data Agent Viewer (
roles/geminidataanalytics.dataAgentViewer):授予查看数据代理的权限。
- Gemini Data Analytics Data Agent User (
点击保存。
如需返回代理编辑页面,请点击关闭。
点击 返回,返回到代理窗格。
删除数据智能体
如需删除数据代理,请按以下步骤操作:
前往 BigQuery 代理页面。
选择代理标签页。
在代理标签页的我的代理部分中,找到要删除的数据代理的代理卡片。
依次点击 打开操作 > 删除。
在删除代理?对话框中,点击删除。
位置
对话式分析在全球范围内运行,因此您无法选择要使用的区域。
后续步骤
- 详细了解 BigQuery 中的对话式分析。
- 详细了解 Conversational Analytics API。
- 通过对话分析数据。