本页面介绍了如何在适用于 Visual Studio Code 的 Google Cloud Data Agent Kit 扩展程序中发现数据实体并了解它们。该扩展程序提供了多个入口点来查找数据,包括目录探索器和搜索,以及智能体聊天。
准备工作
- 安装扩展程序。
- 配置设置。启用所有 API 并配置项目和区域。
- 可选:如需在适用于 VS Code 的 Data Agent Kit 扩展程序中与 Cloud SQL for MySQL、Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 资源互动,您必须对其进行配置,以便将元数据提取到 Knowledge Catalog 中。如需了解详情,请参阅:
探索目录
目录探索器提供了数据实体的结构化视图。如需浏览目录,请完成以下步骤:
- 在 IDE 活动栏中,点击 Google Cloud Data Agent Kit 图标。
- 在 Google Cloud Data Agent Kit 菜单中,展开目录 部分。探索器会以树形结构显示以下数据源:
- 当前项目中的 BigQuery 和 BigLake 中的数据实体,以及 AlloyDB、Cloud SQL 和 Spanner 实体。
- BigQuery 公共数据集。
- 您有权访问的组织中的其他项目。点击加载更多 即可在探索器中查看这些项目。
- 如需浏览层次结构,请点击一个节点以将其展开。例如,当您点击项目 ID 时,探索器会显示按商品名称整理的数据源。
- 点击商品名称,探索该产品的数据实体,然后继续展开即可查看视图和表。
- 点击数据实体,即可在新编辑器标签页中查看其详细信息。
- 右键点击资源名称,即可查看快捷操作列表,例如查询 或 Load in Spark DataFrame 。
使用智能体发现功能
如需使用自然语言查找数据集,请使用智能体 Chat 面板:
- 如果聊天面板未显示,请按 Cmd/Ctrl+Shift+P打开命令面板,然后搜索并运行Open Chat。
- 在聊天 面板中,输入自然语言提示,例如“find the dataset that has customer orders”(查找包含客户订单的数据集)。 智能体在搜索相关表时会显示正在思考 状态。
- 如果智能体提示您运行 gcloud CLI 命令以帮助搜索,请点击每个命令的运行 。
- 智能体显示在您的 Google Cloud 项目中找到的相关数据集列表后,请在 目录或通用搜索中搜索并探索这些数据集。
使用通用搜索
从命令面板或活动栏启动通用搜索。
快捷键
- 按 Cmd/Ctrl+Shift+P 打开命令面板。
- 搜索并选择 Search for Dataset 。
- 在快速选择器中输入搜索查询,然后按 Enter 键,即可在新编辑器标签页中启动通用搜索。
活动栏
- 在 IDE 活动栏中,点击 Google Cloud Data Agent Kit 图标。
- 在 Google Cloud Data Agent Kit 菜单中,展开目录 部分。
- 点击通用搜索 。通用搜索会在新的编辑器标签页中打开。
- 输入搜索查询,然后按 Enter 键以查看搜索结果。
过滤
在通用搜索编辑器中,使用浮动过滤条件面板 按范围、系统、项目、类型或位置缩小结果范围。
查看详情
识别数据实体后,即可在新编辑器标签页中查看其详细信息。
- 在搜索结果中,点击某个实体即可在新标签页中打开其详细信息。
- 在目录探索器中,点击数据集(例如表名称)即可启动其详细信息视图。
“详情”标签页
详细信息编辑器分为多个垂直标签页,可帮助您了解数据的上下文和质量。
显示的标签页取决于您查看的数据实体的类型。例如,BigQuery 数据集的详细信息视图包含详情 和关系 标签页,而 Spanner 表的详细信息包含架构 和详情 标签页。
标签页 |
功能 |
预览 |
查看数据集数据的示例。 |
架构 |
查看数据集架构的列名、元数据类型、说明和其他详细信息。 |
详情 |
查看数据实体的属性。 |
数据分析 |
访问 AI 生成的示例查询,帮助您快速开始探索数据集。如需了解详情,请参阅在 Knowledge Catalog 中访问数据分析。 |
沿袭 |
查看数据集的来源和后代的直观地图,以及应用的变化或转换。如需了解详情,请参阅数据沿袭简介。 |
关系 |
查看与数据集的关系图,了解其与其他数据集的关系。 |
数据分析 |
查看数据的统计摘要。如需了解详情,请参阅创建和使用数据分析扫描。 |
数据质量 |
查看所选数据集的数据质量指标,例如完整性、唯一性或新鲜度。如需了解详情,请参阅自动数据质量概览。 |