查找和探索数据

本页面介绍了如何在适用于 Visual Studio Code 的 Google Cloud Data Agent Kit 扩展程序中发现数据实体并了解它们。该扩展程序提供了多个入口点来查找数据,包括目录探索器和搜索,以及智能体聊天。

准备工作

  1. 安装扩展程序
  2. 配置设置。启用所有 API 并配置项目和区域。
  3. 可选:如需在适用于 VS Code 的 Data Agent Kit 扩展程序中与 Cloud SQL for MySQL、Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 资源互动,您必须对其进行配置,以便将元数据提取到 Knowledge Catalog 中。如需了解详情,请参阅:

探索目录

目录探索器提供了数据实体的结构化视图。如需浏览目录,请完成以下步骤:

  1. 在 IDE 活动栏中,点击 Google Cloud Data Agent Kit 图标。
  2. 在 Google Cloud Data Agent Kit 菜单中,展开目录 部分。探索器会以树形结构显示以下数据源:
    • 当前项目中的 BigQuery 和 BigLake 中的数据实体,以及 AlloyDB、Cloud SQL 和 Spanner 实体。
    • BigQuery 公共数据集。
    • 您有权访问的组织中的其他项目。点击加载更多 即可在探索器中查看这些项目。
  3. 如需浏览层次结构,请点击一个节点以将其展开。例如,当您点击项目 ID 时,探索器会显示按商品名称整理的数据源。
  4. 点击商品名称,探索该产品的数据实体,然后继续展开即可查看视图和表。
  5. 点击数据实体,即可在新编辑器标签页中查看其详细信息。
  6. 右键点击资源名称,即可查看快捷操作列表,例如查询Load in Spark DataFrame

使用智能体发现功能

如需使用自然语言查找数据集,请使用智能体 Chat 面板:

  1. 如果聊天面板未显示,请按 Cmd/Ctrl+Shift+P打开命令面板,然后搜索并运行Open Chat
  2. 聊天 面板中,输入自然语言提示,例如“find the dataset that has customer orders”(查找包含客户订单的数据集)。 智能体在搜索相关表时会显示正在思考 状态。
  3. 如果智能体提示您运行 gcloud CLI 命令以帮助搜索,请点击每个命令的运行
  4. 智能体显示在您的 Google Cloud 项目中找到的相关数据集列表后,请在 目录或通用搜索中搜索并探索这些数据集。

从命令面板或活动栏启动通用搜索。

快捷键

  1. Cmd/Ctrl+Shift+P 打开命令面板。
  2. 搜索并选择 Search for Dataset
  3. 在快速选择器中输入搜索查询,然后按 Enter 键,即可在新编辑器标签页中启动通用搜索。

活动栏

  1. 在 IDE 活动栏中,点击 Google Cloud Data Agent Kit 图标。
  2. 在 Google Cloud Data Agent Kit 菜单中,展开目录 部分。
  3. 点击通用搜索 。通用搜索会在新的编辑器标签页中打开。
  4. 输入搜索查询,然后按 Enter 键以查看搜索结果。

过滤

在通用搜索编辑器中,使用浮动过滤条件面板 按范围系统项目类型位置缩小结果范围。

查看详情

识别数据实体后,即可在新编辑器标签页中查看其详细信息。

  • 在搜索结果中,点击某个实体即可在新标签页中打开其详细信息。
  • 在目录探索器中,点击数据集(例如表名称)即可启动其详细信息视图。

“详情”标签页

详细信息编辑器分为多个垂直标签页,可帮助您了解数据的上下文和质量。

显示的标签页取决于您查看的数据实体的类型。例如,BigQuery 数据集的详细信息视图包含详情关系 标签页,而 Spanner 表的详细信息包含架构详情 标签页。

标签页

功能

预览

查看数据集数据的示例。

架构

查看数据集架构的列名、元数据类型、说明和其他详细信息。

详情

查看数据实体的属性。

数据分析

访问 AI 生成的示例查询,帮助您快速开始探索数据集。如需了解详情,请参阅在 Knowledge Catalog 中访问数据分析

沿袭

查看数据集的来源和后代的直观地图,以及应用的变化或转换。如需了解详情,请参阅数据沿袭简介

关系

查看与数据集的关系图,了解其与其他数据集的关系。

数据分析

查看数据的统计摘要。如需了解详情,请参阅创建和使用数据分析扫描

数据质量

查看所选数据集的数据质量指标,例如完整性、唯一性或新鲜度。如需了解详情,请参阅自动数据质量概览

后续步骤