查找和探索数据

本页面介绍了如何在 Antigravity 的 Google Cloud Data Agent Kit 扩展程序中发现数据实体并了解它们。该扩展程序提供多种入口点来查找数据,包括目录浏览器、搜索功能和智能聊天。

准备工作

  1. 安装扩展程序
  2. 配置设置。启用所有 API,并配置项目和区域。
  3. 可选:如需在 Antigravity 的 Data Agent Kit 扩展程序中与 Cloud SQL for MySQL、Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 资源进行交互,您必须配置这些资源,以便将元数据提取到 Knowledge Catalog 中。如需了解详情,请参阅:

探索目录

目录探索器提供数据实体的结构化视图。如需浏览目录,请完成以下步骤:

  1. 在 IDE 活动栏中,点击 Google Cloud Data Agent Kit 图标。
  2. 在 Google Cloud Data Agent Kit 菜单中,展开目录部分。探索器以树状结构显示这些数据源:
    • BigQuery 和 BigLake 中的数据实体,以及当前项目中的 AlloyDB、Cloud SQL 和 Spanner 实体。
    • BigQuery 公共数据集。
    • 您有权访问的组织中的其他项目。点击加载更多即可在探索器中查看这些数据。
  3. 如需浏览层次结构,请点击某个节点以将其展开。例如,当您点击项目 ID 时,探索器会显示按商品名称整理的数据源。
  4. 点击某个商品名称,即可探索该商品的数据实体,并继续展开即可查看视图和表。
  5. 点击某个数据实体,即可在新编辑器标签页中查看其详细信息。
  6. 右键点击资源名称,即可看到快捷操作列表,例如查询Load in Spark DataFrame

使用代理发现

如需使用自然语言查找数据集,请使用代理的 Chat 面板:

  1. 如果未显示“Chat”面板,请按 Cmd/Ctrl+Shift+P 打开命令选用区,然后搜索并运行打开聊天
  2. 聊天面板中,输入自然语言提示,例如“查找包含客户订单的数据集”。在搜索相关表格时,智能体会显示正在思考状态。
  3. 如果代理提示您运行 gcloud CLI 命令来帮助进行搜索,请为每个命令点击运行
  4. 代理显示Google Cloud 项目中的相关数据集列表后,您可以在目录或 Universal Search 中搜索并探索这些数据集。

从命令面板或活动栏发起通用搜索。

快捷键

  1. Cmd/Ctrl+Shift+P 打开命令选用区。
  2. 搜索并选择搜索数据集
  3. 在快速选择器中输入搜索查询,然后按 Enter 键,以在新编辑器标签页中启动通用搜索。

活动栏

  1. 在 IDE 活动栏中,点击 Google Cloud Data Agent Kit 图标。
  2. 在 Google Cloud 数据代理工具包菜单中,展开目录部分。
  3. 点击通用搜索。系统会在新的编辑器标签页中打开“通用搜索”。
  4. 输入搜索查询,然后按 Enter 键以查看搜索结果。

过滤

在通用搜索编辑器中,使用浮动的过滤条件面板按范围系统项目类型位置缩小搜索结果范围。

查看详情

确定数据实体后,在新编辑器标签页中查看其详细信息。

  • 在搜索结果中,点击某个实体即可在新标签页中打开该实体的详细信息。
  • 在目录浏览器中,点击数据集(例如表名称)以启动其详细信息视图。

“详情”标签页

详细信息编辑器分为多个竖向标签页,可帮助您了解数据的背景信息和质量。

显示的标签页取决于您查看的数据实体类型。例如,BigQuery 数据集的详情视图包含详情关系标签页,而 Spanner 表的详情包含架构详情标签页。

制表符

功能

预览

查看数据集数据的示例。

架构

查看数据集的架构的列名称、元数据类型、说明和其他详细信息。

详细信息

查看数据实体的属性。

数据分析

访问 AI 生成的示例查询,帮助您快速开始探索数据集。如需了解详情,请参阅在 Knowledge Catalog 中访问数据洞见

Lineage

查看数据集的来源和后代的直观地图,以及所应用的变化或转换。如需了解详情,请参阅数据沿袭简介

关系

查看与数据集的关系图,了解该数据集与其他数据集之间的关系。

数据分析

查看数据的统计摘要。如需了解详情,请参阅创建和使用数据分析扫描

数据质量

查看所选数据集的数据质量指标,例如完整性、唯一性或新鲜度。如需了解详情,请参阅自动数据质量概览

后续步骤