探索 Knowledge Catalog

Knowledge Catalog(以前称为 Dataplex Universal Catalog)是一种由 AI 提供支持的数据治理解决方案,可为代理提供高质量的数据上下文,以作为生成内容的依据。本页提供了实用的使用场景,可帮助您开始使用 Knowledge Catalog。

构建和赋能 AI 智能体

使用可进行 Knowledge Catalog API 调用的发现代理 (Python) 对企业数据资产运行复杂的自然语言查询。
使用可进行 Knowledge Catalog API 调用的富集代理 (Python),大规模为数据资产生成 AI 赋能的概览。
验证 Knowledge Catalog 是否能够区分源数据和临时派生数据,方法是使用自然语言查询连接到本地 MCP 服务器的 Gemini CLI。

建立数据治理

在 BigQuery 中设置一个真实且“杂乱”的数据湖,应用严格的元数据标记(方面)来区分有效数据和噪声,并使用 Gemini CLI 验证它是否遵循您的规则。
使用 Google Cloud 控制台将结构化、基于架构的元数据(切面)和业务定义(术语库)附加到数据资产(条目)。
创建 Apache Iceberg 表、强制执行集中式数据政策以实现列级安全性、定义安全政策,以及直观呈现自动化数据沿袭。

分析数据沿袭

确定数据转换对下游资源、数据完整性和工作流程的影响。
跟踪敏感数据从可信位置移动到不可信位置的过程。
通过识别未被其他进程用作来源的资产来降低存储费用。

利用 AI 自动评估数据质量

通过 Gemini CLI,使用自然语言查询来分析数据并生成质量规则,然后将数据质量规则部署为自动扫描。