探索 Knowledge Catalog
Knowledge Catalog(以前称为 Dataplex Universal Catalog)是一种由 AI 提供支持的数据治理解决方案,可为代理提供高质量的数据上下文,以作为生成内容的依据。本页提供了实用的使用场景,可帮助您开始使用 Knowledge Catalog。
构建和赋能 AI 智能体
构建代理以发现数据
使用可进行 Knowledge Catalog API 调用的发现代理 (Python) 对企业数据资产运行复杂的自然语言查询。
构建用于丰富元数据的代理
使用可进行 Knowledge Catalog API 调用的富集代理 (Python),大规模为数据资产生成 AI 赋能的概览。
使用 Gemini CLI 代理测试数据上下文
验证 Knowledge Catalog 是否能够区分源数据和临时派生数据,方法是使用自然语言查询连接到本地 MCP 服务器的 Gemini CLI。
建立数据治理
构建数据基础
在 BigQuery 中设置一个真实且“杂乱”的数据湖,应用严格的元数据标记(方面)来区分有效数据和噪声,并使用 Gemini CLI 验证它是否遵循您的规则。
设置基础治理
使用 Google Cloud 控制台将结构化、基于架构的元数据(切面)和业务定义(术语库)附加到数据资产(条目)。
构建受治理的 Iceberg 湖仓一体架构
创建 Apache Iceberg 表、强制执行集中式数据政策以实现列级安全性、定义安全政策,以及直观呈现自动化数据沿袭。
分析数据沿袭
分析数据更改的影响
确定数据转换对下游资源、数据完整性和工作流程的影响。
分析 PII 泄露的原因
跟踪敏感数据从可信位置移动到不可信位置的过程。
优化存储费用
通过识别未被其他进程用作来源的资产来降低存储费用。
利用 AI 自动评估数据质量
自动执行数据质量扫描
通过 Gemini CLI,使用自然语言查询来分析数据并生成质量规则,然后将数据质量规则部署为自动扫描。