探索 Knowledge Catalog
Knowledge Catalog (舊稱 Dataplex Universal Catalog) 是 AI 輔助的資料治理解決方案,可為代理程式提供高品質的資料背景資訊,以生成內容為依據。本頁面提供實作用途範例,協助您開始使用 Knowledge Catalog。
建構及強化 AI 代理
建構代理程式來探索資料
使用探索代理程式對企業資料資產執行複雜的自然語言查詢,該代理程式會發出 Knowledge Catalog API 呼叫 (Python)。
建構代理程式來擴充中繼資料
使用會發出 Knowledge Catalog API 呼叫 (Python) 的擴充代理程式,大規模生成資料資產的 AI 輔助總覽。
使用 Gemini CLI 代理測試資料脈絡
使用自然語言查詢,透過連結至本機 MCP 伺服器的 Gemini CLI,驗證 Knowledge Catalog 能否區分來源資料和暫時衍生資料。
建立資料治理
奠定資料基礎
在 BigQuery 中設定「雜亂」的真實資料湖泊,套用嚴格的中繼資料標記 (層面),區分有效資料和雜訊,並使用 Gemini CLI 驗證是否符合規則。
設定基礎管理機制
使用 Google Cloud 控制台,將結構化、以結構定義為基礎的中繼資料 (切面) 和業務定義 (詞彙表) 附加至資料資產 (項目)。
建構受控 Iceberg 湖倉
建立 Apache Iceberg 資料表、強制執行集中式資料政策,確保資料欄層級安全、定義安全政策,以及查看自動化資料沿襲。
分析資料歷程
分析資料變更的影響
瞭解資料轉換對下游資源、資料完整性和工作流程的影響。
分析 PII 外洩的原因
追蹤機密資料的流動情形,找出將資料從信任位置移至不信任位置的程序。
最佳化儲存空間成本
找出未積極用做其他程序來源的資產,以降低儲存空間費用。
運用 AI 自動評估資料品質
自動執行資料品質掃描
透過 Gemini CLI,使用自然語言查詢來分析資料並產生品質規則,然後將資料品質規則部署為自動掃描。