Knowledge Catalog (舊稱 Dataplex Universal Catalog) 是智慧型資料治理解決方案,可協助您大規模整合及管理分散式資料,同時降低營運間接費用。Knowledge Catalog 運用 AI 技術自動探索資料、編目、檢查品質及追蹤歷程,協助您為分析和 AI 工作負載建立可靠的資料基礎。這種統一的管理方式可協助貴機構降低資料管理成本、提升資料品質和信任度,並加快取得洞察資訊的速度,進而做出更明智的業務決策。
用途
知識目錄可解決常見的資料問題,例如資料孤島、資料品質不一致,或難以找到適合分析的資料。舉例來說,零售公司可以使用 Knowledge Catalog,將來自 Cloud Storage、Spanner 和 Pub/Sub 的顧客資料整合到單一目錄。行銷和銷售團隊可藉此發掘並信任顧客資料,進而建構個人化廣告活動和預測銷售業績。
再舉一例,金融機構可以使用 Knowledge Catalog 執行資料品質規則,並追蹤依法呈報的沿襲,降低法規遵循風險。或者,醫療服務提供者可以使用知識目錄,為研究人員建立受監管的資料共用環境,同時保護病患隱私。
Knowledge Catalog 的運作方式
Knowledge Catalog 會連結至Google Cloud的資料來源,例如 BigQuery、Cloud Storage、Pub/Sub、Spanner 等。這項功能會自動從這些來源收集技術中繼資料,並加入資料剖析統計資料、資料品質分數和歷程資訊。您也可以整合第三方來源的中繼資料,並使用組織詞彙,為所有中繼資料加入業務脈絡。
知識目錄會運用 AI 技術,支援資料洞察中的自然語言資料探索,以及自動化資料品質檢查等功能。所有中繼資料都可透過集中式目錄存取,方便您在整個機構中探索、管理及控管資料。您也可以透過 BigQuery 使用治理功能。
開始使用 Knowledge Catalog
如果這是您第一次使用 Knowledge Catalog,建議您按照快速入門指南操作:
後續步驟
- 瞭解資料治理。
- 瞭解如何在 Knowledge Catalog 中管理中繼資料。
- 瞭解如何搜尋資料資產。
- 瞭解如何管理項目及擷取自訂來源。
- 瞭解如何將中繼資料匯入 Knowledge Catalog。
- 瞭解 BigQuery 控管。
- 請按照程式碼研究室:運用 Knowledge Catalog 中繼資料建立資料基礎的步驟操作。