Knowledge Catalog を確認する

Knowledge Catalog(以前の Dataplex Universal Catalog)は、AI を活用したデータ ガバナンス ソリューションです。エージェントが生成されたコンテンツをグラウンディングするための高品質なデータ コンテキストを提供します。このページでは、Knowledge Catalog の使用を開始するうえで役立つ実践的なユースケースを紹介します。

AI エージェントを構築して強化する

Knowledge Catalog API 呼び出しを行う検出エージェント(Python)を使用して、エンタープライズ データアセットに対して複雑な自然言語クエリを実行します。
Knowledge Catalog API 呼び出しを行うエンリッチメント エージェント(Python)を使用して、データアセットの AI を活用した概要を大規模に生成します。
ローカル MCP サーバーに接続された Gemini CLI に自然言語クエリを使用して、Knowledge Catalog がソースデータと一時的な派生データを区別できることを確認します。

データ ガバナンスを確立する

BigQuery に現実的な「雑然とした」データレイクを設定し、厳格なメタデータタグ(アスペクト)を適用して有効なデータとノイズを区別し、Gemini CLI を使用してルールに従っていることを確認します。
Google Cloud コンソールを使用して、構造化されたスキーマ駆動型メタデータ(アスペクト)とビジネス定義(用語集)をデータアセット(エントリ)に関連付けます。
Apache Iceberg テーブルを作成し、列レベルのセキュリティに対して一元化されたデータポリシーを適用し、セキュリティ ポリシーを定義し、自動化されたデータ リネージを可視化します。

データリネージを分析する

データ変換がダウンストリーム リソース、データの完全性、ワークフローに与える影響を特定します。
センシティブ データの流れを、信頼できる場所から信頼できない場所に移動するプロセスまで追跡します。
他のプロセスのソースとしてアクティブに使用されていないアセットを特定して、ストレージ費用を削減します。

AI を使用してデータ品質を自動化する

Gemini CLI を使用して、自然言語クエリでデータをプロファイリングし、品質ルールを生成してから、データ品質ルールを自動スキャンとしてデプロイします。