Knowledge Catalog でデータ関係を表示する

Knowledge Catalog(以前の Dataplex Universal Catalog)は、データアセット間の潜在的なリンクを検出し、関連データを検出して関係の性質を把握するのに役立ちます。

始める前に

データアセット間の関係を表示する前に、必要なロールが付与されていることを確認してください。

必要なロール

Knowledge Catalog でデータアセット間の関係を表示するために、Knowledge Catalog 固有の IAM ロールは必要ありません。 Knowledge Catalog は、アセットが存在するソースシステム(BigQuery など)に対する既存の権限を使用して、関係を表示できるかどうかを判断します。たとえば、BigQuery テーブルに関連する関係を表示するには、bigquery.tables.get 権限が必要です。

ソースシステムでアセットを表示する権限がない場合、そのアセットに関連する関係は Knowledge Catalog の関係グラフに表示されません。これにより、関係の可視性は、ソースシステムで確立されたセキュリティ境界と権限に準拠します。

データ関係について

データ関係は、データアセットがどのように接続されているかを示します。たとえば、顧客データを含むテーブルを見つけた場合、その関係から、注文やサポート チケットを一覧表示する関連テーブルを確認できます。また、関係は構造ガイドとして機能し、大規模言語モデルに不可欠なコンテキストを提供します。その結果、AI はより正確な回答を生成し、特定の情報を取得するための正確なクエリを作成します。

Knowledge Catalog は、データアセット間の一般的な関係を自動的に検出して保存します。関係データは、次のようなさまざまなソースから取得されます。

  • クエリ履歴を継続的に分析して、テーブル間の潜在的な JOIN パターンを検出する Knowledge Catalog の履歴クエリログ。
  • データ分析情報は、大規模言語 モデルを使用してスキーマ属性とデータの重複を分析することで、オンデマンドでデータ関係を提案します。

サポートされているデータアセット

BigQuery のテーブルとビューのデータ関係を表示できます。

データ関係を表示する

BigQuery のテーブルとビューのデータ関係を表示するには、 Google Cloud コンソールまたは Dataplex API を使用します。

Console

BigQuery でテーブルのデータ関係を表示する手順は次のとおりです。

  1. コンソールで、Knowledge Catalog の [検索] ページに移動します。 Google Cloud

    [検索] に移動

  2. 関係を表示する BigQuery テーブルを検索します。

  3. 検索結果で、表をクリックしてエントリページを開きます。

[関係] タブには、次の情報とともに関係が表示されます。

  • ターゲット: 接続されたデータアセットの名前。
  • 関係: アセットのリンクに使用される特定の列。
  • タイプ: リンクの性質。例: JOIN
  • 生成元: 関係の生成元。例: クエリ履歴。
  • アクション: アセット間のリンクを検出するために使用できるサンプルクエリ。

REST

検出された関係は、Knowledge Catalog の 2 つのデータアセット(エントリ)間の関係を確立する EntryLinks として Knowledge Catalog に保存されます。結合された列や関係ソースなど、関係の詳細情報は EntryLinks のアスペクトとして保存されます。

データ関係を表示するには、次の方法を使用します。

  • LookupEntryLinks は、特定のデータエントリを ソースまたはターゲットとして参照するすべてのEntryLinksを取得し、特定のエントリに関連付けられた関係の完全なセットを返します。

  • LookupContext は、コンテキスト メタデータを使用して AI エージェントをグラウンディングするための単一のエンドポイントを提供します。 関連するデータアセットなど、メタデータの簡潔な事前フォーマット済みパッケージを返します。

ロケーション

データ関係は、すべての BigQuery ロケーションで使用できます。

制限事項

  • クエリログからの関係の自動検出は、BigQuery のテーブルとビューでのみ使用できます。
  • Knowledge Catalog はクエリ履歴のサンプルを分析して関係を特定します。つまり、一部のクエリではリンクが検出されない可能性があります。
  • クエリの実行後、関係の検出に最大 48 時間かかることがあります。

次のステップ