Knowledge Catalog は、データアセット間の潜在的なリンクを検出し、関連するデータを検出して、関係の性質を把握するのに役立ちます。
始める前に
データアセット間の関係を表示する前に、必要なロールが付与され、必要な API が有効になっていることを確認してください。
必要なロール
データアセット間の関係を表示するために必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼してください。
-
BigQuery テーブルとビューの関係を表示するには: BigQuery メタデータ閲覧者 (
roles/bigquery.metadataViewer)
ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。
必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
API を有効にする
データ関係を使用するには、プロジェクトで Dataplex API と BigQuery API を有効にします。
API を有効にするために必要なロール
API を有効にするには、serviceusage.services.enable 権限を含む Service Usage 管理者 IAM ロール(roles/serviceusage.serviceUsageAdmin)が必要です。詳しくは、ロールを付与する方法をご覧ください。
データのリレーションシップについて
データ関係は、データアセットの接続方法を示します。たとえば、顧客データを含むテーブルを見つけた場合、そのリレーションシップから、注文やサポート チケットを一覧表示する関連テーブルを特定できます。また、リレーションシップは構造ガイドとして機能し、大規模言語モデルに重要なコンテキストを提供します。その結果、AI はより正確な回答を生成し、特定の情報を取得するための正確なクエリを作成します。
Knowledge Catalog は、データアセット間の一般的な関係を自動的に検出して保存します。リレーションシップ データは、次のようなさまざまなソースから取得されます。
- 履歴クエリログ Knowledge Catalog。クエリ履歴を継続的に分析して、テーブル間の潜在的な
JOINパターンを検出します。 - データ分析情報は、大規模言語モデルを使用してスキーマ属性とデータの重複を分析し、データ関係をオンデマンドで提案します。
サポートされているデータアセット
BigQuery のテーブルとビューのデータ関係を表示できます。
データ関係を表示する
BigQuery テーブルとビューのデータ関係を表示するには、 Google Cloud コンソールまたは Knowledge Catalog API を使用します。
Console
BigQuery でテーブルのデータ関係を表示する手順は次のとおりです。
Google Cloud コンソールで、Knowledge Catalog の [検索] ページに移動します。
関係を表示する BigQuery テーブルを検索します。
検索結果で、表をクリックしてエントリページを開きます。
[関係] タブには、関係と次の情報が表示されます。
- ターゲット: 接続されたデータアセットの名前。
- 関係: アセットのリンクに使用される特定の列。
- タイプ: リンクの性質。例:
JOIN - Origin: 関係の送信元。たとえば、クエリ履歴などです。
- アクション: アセット間のリンクを見つけるために使用できるクエリの例。
REST
検出された関係は、Knowledge Catalog の 2 つのデータアセット(エントリ)間の関係を確立する EntryLinks として Knowledge Catalog に保存されます。結合された列や関係のソースなど、関係に関する詳細は EntryLinks のアスペクトとして保存されます。
データ関係を表示するには、次の方法を使用します。
LookupEntryLinksは、特定のデータ エントリをソースまたはターゲットとして参照するすべてのEntryLinksを取得し、指定されたエントリに関連付けられた関係の完全なセットを返します。LookupContextは、コンテキスト メタデータを使用して AI エージェントをグラウンディングするための単一のエンドポイントを提供します。関連するデータアセットを含む、簡潔で事前フォーマット済みのメタデータ パッケージを返します。
ロケーション
データ関係は、すべての BigQuery ロケーションで使用できます。
制限事項
- クエリログからの関係の自動検出は、BigQuery テーブルとビューでのみ使用できます。
- ナレッジ カタログは、クエリ履歴のサンプルを分析して関係を特定します。つまり、一部のクエリではリンクが見つからない可能性があります。
- クエリの実行後、関係の検出に最大 48 時間かかることがあります。