データを検索して探索する

このページでは、Visual Studio Code 用の Google Cloud Data Agent Kit 拡張機能でデータエンティティを検出して、その詳細を確認する方法について説明します。この拡張機能には、カタログ エクスプローラと検索からエージェント チャットまで、データを検索するための複数のエントリ ポイントが用意されています。

始める前に

  1. 拡張機能をインストールします
  2. 設定を構成します。すべての API を有効にして、プロジェクトとリージョンを構成します。
  3. 省略可: VS Code 用の Data Agent Kit 拡張機能で Cloud SQL for MySQL、Cloud SQL for PostgreSQL、AlloyDB for PostgreSQL リソースを操作するには、メタデータを Knowledge Catalog に取り込めるように構成する必要があります。詳細については、以下をご覧ください。

カタログを確認する

カタログ エクスプローラには、データエンティティの構造化されたビューが表示されます。カタログを操作するには、次の操作を行います。

  1. IDE のアクティビティ バーで、Google Cloud Data Agent Kit アイコンをクリックします。
  2. Google Cloud Data Agent Kit メニューで、[カタログ] セクションを開きます。エクスプローラには、次のデータソースがツリー構造で表示されます。
    • 現在のプロジェクトの BigQuery、BigLake、AlloyDB、Cloud SQL、Spanner のデータエンティティ。
    • BigQuery の一般公開データセット。
    • アクセス権がある組織内の他のプロジェクト。[Load more] をクリックすると、エクスプローラに表示されます。
  3. 階層を移動するには、ノードをクリックして展開します。たとえば、プロジェクト ID をクリックすると、エクスプローラに商品名で整理されたデータソースが表示されます。
  4. 商品名をクリックして、その商品のデータエンティティを探索し、展開してビューとテーブルを表示します。
  5. データエンティティをクリックすると、新しいエディタタブに詳細が表示されます。
  6. リソース名を右クリックすると、[Query] や [Load in Spark DataFrame] などのクイック アクションのリストが表示されます。

エージェントによる検出を使用する

自然言語を使用してデータセットを検索するには、エージェントの [Chat] パネルを使用します。

  1. [Chat] パネルが表示されていない場合は、 Cmd/Ctrl+Shift+P を押してコマンド パレットを開き、「Open Chat」を検索して実行します。
  2. [Chat] パネルに、「find the dataset that has customer orders」などの自然言語プロンプトを入力します。 エージェントは、関連するテーブルを検索している間、[Thinking] 状態を表示します。
  3. 検索を支援するために gcloud CLI コマンドを実行するようにエージェントから求められたら、各コマンドの [Run] をクリックします。
  4. エージェントがプロジェクトで見つかった関連するデータセットのリストを表示したら、カタログまたはユニバーサル検索で検索して探索します。Google Cloud

コマンド パレットまたはアクティビティ バーからユニバーサル検索を開始します。

ショートカット

  1. Cmd/Ctrl+Shift+P を押してコマンド パレットを開きます。
  2. [Search for Dataset] を検索して選択します。
  3. クイック選択ツールに検索クエリを入力し、Enter キーを押して、新しいエディタタブでユニバーサル検索を起動します。

アクティビティ バー

  1. IDE のアクティビティ バーで、Google Cloud Data Agent Kit アイコンをクリックします。
  2. Google Cloud Data Agent Kit メニューで、[カタログ] セクションを開きます。
  3. [Universal Search] をクリックします。ユニバーサル検索が新しいエディタタブで開きます。
  4. 検索クエリを入力して Enter キーを押すと、検索結果が表示されます。

フィルタリング

ユニバーサル検索エディタで、フローティング [Filters] パネルを使用して [Scope]、[Systems]、[Project]、[Type]、[Location] で結果を絞り込みます。

詳細を表示

データエンティティが特定されたら、新しいエディタタブで詳細を表示します。

  • 検索結果からエンティティをクリックすると、新しいタブで詳細が開きます。
  • カタログ エクスプローラで、テーブル名などのデータセットをクリックすると、詳細ビューが表示されます。

[詳細] タブ

詳細エディタは縦型のタブに整理されており、データのコンテキストと品質を把握するのに役立ちます。

表示されるタブは、表示しているデータエンティティのタイプによって異なります。たとえば、BigQuery データセットの詳細ビューには [詳細] タブと [関係] タブが表示されますが、Spanner テーブルの詳細には [スキーマ] タブと [詳細] タブが表示されます。

Tab

機能

プレビュー

データセット データのサンプルを表示します。

スキーマ

データセットのスキーマの列名、メタデータ型、説明などの詳細を表示します。

詳細

データエンティティのプロパティを表示します。

分析情報

データセットの探索をすぐに開始できる AI 生成のサンプルクエリにアクセスします。詳細については、Knowledge Catalog でデータ分析情報にアクセスするをご覧ください。

リネージ

データセットのオリジンと派生元のビジュアル マップと、適用された変更または変換を表示します。詳細については、データ リネージについてをご覧ください。

関係

データセットとの関係のグラフを表示して、他のデータセットとの関連性を把握します。

データ プロファイル

データの統計概要を表示します。詳細については、データ プロファイル スキャンを作成して使用するをご覧ください。

データ品質

選択したデータセットの完全性、一意性、鮮度などのデータ品質指標を表示します。詳細については、自動データ品質の概要をご覧ください。

次のステップ