このページでは、Visual Studio Code 用の Google Cloud Data Agent Kit 拡張機能でデータエンティティを検出して、その詳細を確認する方法について説明します。この拡張機能には、カタログ エクスプローラと検索からエージェント チャットまで、データを検索するための複数のエントリ ポイントが用意されています。
始める前に
- 拡張機能をインストールします。
- 設定を構成します。すべての API を有効にして、プロジェクトとリージョンを構成します。
- 省略可: VS Code 用の Data Agent Kit 拡張機能で Cloud SQL for MySQL、Cloud SQL for PostgreSQL、AlloyDB for PostgreSQL リソースを操作するには、メタデータを Knowledge Catalog に取り込めるように構成する必要があります。詳細については、以下をご覧ください。
カタログを確認する
カタログ エクスプローラには、データエンティティの構造化されたビューが表示されます。カタログを操作するには、次の操作を行います。
- IDE のアクティビティ バーで、Google Cloud Data Agent Kit アイコンをクリックします。
- Google Cloud Data Agent Kit メニューで、[カタログ] セクションを開きます。エクスプローラには、次のデータソースがツリー構造で表示されます。
- 現在のプロジェクトの BigQuery、BigLake、AlloyDB、Cloud SQL、Spanner のデータエンティティ。
- BigQuery の一般公開データセット。
- アクセス権がある組織内の他のプロジェクト。[Load more] をクリックすると、エクスプローラに表示されます。
- 階層を移動するには、ノードをクリックして展開します。たとえば、プロジェクト ID をクリックすると、エクスプローラに商品名で整理されたデータソースが表示されます。
- 商品名をクリックして、その商品のデータエンティティを探索し、展開してビューとテーブルを表示します。
- データエンティティをクリックすると、新しいエディタタブに詳細が表示されます。
- リソース名を右クリックすると、[Query] や [Load in Spark DataFrame] などのクイック アクションのリストが表示されます。
エージェントによる検出を使用する
自然言語を使用してデータセットを検索するには、エージェントの [Chat] パネルを使用します。
- [Chat] パネルが表示されていない場合は、 Cmd/Ctrl+Shift+P を押してコマンド パレットを開き、「Open Chat」を検索して実行します。
- [Chat] パネルに、「find the dataset that has customer orders」などの自然言語プロンプトを入力します。 エージェントは、関連するテーブルを検索している間、[Thinking] 状態を表示します。
- 検索を支援するために gcloud CLI コマンドを実行するようにエージェントから求められたら、各コマンドの [Run] をクリックします。
- エージェントがプロジェクトで見つかった関連するデータセットのリストを表示したら、カタログまたはユニバーサル検索で検索して探索します。Google Cloud
ユニバーサル検索を使用する
コマンド パレットまたはアクティビティ バーからユニバーサル検索を開始します。
ショートカット
- Cmd/Ctrl+Shift+P を押してコマンド パレットを開きます。
- [Search for Dataset] を検索して選択します。
- クイック選択ツールに検索クエリを入力し、Enter キーを押して、新しいエディタタブでユニバーサル検索を起動します。
アクティビティ バー
- IDE のアクティビティ バーで、Google Cloud Data Agent Kit アイコンをクリックします。
- Google Cloud Data Agent Kit メニューで、[カタログ] セクションを開きます。
- [Universal Search] をクリックします。ユニバーサル検索が新しいエディタタブで開きます。
- 検索クエリを入力して Enter キーを押すと、検索結果が表示されます。
フィルタリング
ユニバーサル検索エディタで、フローティング [Filters] パネルを使用して [Scope]、[Systems]、[Project]、[Type]、[Location] で結果を絞り込みます。
詳細を表示
データエンティティが特定されたら、新しいエディタタブで詳細を表示します。
- 検索結果からエンティティをクリックすると、新しいタブで詳細が開きます。
- カタログ エクスプローラで、テーブル名などのデータセットをクリックすると、詳細ビューが表示されます。
[詳細] タブ
詳細エディタは縦型のタブに整理されており、データのコンテキストと品質を把握するのに役立ちます。
表示されるタブは、表示しているデータエンティティのタイプによって異なります。たとえば、BigQuery データセットの詳細ビューには [詳細] タブと [関係] タブが表示されますが、Spanner テーブルの詳細には [スキーマ] タブと [詳細] タブが表示されます。
Tab |
機能 |
プレビュー |
データセット データのサンプルを表示します。 |
スキーマ |
データセットのスキーマの列名、メタデータ型、説明などの詳細を表示します。 |
詳細 |
データエンティティのプロパティを表示します。 |
分析情報 |
データセットの探索をすぐに開始できる AI 生成のサンプルクエリにアクセスします。詳細については、Knowledge Catalog でデータ分析情報にアクセスするをご覧ください。 |
リネージ |
データセットのオリジンと派生元のビジュアル マップと、適用された変更または変換を表示します。詳細については、データ リネージについてをご覧ください。 |
関係 |
データセットとの関係のグラフを表示して、他のデータセットとの関連性を把握します。 |
データ プロファイル |
データの統計概要を表示します。詳細については、データ プロファイル スキャンを作成して使用するをご覧ください。 |
データ品質 |
選択したデータセットの完全性、一意性、鮮度などのデータ品質指標を表示します。詳細については、自動データ品質の概要をご覧ください。 |