尋找及探索資料

本頁說明如何透過 Visual Studio Code 適用的 Google Cloud Data Agent Kit 擴充功能,探索及瞭解資料實體。這項擴充功能提供多個資料搜尋入口點,包括目錄探索工具、搜尋功能和代理聊天。

事前準備

  1. 安裝擴充功能
  2. 調整設定。啟用所有 API,並設定專案和區域。
  3. 選用:如要在 VS Code 的 Data Agent Kit 擴充功能中與 MySQL 適用的 Cloud SQL、PostgreSQL 適用的 Cloud SQL 和 AlloyDB for PostgreSQL 資源互動,您必須設定這些資源,以便將中繼資料擷取至 Knowledge Catalog。詳情請參閱:

探索目錄

目錄檢視工具會以結構化檢視畫面,呈現資料實體。如要瀏覽目錄,請完成下列步驟:

  1. 在 IDE 活動列中,按一下「Google Cloud Data Agent Kit」圖示。
  2. 在 Google Cloud Data Agent Kit 選單中,展開「目錄」專區。瀏覽器會以樹狀結構顯示這些資料來源:
    • BigQuery 和 BigLake 中的資料實體,以及目前專案中的 AlloyDB、Cloud SQL 和 Spanner 實體。
    • BigQuery 公開資料集。
    • 您有權存取的機構其他專案。按一下「載入更多」,即可在檔案總管中查看。
  3. 如要瀏覽階層,請按一下節點展開。舉例來說,點選專案 ID 時,檔案總管會顯示依產品名稱整理的資料來源。
  4. 按一下產品名稱,即可探索該產品的資料實體,並繼續展開檢視檢視區塊和資料表。
  5. 按一下資料實體,即可在新編輯器分頁中查看詳細資料。
  6. 在資源名稱上按一下滑鼠右鍵,即可查看快速動作清單,例如「查詢」或「在 Spark DataFrame 中載入」

使用代理程式探索功能

如要使用自然語言尋找資料集,請使用服務專員的「對話」面板:

  1. 如果沒有顯示「Chat」面板,請按下 Cmd/Ctrl+Shift+P 開啟指令面板,然後搜尋並執行「Open Chat」
  2. 在「Chat」面板中輸入自然語言提示,例如「找出含有顧客訂單的資料集」。代理程式會顯示「思考中」狀態,同時搜尋相關資料表。
  3. 如果代理程式提示您執行 gcloud CLI 指令來協助搜尋,請按一下每個指令的「執行」
  4. 代理程式顯示專案中找到的相關資料集清單後,您可以在目錄或通用搜尋中搜尋及探索這些資料集。Google Cloud

從指令區塊或活動列啟動通用搜尋。

快速鍵

  1. 按下 Cmd/Ctrl+Shift+P 開啟指令面板。
  2. 搜尋並選取「Search for Dataset」(搜尋資料集)
  3. 在快速選取器中輸入搜尋查詢,然後按下 Enter 鍵,即可在新編輯器分頁中啟動通用搜尋。

活動列

  1. 在 IDE 活動列中,按一下「Google Cloud Data Agent Kit」圖示。
  2. 在 Google Cloud Data Agent Kit 選單中,展開「目錄」專區。
  3. 按一下「通用搜尋」。通用搜尋會在新編輯器分頁中開啟。
  4. 輸入搜尋查詢並按下 Enter 鍵,即可查看搜尋結果。

篩選

在全方位搜尋編輯器中,使用浮動的「篩選器」面板,依「範圍」、「系統」、「專案」、「類型」或「位置」縮小搜尋結果範圍。

查看詳細資料

識別資料實體後,即可在新編輯器分頁中查看詳細資料。

  • 在搜尋結果中點選實體,即可在新分頁中開啟詳細資料。
  • 在目錄探索器中,按一下資料集 (例如表格名稱),即可啟動詳細資料檢視畫面。

詳細資料分頁

詳細資料編輯器會以直向分頁的形式呈現,方便您瞭解資料的背景資訊和品質。

顯示的分頁取決於您查看的資料實體類型。舉例來說,BigQuery 資料集的詳細資料檢視畫面包含「詳細資料」和「關係」分頁,而 Spanner 資料表的詳細資料則包含「結構定義」和「詳細資料」分頁。

Tab

功能

預覽

查看資料集資料的樣本。

結構定義

查看資料集的結構定義資料欄名稱、中繼資料類型、說明和其他詳細資料。

詳細資料

查看資料實體的屬性。

Insights

存取 AI 生成的查詢範例,快速開始探索資料集。詳情請參閱「在 Knowledge Catalog 中存取資料洞察」。

血統

查看資料集來源和後代的視覺化地圖,以及套用的變更或轉換。詳情請參閱「關於資料歷程」。

關係

查看與資料集的關係圖,瞭解資料集與其他資料集的關係。

資料剖析檔

查看資料的統計摘要。詳情請參閱「建立及使用資料剖析掃描」。

資料品質

查看所選資料集的資料品質指標,例如完整性、獨特性或更新間隔。詳情請參閱「自動分析資料品質總覽」。

後續步驟