以自然語言查詢 Lakehouse 資料表

BigQuery 中的對話式數據分析功能可讓您使用自然語言提示,查詢開放格式資料。這項功能會使用 Lakehouse for Apache Iceberg 中的 Lakehouse 執行階段目錄,自動將問題對應至基礎資料表結構定義,因此您不必手動編寫程式碼,即可產生及執行 SQL 查詢。

設定查詢時,您可以使用資料代理提供業務詞彙表和系統指令,提高準確度。

對話內容分析的運作方式

對話式分析會使用大型語言模型 (LLM) 解讀自然語言問題,並將問題對應至資料表的結構定義。程序如下:

  1. 結構定義探索:系統會從 Lakehouse 執行階段目錄擷取中繼資料,瞭解資料表結構、資料欄名稱和資料類型。
  2. 產生 SQL:LLM 會產生與 BigQuery 引擎和基礎資料格式相容的 SQL 查詢。
  3. 執行:BigQuery 會直接對 Google Cloud Lakehouse 中的開放格式資料執行產生的 SQL 查詢。
  4. 回應:結果會傳回對話式介面,通常還會附上摘要或視覺化內容。

如要進一步瞭解對話式數據分析,例如管理資料代理程式、定價或最佳做法,請參閱「對話式數據分析總覽」。

支援的格式

對話式分析功能會將自然語言問題轉換為 SQL 查詢。這個平台支援Lakehouse 執行階段目錄支援的開放資料表格式,例如 Apache Iceberg 資料表。

事前準備

如要查詢資料,請先在 Lakehouse 執行階段目錄中註冊外部資料表。Lakehouse 執行階段目錄是統一中樞,可將 BigQuery Studio 連結至外部開放格式資料。連結完成後,資料表就會成為 BigQuery 中的可探索資產。

使用對話式數據分析查詢資料表

  1. 前往 Google Cloud 控制台的「BigQuery Studio Agents Hub」

    前往「服務專員中心」

  2. 建立資料代理,或直接與現有資料代理對話。

  3. 選取資料表

    由於 Lakehouse 執行階段目錄會整合所有這些不同格式,因此探索體驗與尋找標準 BigQuery 資料表相同。

    1. 搜尋:新增知識來源時,請在表格搜尋和選取介面中,查閱表格名稱。你可以使用搜尋關鍵字篩選結果,包括:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. 驗證來源:請注意完整名稱中的資料集部分。由外部來源建立並由 Lakehouse 執行階段目錄管理的資料表,通常會遵循結合目錄和命名空間的格式。例如:PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_tablePROJECT_ID.sap_catalog.sales.delta_table

    3. 選取:將所選表格新增至目前對話內容。

  4. 以自然語言提問。系統會自動將提示翻譯為聯盟 SQL 查詢。

提高查詢準確度

如要協助對話式數據分析功能進一步瞭解結構定義和術語,請使用資料代理設定選項。包括商業詞彙表、通過驗證的 SQL 查詢和系統指令。

後續步驟