本指南說明如何使用 BigQuery 中的對話式數據分析,透過自然語言提示查詢 BigLake 資料表中的資料。運用Google CloudBigLake,您就能與 BigLake 中的自有資料互動,就像使用標準 BigQuery 資料表一樣。
對話內容分析的運作方式
對話式分析功能會使用大型語言模型 (LLM) 解讀自然語言問題,並將問題對應至 BigLake 資料表的結構定義。流程如下:
- 結構定義探索:系統會從 BigLake 中繼存放區擷取中繼資料,瞭解資料表結構、資料欄名稱和資料類型。
- 產生 SQL:LLM 會產生與 BigQuery 引擎和基礎資料格式相容的 SQL 查詢。
- 執行:BigQuery 會直接對 BigLake 中的開放格式資料執行產生的 SQL 查詢。
- 回應:結果會傳回對話介面,通常還會附上摘要或視覺化內容。
如要進一步瞭解對話式數據分析,例如管理資料代理程式、定價或最佳做法,請參閱「對話式數據分析總覽」。
支援的格式
對話式數據分析功能會將自然語言問題轉換為 SQL 查詢。這個平台支援BigLake metastore 支援的開放資料表格式,例如 Apache Iceberg 資料表。
事前準備
如要查詢資料,請先在 BigLake 中繼資料存放區註冊外部資料表。BigLake metastore 是統一中樞,可將 BigQuery Studio 連結至外部開放格式資料。連結完成後,資料表就會成為 BigQuery 中的可探索資產。
使用對話式數據分析查詢資料表
前往 Google Cloud 控制台的「BigQuery Studio Agents Hub」。
建立資料代理程式,或直接與現有的資料代理程式對話。
選取 BigLake 資料表。
由於 BigLake Metastore 會整合所有這些不同格式,因此探索體驗與尋找標準 BigQuery 資料表相同。
搜尋:新增知識來源時,請在表格搜尋和選取介面中,查閱表格名稱。你可以使用搜尋關鍵字篩選結果,包括:
TABLE_NAMEcatalog: CATALOG_NAMEproject: PROJECT_IDnamespace: NAMESPACE_NAME
驗證來源:請注意完整名稱中的資料集部分。由外部來源建立並由 BigLake metastore 管理的 BigLake 資料表,通常會遵循結合目錄和命名空間的格式。例如:
PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table或PROJECT_ID.sap_catalog.sales.delta_table。選取:將所選 BigLake 資料表新增至有效對話內容。
以自然語言提問。系統會自動將提示翻譯為聯盟 SQL 查詢。
提高查詢準確度
如要協助對話式數據分析功能進一步瞭解 BigLake 結構定義和術語,請使用資料代理設定選項。這些選項包括商業詞彙表、已驗證的 SQL 查詢和系統指令。
後續步驟
- 進一步瞭解 BigQuery 中的對話式數據分析。
- 瞭解如何在 BigLake metastore 中註冊外部資料表。
- 進一步瞭解資料代理程式。