對話式數據分析總覽

在 BigQuery 中,您可以透過對話式數據分析功能,以自然語言與代理程式討論資料。如要取得資料相關問題的解答,請按照下列步驟操作:

  • 建立資料代理程式,自動為一組知識來源 (例如您選取的資料表、檢視區塊或使用者定義函式 (UDF)) 定義資料內容,並查詢處理指令。
  • 如有需要,您可以建立自訂表格和欄位中繼資料、提供資料解讀和查詢指示,或建立已驗證的查詢 (先前稱為黃金查詢),為資料代理程式設定情境和指示,以便有效回答特定用途的問題。

建議您先使用代理程式建立的內容和指令,再自訂代理程式。

以下列舉一些您提供給代理程式的背景資訊和指令:

  • 背景資訊。銷售分析資料代理程式可設定為瞭解「成效最佳者」是指收益最高的銷售代表,而不只是成交最多交易的銷售代表。
  • 操作說明。您可以指示資料代理人,在被問及「趨勢」時,一律篩選出最近一季的資料,或預設依「產品類別」將結果分組。

建立資料代理後,您就能與其對話,以自然語言詢問有關 BigQuery 資料的問題。您也可以與一或多個資料來源直接對話,回答基本的一次性問題。

對話式分析功能採用 Gemini for Google Cloud,並支援部分 BigQuery ML 函式。詳情請參閱「BigQuery ML 支援」一節。

瞭解 Gemini for Google Cloud 如何使用您的資料

資料代理

資料代理程式包含一或多個知識來源,以及一組特定用途的指令,用於處理該資料。建立資料代理時,您可以使用下列選項進行設定:

  • 使用資料代理程式搭配資料表、檢視區塊和 UDF 等知識來源
  • 提供自訂表格和欄位中繼資料,以最適合特定用途的方式說明資料。
  • 提供解讀及查詢資料的操作說明,例如定義下列項目:
    • 欄位名稱的同義字和業務用語
    • 篩選和分組作業最重要的欄位和預設值
  • 建立已驗證的查詢,供資料代理使用,藉此建立代理的回覆結構,並學習貴機構使用的商業邏輯。驗證過的查詢先前稱為「黃金查詢」。通過驗證的查詢可以使用支援的 BigQuery ML 函式

管理資料代理程式

您可以在 Google Cloud 控制台的「Agent Catalog」(代理程式目錄) 分頁中,建立、管理及使用下列類型的資料代理:

  • 每個 Google Cloud 專案都有預先定義的範例代理程式。
  • 草擬、建立及發布的代理清單。
  • 其他人建立並與您共用的代理程式清單。

詳情請參閱「建立資料代理程式」。

專案中支援資料代理程式的其他服務 (例如對話式數據分析 APILooker Studio Pro),可以存取您在 BigQuery 中建立的資料代理程式。您也可以使用 Conversational Analytics API 呼叫代理程式,存取在 Google Cloud 控制台中建立的代理程式。

對話

對話是指與資料代理程式或資料來源進行的持續性對話。您可以向資料代理程式提出多個問題,使用「銷售量」或「最受歡迎」等常見用語,不必指定資料表欄位名稱或定義篩選資料的條件。您也可以詢問 PDF 等物件中的資料。

傳回給你的對話回覆提供下列功能:

  • 以文字、程式碼或圖片 (多模態) 形式呈現問題的答案。答案可以包含支援的 BigQuery ML 函式。
  • 視需要生成圖表。
  • 服務專員對結果的推理。
  • 對話的中繼資料,例如使用的代理程式和資料來源。

直接與資料來源建立對話時,Conversational Analytics API 會解讀您的問題,但不會提供資料服務專員提供的背景資訊和處理指令。因此,直接對話結果可能較不準確。如果案件需要更高的準確度,請使用資料代理程式。

您可以使用Google Cloud 控制台,在 BigQuery 中建立及管理對話。詳情請參閱「透過對話分析資料」。

BigQuery ML 支援

在與資料代理和資料來源的對話中,以及您建立的已驗證 SQL 查詢中,對話式數據分析支援下列 BigQuery ML 函式。

如要使用支援的 AI.GENERATE 函式,您必須具備執行生成式 AI 查詢的必要權限

BigQuery ML 用途

如要啟用支援的 BigQuery ML 函式,請透過下列方式使用:

  • 建立代理程式並新增已驗證的查詢時 (例如您是準備定期報表的資料科學家),可以在已驗證的查詢中使用支援的 BigQuery ML 函式,說明預設值並自動產生報表。
  • 當您在對話中或使用關鍵字進行驗證查詢時,向代理程式詢問有關資料的高階問題,代理程式會產生 BigQuery ML SQL 來回應您的問題。

下表顯示可啟用 BigQuery ML 的單次提示範例:

用途 用法示範 公開資料集
預測 「預測下個月的行程數。」 bigquery-public-data.san_francisco_bikeshare.bikeshare_trips
異常偵測 「Find outliers in trips per day for 2018 using 2017 as a baseline.」(以 2017 年為基準,找出 2018 年每日行程的離群值)。 bigquery-public-data.san_francisco_bikeshare.bikeshare_trips
大型語言模型文字生成 「針對『運動』類別中的每篇文章,以 1 到 2 句話摘要說明內文欄。」 bigquery-public-data.bbc_news.fulltext

安全性

您可以使用對話式數據分析 API 身分與存取權管理角色和權限,管理 BigQuery 中對話式數據分析的存取權。如要瞭解特定作業所需的角色,請參閱資料代理程式必要角色對話必要角色

位置

對話式分析功能適用於全球,無法選擇要使用的區域。

定價

建立資料代理,以及與資料代理或資料來源對話時,系統會針對執行的查詢,按照 BigQuery 計算價格收費。在預先發布期間,建立及使用資料代理程式和對話不會產生額外費用。

最佳做法

使用對話式數據分析時,系統會自動執行查詢來回答問題。在下列情況下,您可能會產生預料之外的費用:

  • 如果表格很大
  • 如果查詢使用資料聯結
  • 如果查詢會大量呼叫 AI 函式

為避免發生這個問題,請在選取知識來源時考慮大小,並在對話時考慮使用聯結。

動態共用配額

Vertex AI 中的動態共用配額 (DSQ) 可管理 Gemini 模型的容量。與傳統配額不同,DSQ 可讓您存取大量共用資源,且模型輸送量沒有固定的專案限制。

延遲等效能可能會因整體系統負載而異。共用集區需求量較高時,您偶爾可能會遇到暫時性的 429 Resource Exhausted 錯誤。這些錯誤表示共用集區容量暫時受限,但並非表示專案已達到特定配額限制。如要查看容量,請稍後再重試要求。

後續步驟