對話式數據分析總覽
在 BigQuery 中,您可以透過對話式數據分析功能,以自然語言與代理程式討論資料。如要取得資料相關問題的解答,請按照下列步驟操作:
- 建立資料代理程式,自動為一組知識來源 (例如您選取的資料表、檢視區塊或使用者定義函式 (UDF)) 定義資料內容,並查詢處理指令。
- 如有需要,您可以建立自訂表格和欄位中繼資料、提供資料解讀和查詢指示,或建立已驗證的查詢 (先前稱為黃金查詢),為資料代理程式設定情境和指示,以便有效回答特定用途的問題。
建議您先使用代理程式建立的內容和指令,再自訂代理程式。
以下列舉一些您提供給代理程式的背景資訊和指令:
- 背景資訊。銷售分析資料代理程式可設定為瞭解「成效最佳者」是指收益最高的銷售代表,而不只是成交最多交易的銷售代表。
- 操作說明。您可以指示資料代理人,在被問及「趨勢」時,一律篩選出最近一季的資料,或預設依「產品類別」將結果分組。
建立資料代理後,您就能與其對話,以自然語言詢問有關 BigQuery 資料的問題。您也可以與一或多個資料來源直接對話,回答基本的一次性問題。
對話式分析功能採用 Gemini for Google Cloud,並支援部分 BigQuery ML 函式。詳情請參閱「BigQuery ML 支援」一節。
瞭解 Gemini for Google Cloud 如何使用您的資料。
資料代理
資料代理程式包含一或多個知識來源,以及一組特定用途的指令,用於處理該資料。建立資料代理時,您可以使用下列選項進行設定:
- 使用資料代理程式搭配資料表、檢視區塊和 UDF 等知識來源。
- 提供自訂表格和欄位中繼資料,以最適合特定用途的方式說明資料。
- 提供解讀及查詢資料的操作說明,例如定義下列項目:
- 欄位名稱的同義字和業務用語
- 篩選和分組作業最重要的欄位和預設值
- 建立已驗證的查詢,供資料代理使用,藉此建立代理的回覆結構,並學習貴機構使用的商業邏輯。驗證過的查詢先前稱為「黃金查詢」。通過驗證的查詢可以使用支援的 BigQuery ML 函式。
管理資料代理程式
您可以在 Google Cloud 控制台的「Agent Catalog」(代理程式目錄) 分頁中,建立、管理及使用下列類型的資料代理:
- 每個 Google Cloud 專案都有預先定義的範例代理程式。
- 草擬、建立及發布的代理清單。
- 其他人建立並與您共用的代理程式清單。
詳情請參閱「建立資料代理程式」。
專案中支援資料代理程式的其他服務 (例如對話式數據分析 API 和 Looker Studio Pro),可以存取您在 BigQuery 中建立的資料代理程式。您也可以使用 Conversational Analytics API 呼叫代理程式,存取在 Google Cloud 控制台中建立的代理程式。
對話
對話是指與資料代理程式或資料來源進行的持續性對話。您可以向資料代理程式提出多個問題,使用「銷售量」或「最受歡迎」等常見用語,不必指定資料表欄位名稱或定義篩選資料的條件。您也可以詢問 PDF 等物件中的資料。
傳回給你的對話回覆提供下列功能:
- 以文字、程式碼或圖片 (多模態) 形式呈現問題的答案。答案可以包含支援的 BigQuery ML 函式。
- 視需要生成圖表。
- 服務專員對結果的推理。
- 對話的中繼資料,例如使用的代理程式和資料來源。
直接與資料來源建立對話時,Conversational Analytics API 會解讀您的問題,但不會提供資料服務專員提供的背景資訊和處理指令。因此,直接對話結果可能較不準確。如果案件需要更高的準確度,請使用資料代理程式。
您可以使用Google Cloud 控制台,在 BigQuery 中建立及管理對話。詳情請參閱「透過對話分析資料」。
BigQuery ML 支援
在與資料代理和資料來源的對話中,以及您建立的已驗證 SQL 查詢中,對話式數據分析支援下列 BigQuery ML 函式。
AI_FORECASTAI.DETECT_ANOMALIESAI_GENERATE,包括AI.GENERATE_BOOL、AI.GENERATE_INT和AI.GENERATE_DOUBLE
如要使用支援的 AI.GENERATE 函式,您必須具備執行生成式 AI 查詢的必要權限。
BigQuery ML 用途
如要啟用支援的 BigQuery ML 函式,請透過下列方式使用:
- 建立代理程式並新增已驗證的查詢時 (例如您是準備定期報表的資料科學家),可以在已驗證的查詢中使用支援的 BigQuery ML 函式,說明預設值並自動產生報表。
- 當您在對話中或使用關鍵字進行驗證查詢時,向代理程式詢問有關資料的高階問題,代理程式會產生 BigQuery ML SQL 來回應您的問題。
下表顯示可啟用 BigQuery ML 的單次提示範例:
| 用途 | 用法示範 | 公開資料集 |
|---|---|---|
| 預測 | 「預測下個月的行程數。」 | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| 異常偵測 | 「Find outliers in trips per day for 2018 using 2017 as a baseline.」(以 2017 年為基準,找出 2018 年每日行程的離群值)。 | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| 大型語言模型文字生成 | 「針對『運動』類別中的每篇文章,以 1 到 2 句話摘要說明內文欄。」 | bigquery-public-data.bbc_news.fulltext |
安全性
您可以使用對話式數據分析 API 身分與存取權管理角色和權限,管理 BigQuery 中對話式數據分析的存取權。如要瞭解特定作業所需的角色,請參閱資料代理程式必要角色和對話必要角色。
位置
對話式分析功能適用於全球,無法選擇要使用的區域。
定價
建立資料代理,以及與資料代理或資料來源對話時,系統會針對執行的查詢,按照 BigQuery 計算價格收費。在預先發布期間,建立及使用資料代理程式和對話不會產生額外費用。
最佳做法
使用對話式數據分析時,系統會自動執行查詢來回答問題。在下列情況下,您可能會產生預料之外的費用:
- 如果表格很大
- 如果查詢使用資料聯結
- 如果查詢會大量呼叫 AI 函式
為避免發生這個問題,請在選取知識來源時考慮大小,並在對話時考慮使用聯結。
動態共用配額
Vertex AI 中的動態共用配額 (DSQ) 可管理 Gemini 模型的容量。與傳統配額不同,DSQ 可讓您存取大量共用資源,且模型輸送量沒有固定的專案限制。
延遲等效能可能會因整體系統負載而異。共用集區需求量較高時,您偶爾可能會遇到暫時性的 429 Resource Exhausted 錯誤。這些錯誤表示共用集區容量暫時受限,但並非表示專案已達到特定配額限制。如要查看容量,請稍後再重試要求。
後續步驟
- 進一步瞭解對話式數據分析 API。
- 建立資料代理程式。
- 透過對話分析資料。