BigQuery 中的 AI 簡介
BigQuery 提供多種 AI 功能,可讓您執行下列操作:
- 執行預測機器學習 (ML)。
- 對 Gemini 等大型語言模型 (LLM) 執行推論作業。
- 使用嵌入和向量搜尋建構應用程式。
- 使用內建代理程式輔助編碼。
- 建立資料管道。
- 使用代理程式工具存取 BigQuery 功能。
機器學習
有了 BigQuery ML,您就能訓練、評估及執行模型推論,以完成時間序列預測、異常偵測、分類、迴歸、分群、降維和建議等工作。
您可以透過Google Cloud 控制台、bq 指令列工具、REST API 或 Colab Enterprise 筆記本,使用 BigQuery ML 功能。 BigQuery ML 允許 SQL 從業人員使用現有 SQL 工具和技能來建構及評估模型,從而使機器學習更大眾化,並在資料融入機器學習技術,加快模型開發作業,不必移動資料。您可以使用 BigQuery ML 執行下列類型的機器學習工作:
- 使用 GoogleSQL 查詢建立及執行機器學習模型。
- 建立 Colab Enterprise 筆記本,執行機器學習工作流程。您可以在筆記本中交替使用 SQL 和 Python,並使用任何 AI 或 ML Python 程式庫進行開發。
- 透過可解釋 AI 瞭解預測機器學習模型的結果。
- 使用
TimesFM、ARIMA_PLUS和ARIMA_PLUS_XREG模型,對時間序列資料執行預測和異常偵測。 - 使用貢獻度分析,產生多維度資料中重要指標變化的洞察資料。
詳情請參閱「BigQuery 中的機器學習簡介」。
AI 函式
BigQuery 提供各種 SQL 函式,可用於 AI 工作,例如生成文字、分析文字或非結構化資料,以及翻譯。這些函式會存取 Gemini 和合作夥伴 LLM 模型 (可透過 Vertex AI、Cloud AI API 或內建 BigQuery 模型取得),以執行這些工作。
AI 函式分為以下幾類:
生成式 AI 功能。這些函式可協助您執行各種工作,例如生成內容、分析、摘要、擷取結構化資料、分類、生成嵌入內容,以及豐富資料。生成式 AI 函式分為兩種類型:
- 一般用途的 AI 函式可讓您完全掌控並清楚瞭解所選用的模型、提示和參數。
- 代管 AI 函式 提供簡化的語法,可執行篩選、評分和分類等例行工作。BigQuery 會為您選擇模型,並針對成本和品質進行最佳化。
特定工作專用函式。這些函式可協助您使用 Cloud AI API 執行下列工作:
詳情請參閱工作專屬解決方案總覽。
搜尋
BigQuery 提供各種搜尋函式和功能,協助您有效率地尋找特定資料,或探索資料之間的相似性,包括多模態資料。
文字搜尋。您可以使用
SEARCH函式,對非結構化文字或半結構化JSON資料執行權杖化搜尋。您可以建立搜尋索引來提升搜尋效能,讓 BigQuery 最佳化使用SEARCH函式的查詢,以及其他函式和運算子。詳情請參閱「搜尋已建立索引的資料」。生成嵌入內容。嵌入是高維度數值向量,代表文字或圖片等實體,通常由機器學習模型生成。您可以透過 Vertex AI 提供或託管的模型生成多模態嵌入,也可以使用在 BigQuery 中匯入及執行的模型。
向量搜尋。您可以使用
VECTOR_SEARCH函式搜尋嵌入,找出語意相似的項目。您可以透過AI.SEARCH函式 (預覽),在啟用自主嵌入生成功能的資料表上搜尋。您可以建立向量索引,運用近似最鄰近項目搜尋技術,提供更快速、更近似的結果,進而提升向量搜尋效能。向量搜尋的常見用途包括語意搜尋、推薦和檢索增強生成 (RAG)。詳情請參閱「向量搜尋簡介」。
輔助 AI 功能
BigQuery 的 AI 輔助功能 (統稱為 Gemini in BigQuery) 可協助您探索、準備、查詢資料,並以圖表呈現。
- 資料洞察。生成有關資料的自然語言問題,以及回答這些問題的 SQL 查詢。
- 準備資料。根據情境生成建議,協助您清理、轉換及充實資料。
- SQL 程式碼輔助。 生成、完成及說明 SQL 查詢。
- Python 程式碼輔助。 生成、完成及說明 Python 程式碼,包括 PySpark 和 BigQuery DataFrames。
- 資料畫布。使用自然語言查詢資料、以圖表呈現結果,以及提出後續問題。
- SQL 翻譯器。建立 Gemini 輔助的 SQL 轉譯規則,協助您將以不同方言編寫的查詢遷移至 GoogleSQL。
代理
代理是軟體工具,可運用 AI 代您完成工作。 您可以使用內建代理程式或建立自己的代理程式,協助處理、管理、分析及視覺化呈現資料:
使用資料科學代理,在 Colab Enterprise 筆記本中自動執行探索性資料分析、資料處理、機器學習工作,以及製作洞察資料的視覺化圖表。
使用資料工程代理程式建構、修改及管理資料管道,以便在 BigQuery 中載入及處理資料。您可以使用自然語言提示,從各種資料來源產生資料管道,或調整現有資料管道,以符合資料工程需求。
使用 Gemini CLI,透過自然語言提示在終端機中與 BigQuery 資料互動。
使用 MCP 工具箱將自己的 AI 工具連結至 BigQuery,並與資料互動。
後續步驟
- 如要進一步瞭解 ML,請參閱「BigQuery 中的 ML 簡介」。
- 如要進一步瞭解 SQL 中的生成式 AI 函式,請參閱生成式 AI 總覽。
- 如要進一步瞭解如何搜尋資料,請參閱「搜尋已建立索引的資料」和「向量搜尋簡介」。
- 如要進一步瞭解 AI 輔助功能,請參閱「Gemini in BigQuery」。
- 如要進一步瞭解如何搭配 BigQuery 使用代理程式,請參閱「搭配 MCP、Gemini CLI 和其他代理程式使用 BigQuery」。