Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

嵌入和向量搜尋簡介

本文將簡要介紹 BigQuery 中的嵌入項目和向量搜尋。向量搜尋是一種使用嵌入項目比較相似物件的技術，用於支援 Google 搜尋、YouTube 和 Google Play 等 Google 產品。您可以運用向量搜尋大規模執行搜尋。搭配向量搜尋使用向量索引時，您可以運用反向檔案索引 (IVF) 和 ScaNN 演算法等基礎技術。

向量搜尋是以嵌入為基礎建構而成。嵌入是高維度數值向量，代表特定實體，例如一段文字或音訊檔案。機器學習 (ML) 模型會使用嵌入技術，將這類實體的語意編碼，方便推理及比較。舉例來說，在分群、分類和建議模型中，常見的作業是測量嵌入空間中向量之間的距離，找出語意上最相似的項目。

當您考量如何繪製不同項目時，就能以視覺化方式瞭解嵌入空間中的語意相似度和距離。舉例來說，貓、狗和獅子等字詞都代表動物類型，因此在這個空間中會因語意特徵相似而緊密相鄰。同樣地，「汽車」、「卡車」和較籠統的「車輛」等字詞會形成另一個叢集。如下圖所示：

語意相似的概念 (例如「貓」、「狗」和「獅子」，或是「車」、「卡車」和「車輛」) 在嵌入空間中會彼此靠近。

您會發現動物和車輛叢集相距甚遠。群組之間的間隔說明瞭以下原則：物件在嵌入空間中的距離越近，語意相似度就越高；距離越遠，語意相似度就越低。

用途

結合嵌入生成和向量搜尋，可實現許多有趣的使用案例。以下列舉幾個可能的應用實例：

檢索增強生成 (RAG)： 在 BigQuery 中，使用 Gemini 模型剖析文件、對內容執行向量搜尋，並生成自然語言問題的摘要答案。如需說明這個情境的筆記本，請參閱「使用 BigQuery DataFrames 建構向量搜尋應用程式」。
推薦替代產品或相符產品：根據顧客行為和產品相似度，推薦替代產品，提升電子商務應用程式的效能。
記錄檔分析：協助團隊主動分類記錄中的異常狀況，並加快調查速度。您也可以使用這項功能，為 LLM 擴充脈絡，進而改善威脅偵測、鑑識和疑難排解工作流程。如需說明這個情境的筆記本，請參閱「Log Anomaly Detection & Investigation with Text Embeddings + BigQuery Vector Search」。
分群和指定目標：精確區隔目標對象。舉例來說，連鎖醫院可以運用自然語言附註和結構化資料，將病患分群；行銷人則可根據查詢意圖指定廣告。如需說明這個情境的筆記本，請參閱「Create-Campaign-Customer-Segmentation」。
實體解析與重複資料刪除：清理及彙整資料。舉例來說，廣告公司可以重複使用個人識別資訊 (PII) 記錄，房地產公司則可找出相符的郵寄地址。

生成嵌入項目

以下各節說明 BigQuery 提供的函式，可協助您產生或使用嵌入內容。

生成單一嵌入

您可以搭配 Gemini Enterprise Agent Platform 嵌入模型使用 AI.EMBED 函式，為輸入內容產生單一嵌入。

AI.EMBED 函式支援下列輸入類型：

文字資料。
以 ObjectRef 值表示的圖片資料。

生成嵌入資料表

您可以使用 AI.GENERATE_EMBEDDING，為輸入資料表資料欄中的所有資料建立內嵌項目。對於所有支援的模式，AI.GENERATE_EMBEDDING 適用於標準資料表中的結構化資料。對於多模態內嵌模型，AI.GENERATE_EMBEDDING 也適用於標準資料表資料欄 (包含 ObjectRef 值) 或物件資料表中的視覺內容。

如果是遠端模型，所有推論都會在 Agent Platform 中進行。如果是其他模型類型，所有推論作業都會在 BigQuery 中進行。結果會儲存在 BigQuery 中。

請參閱下列主題，瞭解如何在 BigQuery ML 中產生嵌入內容：

使用 AI.GENERATE_EMBEDDING 函式生成文字、圖片或影片。
生成及搜尋多模態嵌入
執行語意搜尋和檢索增強生成

自主生成嵌入

您可以運用自主產生嵌入功能，簡化建立、維護及查詢嵌入的程序。BigQuery 會根據來源資料欄，在資料表上維護嵌入資料欄。當您在來源資料欄中新增或修改資料時，BigQuery 會使用 Agent Platform 嵌入模型，自動為該資料產生或更新嵌入資料欄。如果來源資料定期更新，且您希望 BigQuery 維護嵌入資料，這項功能就非常實用。

搜尋

可用的搜尋功能如下：

VECTOR_SEARCH：使用 SQL 執行向量搜尋。
AI.SEARCH (預覽)：搜尋與您提供的字串相近的結果。如果資料表已啟用自主嵌入生成功能，即可使用這項函式。
AI.SIMILARITY：比較兩個輸入內容，方法是計算兩者嵌入之間的餘弦相似度。如果您想執行少量的比較，且尚未預先計算任何嵌入內容，就很適合使用這項函式。如果效能至關重要，且您要處理大量嵌入內容，就應該使用 VECTOR_SEARCH。比較兩者的功能，選擇最適合您用途的函式。

您可以選擇使用 CREATE VECTOR INDEX 陳述式建立向量索引。使用向量索引時，VECTOR_SEARCH 和 AI.SEARCH 函式會採用近似最鄰近搜尋技術，提升向量搜尋效能，但會降低召回率，因此傳回的結果較為近似。如果沒有向量索引，這些函式會使用暴力搜尋來測量每筆記錄的距離。即使有向量索引，您也可以選擇使用暴力搜尋來取得確切結果。

定價

VECTOR_SEARCH 和 AI.SEARCH 函式以及 CREATE VECTOR INDEX 陳述式會採用 BigQuery 計算定價。

VECTOR_SEARCH 和 AI.SEARCH 函式：系統會根據以量計價或版本計價方式，收取相似性搜尋費用。
- 以量計價：系統會根據掃描的位元組數向您收費，包括基本資料表、索引和搜尋查詢。
- 版本價格：系統會根據預留版本中完成工作所需的運算單元數量向您收費。相似度計算的規模越大、越複雜，費用就越高。
  
  注意： 標準版不支援使用索引。
CREATE VECTOR INDEX聲明：只要索引資料表資料的總大小低於機構的限制，建立及重新整理向量索引所需的處理作業就不會產生費用。如要支援超出此限制的索引作業，您必須提供自己的預訂，以處理索引管理工作。

儲存空間也是嵌入和索引的考量因素。以嵌入和索引形式儲存的位元組數量，須支付動態儲存費用。

向量索引處於有效狀態時會產生儲存空間費用。
您可以使用 INFORMATION_SCHEMA.VECTOR_INDEXES 檢視畫面，查看索引儲存空間大小。如果向量索引的涵蓋範圍尚未達到 100%，系統仍會針對已編入索引的內容收費。您可以使用 INFORMATION_SCHEMA.VECTOR_INDEXES 檢視畫面查看索引涵蓋範圍。

配額與限制

詳情請參閱「向量索引限制」和「生成式 AI 函式限制」。

限制

含有 VECTOR_SEARCH 或 AI.SEARCH 函式的查詢不會透過 BigQuery BI Engine 加速。

後續步驟

進一步瞭解如何建立向量索引。
瞭解如何使用 VECTOR_SEARCH 函式執行向量搜尋。
瞭解如何使用 AI.SEARCH 函式執行語意搜尋。
進一步瞭解自主產生嵌入內容。
請參閱使用向量搜尋功能搜尋嵌入教學課程，瞭解如何建立向量索引，然後使用索引和不使用索引，對嵌入執行向量搜尋。
請試用「執行語意搜尋和檢索增強生成」教學課程，瞭解如何執行下列工作：
- 生成文字嵌入。
- 在嵌入上建立向量索引。
- 使用嵌入執行向量搜尋，尋找相似文字。
- 使用向量搜尋結果增強提示輸入內容，執行檢索增強生成 (RAG) 作業，提升結果品質。
請試用「在檢索增強生成管道中剖析 PDF」教學課程，瞭解如何根據剖析的 PDF 內容建立 RAG 管道。
您也可以在 Python 中使用 BigQuery DataFrames 執行向量搜尋。如需說明此方法的筆記本，請參閱「使用 BigQuery DataFrames 建構向量搜尋應用程式」。