向量搜尋是功能強大的向量搜尋引擎,採用 Google 研究團隊開發的創新技術。向量搜尋採用 ScaNN 演算法,可協助您建構新一代搜尋和推薦系統,以及生成式 AI 應用程式。
您可運用與 Google 搜尋、YouTube 和 Google Play 等核心 Google 產品相同的研究和技術。這表示您可獲得可擴充性、可用性和效能,以處理龐大的資料集,並在全球範圍內以極快的速度提供結果。透過向量搜尋,您可以取得企業級解決方案,在自家應用程式中導入最先進的語意搜尋功能。
![]() |
![]() |
![]() |
![]() |
開始使用
Vector Search 互動式試用版: 查看即時試用版,瞭解向量搜尋技術的實際應用範例,搶先體驗 Vector Search。
Vector Search 快速入門:使用範例資料集建構、部署及查詢 Vector Search 索引,在 30 分鐘內試用 Vector Search。本教學課程涵蓋設定、資料準備、建立索引、部署、查詢和清除作業。
事前準備:選擇並訓練模型,然後準備資料,即可產生嵌入。然後選擇要部署查詢索引的公開或私有端點。
Vector Search 價格和 Pricing Calculator: Vector Search 價格包含用於代管已部署索引的虛擬機器費用,以及建構和更新索引的費用。 即使是最低的設定 (每月不到 $100 美元),也能為中等規模的用途提供高總處理量。如要預估每月費用,請按照下列步驟操作:
- 前往 Google Cloud 的 Pricing Calculator。
- 按一下「新增至估算值」。
- 搜尋 Vertex AI。
- 按一下「Vertex AI」按鈕。
- 從「服務類型」下拉式選單中選擇「Vertex AI Vector Search」。
- 沿用預設設定或自行設定。「費用詳細資料」面板會顯示每月預估費用。
說明文件
應用實例和網誌
向量搜尋技術正成為企業使用 AI 的核心中樞。 與 IT 系統中的關聯式資料庫類似,這項功能會根據相關性連結各種業務元素,例如文件、內容、產品、使用者、活動和其他實體。除了搜尋文件和圖片等傳統媒體,Vector Search 還能提供智慧建議、找出解決業務問題的方案,甚至將物聯網信號連結至監控快訊。這項多功能工具是不可或缺的利器,可協助您在 AI 輔助企業資料日益普及的環境中,掌握最新趨勢。
搜尋 / 資訊檢索 推薦系統 |
Vertex AI 向量搜尋如何協助解鎖高效能生成式 AI 應用程式: 向量搜尋可支援各種應用程式,包括電子商務、 RAG 系統和推薦引擎,以及聊天機器人、多模態搜尋等。混合型搜尋可進一步提升利基字詞的搜尋結果。 Bloomreach、eBay 和 Mercado Libre 等客戶採用 Vertex AI,就是看中這項服務的效能、擴充性和成本效益,並獲得搜尋速度更快、轉換次數增加等優勢。 eBay 使用 Vector Search 進行推薦: 重點說明 eBay 如何使用 Vector Search 進行推薦系統。這項技術可讓 eBay 在龐大的目錄中尋找類似產品,提升使用者體驗。 Mercari 運用 Google 的向量搜尋技術建立新的市集: 說明 Mercari 如何運用向量搜尋技術,改善新的市集平台。Vector Search 可為平台提供建議,協助使用者更有效率地找到相關產品。 Vertex AI Embeddings for Text:輕鬆為 LLM 建立基準: 著重於使用 Vertex AI Embeddings 為文字資料建立 LLM 基準。 向量搜尋可協助尋找相關的文字段落,確保模型回覆內容有事實根據。 什麼是多模態搜尋:「具備視覺功能的 LLM」如何改變企業: 討論多模態搜尋,也就是結合 LLM 與視覺理解。 本文說明向量搜尋如何處理及比較文字和圖片資料,提供更全面的搜尋體驗。 大規模啟用多模態搜尋:結合文字和圖片功能與 Vertex AI: 說明如何使用 Vertex AI 建構多模態搜尋引擎,並透過加權 Rank-Biased Reciprocal Rank 組合方法,結合文字和圖片搜尋功能。這樣不僅可改善使用者體驗,還能提供更相關的結果。 使用 TensorFlow Recommenders 和 Vector Search 擴充深度擷取功能: 說明如何使用 TensorFlow Recommenders 和 Vector Search 建構播放清單推薦系統,涵蓋深度擷取模型、訓練、部署和擴充。 |
生成式 AI:檢索 RAG 和代理程式 |
Vertex AI 和 Denodo 運用生成式 AI 解鎖企業資料: 展示 Vertex AI 與 Denodo 的整合功能,如何協助企業運用生成式 AI 從資料中取得洞察資訊。Vector Search 是在企業環境中有效存取及分析相關資料的關鍵。 無限自然和產業本質:這項「狂野」的展示說明瞭 AI 的各種可能性: 展示 AI 在不同產業的潛力。這項功能會運用 Vector Search,提供生成式推薦內容和多模態語意搜尋。 Infinite Fleurs:探索 AI 輔助的創意盛開: Google 的 Infinite Fleurs 是一項 AI 實驗,使用 Vector Search、 Gemini 和 Imagen 模型,根據使用者提示生成獨特的花束。這項技術展現了 AI 在各行各業激發創意方面的潛力。 Google Cloud 上的 LlamaIndex for RAG: 說明如何使用 LlamaIndex,透過大型語言模型輔助檢索增強生成 (RAG)。LlamaIndex 會運用 Vector Search 從知識庫擷取相關資訊,進而生成更準確且符合情境的回覆。 Vertex AI 上的 RAG 和基礎: 探討 Vertex AI 上的 RAG 和基礎技術。 向量搜尋有助於在檢索期間找出相關的基礎資訊,進而生成更準確可靠的內容。 LangChain 的向量搜尋: 提供使用 LangChain 向量搜尋的指南,協助您建構及部署文字資料的向量資料庫索引,包括問答和 PDF 處理。 |
商業智慧、資料分析、監控等 |
在 Vertex AI 中使用串流擷取功能啟用即時 AI: 探討向量搜尋中的串流更新,以及如何提供即時 AI 功能。這項技術可即時處理及分析傳入的資料串流。 |
相關資源
如要開始使用 Vector Search,請參閱下列資源:
筆記本和解決方案
![]() |
![]() |
Vertex AI Vector Search 快速入門: 簡要介紹 Vector Search。專為平台新手設計,可快速上手。 |
開始使用文字嵌入和向量搜尋: 介紹文字嵌入和向量搜尋。本文將說明這些技術的運作方式,以及如何運用這些技術提升搜尋結果品質。 |
![]() |
![]() |
結合語意和關鍵字搜尋:Vertex AI Vector Search 混合型搜尋教學課程: 提供如何使用 Vector Search 進行混合型搜尋的說明。 內容涵蓋設定及配置混合式搜尋系統的步驟。 |
Vertex AI RAG 引擎搭配 Vector Search: 瞭解如何搭配使用 Vertex AI RAG 引擎和 Vector Search。 本文將探討搭配使用這兩項技術的優點,並提供實際應用範例。 |
![]() |
![]() |
使用 Vertex AI 和 Vector Search 建構具備 RAG 功能的生成式 AI 應用程式基礎架構:詳細說明如何使用 Vector Search、Cloud Run 和 Cloud Storage 建構生成式 AI 應用程式和 RAG,涵蓋用途、設計選擇和重要考量。 |
實作雙塔式檢索,大規模生成候選項目: 提供參考架構,說明如何使用 Vertex AI 實作端對端雙塔式候選項目生成工作流程。 雙塔模型架構是一種強大的擷取技術,適用於個人化用途,因為這類架構會學習兩個不同實體之間的語意相似度,例如網路查詢和候選項目。 |
訓練
開始使用 Vector Search 和嵌入 Vector Search 可用來尋找相似或相關的項目。可用於推薦、搜尋、聊天機器人及文字分類。這個程序包括建立嵌入項目、將其上傳至 Google Cloud,以及建立索引以供查詢。本實驗室著重於使用 Vertex AI 建立文字嵌入,但嵌入可為其他資料類型生成。
向量搜尋和嵌入 本課程旨在介紹向量搜尋,並說明如何透過大型語言模型 (LLM) API 生成嵌入,運用這項服務建構搜尋應用程式。這堂課程涵蓋概念課程、實際示範與實作研究室。概念課程將說明向量搜尋和文字嵌入;實際示範則會演示如何透過 Vertex AI 建構向量搜尋。
瞭解及套用文字嵌入
Vertex AI Embeddings API 會產生文字嵌入,也就是用於識別相似項目等工作的文字數字表示法。
在本課程中,您將使用文字嵌入執行分類和語意搜尋等工作,並結合語意搜尋和 LLM,使用 Vertex AI 建構問答系統。
機器學習密集課程:嵌入 本課程會介紹字詞嵌入,並與稀疏表示法進行比較。 並探討取得嵌入的方法,以及靜態和內容比對嵌入的差異。
相關產品
Vertex AI Embeddings 提供 Embeddings API 的總覽。文字和多模態嵌入的使用案例,以及其他資源和相關 Google Cloud 服務的連結。
Vertex AI Search 排名 API 排名 API 會使用預先訓練的語言模型,根據文件與查詢的關聯性重新排名,並提供精確的分數。非常適合用來改善各種來源 (包括向量搜尋) 的搜尋結果。
Vertex AI 特徵儲存庫 可讓您使用 BigQuery 做為資料來源,管理及提供特徵資料。 這項功能會為線上服務佈建資源,做為中繼資料層,直接從 BigQuery 提供最新的特徵值。特徵儲存庫可讓您即時擷取向量儲存庫針對查詢傳回項目的特徵值。
Vertex AI Pipelines Vertex AI Pipelines 可透過機器學習管道調度管理機器學習工作流程,以無伺服器的方式自動化處理、監控及管理機器學習系統。您可以批次執行使用 Kubeflow Pipelines 或 TensorFlow Extended (TFX) 架構定義的機器學習管線。管道可建構自動化管道,產生嵌入內容、建立及更新 Vector Search 索引,並為正式版搜尋和推薦系統建立機器學習運作設定。
深入瞭解相關資源
運用 Vertex AI 嵌入和工作類型強化生成式 AI 應用實例 著重於使用 Vertex AI 嵌入和工作類型,改善生成式 AI 應用程式。向量搜尋可搭配工作類型嵌入項目,找出更多相關資訊,進而提升生成內容的脈絡和準確度。
TensorFlow Recommenders 用於建構推薦系統的開放原始碼程式庫。可簡化從準備資料到部署的流程,並支援彈性的模型建構作業。TFRS 提供教學課程和資源,可協助建立複雜的推薦模型。
TensorFlow Ranking TensorFlow Ranking 是一種開放原始碼程式庫,可用來建構可擴充的類神經機器學習演算排序 (LTR) 模型。這項工具支援各種損失函式和排名指標,適用於搜尋、推薦和其他領域。這個程式庫由 Google AI 積極開發。
隆重推出 ScaNN:高效率的向量相似度搜尋 Google 的 ScaNN 是一種高效率的向量相似度搜尋演算法,採用新穎技術,可提高搜尋最鄰近項目的準確度和速度。 這項技術的效能優於現有方法,且廣泛應用於需要語意搜尋的機器學習工作。Google 的研究工作涵蓋各種領域,包括基礎機器學習和 AI 對社會的影響。
SOAR:採用 ScaNN 的全新演算法,進一步提升向量搜尋速度 Google 的 SOAR 演算法導入受控的冗餘,可提升向量搜尋效率,讓您使用較小的索引進行更快速的搜尋。SOAR 會將向量指派給多個叢集,建立「備份」搜尋路徑,提升效能。
相關影片
Vector Search 是建構 AI 輔助應用程式的強大工具。 這部影片會介紹這項技術,並提供逐步指南,協助你開始使用。
向量搜尋可用於混合型搜尋,讓您結合向量搜尋的強大功能,以及傳統搜尋引擎的彈性和速度。這部影片會介紹混合型搜尋,並說明如何使用 Vector Search 進行混合型搜尋。
您已在使用向量搜尋!Here's How to Be an Expert
您知道嗎?您可能每天都在使用向量搜尋,只是未曾發覺。 無論是在社群媒體上尋找難以找到的產品,還是追蹤腦中揮之不去的歌曲,這些日常體驗背後都有 AI 魔法:向量搜尋。
DeepMind 團隊提供新的「工作類型」嵌入項目,可提升 RAG 搜尋品質
Google DeepMind 團隊開發了新的工作類型嵌入,可提升 RAG 系統的準確度和關聯性。觀看影片,瞭解 RAG 搜尋品質的常見挑戰,以及工作類型嵌入如何有效彌合問題與答案之間的語意差距,進而提升檢索效果和 RAG 效能。
向量搜尋術語
這份清單包含一些重要術語,您必須瞭解這些術語,才能使用向量搜尋:
向量:向量是浮點值清單,具有大小和方向。可用於表示任何類型的資料,例如數字、空間中的點和方向。
嵌入:嵌入是一種向量,用於表示資料,並從中捕捉語意。通常會使用機器學習技術建立嵌入,並經常用於自然語言處理 (NLP) 和其他機器學習應用程式。
密集嵌入:密集嵌入會使用大多包含非零值的陣列,呈現文字的語意。透過密集嵌入,系統可根據語意相似度傳回類似的搜尋結果。
稀疏嵌入:稀疏嵌入會使用高維度陣列表示文字語法,與密集嵌入相比,這類陣列包含的非零值非常少。稀疏嵌入通常用於關鍵字搜尋。
混合型搜尋:混合型搜尋會同時使用稠密和稀疏嵌入,因此您可以根據關鍵字搜尋和語意搜尋的組合進行搜尋。Vector Search 支援以密集嵌入、稀疏嵌入和混合型搜尋為基礎的搜尋。
索引:為相似度搜尋一起部署的向量集合。 向量可新增至索引或從索引中移除。相似度搜尋 查詢會發送至特定索引,並搜尋該索引中的向量。
基準真相:這個詞是指根據現實世界驗證機器學習的準確度,例如基準真相資料集。
喚回度:索引傳回的最鄰近項目中,實際為最鄰近項目的百分比。舉例來說,如果 20 個最近鄰的最近鄰查詢傳回 19 個基本事實最近鄰,則召回率為 19/20x100 = 95%。
限制:這項功能會使用布林值規則,將搜尋範圍限制在索引的子集中。「限制」也稱為「篩選」。使用向量搜尋時,您可以運用數值篩選和文字屬性篩選功能。