向量搜尋 2.0 Google Cloud 是從頭開始設計的產品,可做為自我調整的全代管 AI 原生搜尋引擎。雖然 Google Cloud現有的向量搜尋功能是強大的近似近鄰 (ANN) 索引即服務系統,但向量搜尋 2.0 將這個概念發展為全面的儲存和擷取系統。您將處理「資料物件」的「集合」,而不是將索引做為主要資源來管理。
搜尋引擎架構提供可擴充的複製儲存引擎,因此 Vector Search 2.0 可做為 AI 應用程式的單一整合資料來源,無需輔助資料儲存空間。
這項新架構的主要優點包括:
開發人員友善:使用直覺式用戶端程式庫快速上手,只需編寫少量程式碼。系統會自動調整,以維持高效能,並將基礎架構抽象化,因此您不必設定 VM 或副本。
快速上手與評估:建立集合、新增資料,然後快速開始搜尋。
統一資料儲存:集中儲存、擷取及篩選文件,並依向量相似度和酬載資料排序。
強大功能:使用內建模型自動填入嵌入欄位、運用豐富的查詢功能探索資料、自備嵌入 (BYOE),以及快速建立索引來提升效能。
簡化定價:彈性定價功能提供兩種模式:適用於較小工作負載的用量計費模式,以及適用於調整後效能的資源計費模式。
Vector Search 2.0 延續了 Vector Search 1.0 的高效能和大規模擴充性,讓您輕鬆上手並擴大規模。
概念
開始之前,建議您先瞭解下列 Vector Search 2.0 概念:
集合:一組相關 JSON 物件的容器。這與關聯式資料庫中的資料表類似。您可以在單一資料庫中建立多個集合。
資料物件:儲存在集合中的個別 JSON 物件。
集合:結構定義:定義集合中資料物件的結構和限制。可設定為嚴格和寬鬆的結構定義驗證。
集合索引:可對集合中的資料物件執行有效率的近似近鄰 (ANN) 搜尋。一個集合可以有多個索引,例如資料物件中的每個向量欄位各有一個索引。
後續步驟
- 瞭解如何建立集合。