AlloyDB AI 是 AlloyDB for PostgreSQL 的進階擴充功能,可直接在企業級關聯式資料庫中整合高效能向量處理作業。開發人員可運用這項服務建構精密的智慧型應用程式,瞭解結構化和非結構化格式資料的語意。AlloyDB AI 整合 SQL 功能和先進的向量搜尋技術,提供單一 AI 就緒平台,可供資料管理和檢索增強生成 (RAG) 工作流程使用,不必另外部署及管理向量資料庫。
核心架構與效能
AlloyDB 使用 PostgreSQL 的 pgvector 擴充功能提供向量功能。這項擴充功能支援熱門的 HNSW 索引,以及可擴充的近鄰 (ScaNN) 索引。ScaNN 索引是 Google 搜尋研究多年來的心血結晶,也是最先進的向量搜尋演算法。這項功能與 PostgreSQL 環境深度整合,可執行與 pgvector 相容的高速作業,以及進階語意查詢。
ScaNN 索引效能
與標準 PostgreSQL HNSW (階層式可導覽小世界) 索引相比,ScaNN 索引的速度大幅提升,可為嚴苛的 AI 工作負載提供必要的快速向量運算:
| 作業 | 效能提升 (相較於標準 PostgreSQL HNSW 索引) | 功能 |
|---|---|---|
| 建立索引 | 速度提升最高可達 10 倍 | 平行建立索引 |
| 向量搜尋查詢 | 速度提升最高 4 倍 | 索引自動維護 |
| 經過篩選的向量搜尋查詢 | 速度提升最高可達 10 倍 | 企業級可觀測性 |
自動調整篩選條件和查詢最佳化
ScaNN 索引與 PostgreSQL 查詢規劃工具深度整合,可確保混合查詢 (包括向量相似度和標準結構化中繼資料篩選器) 達到最佳效能。
- 自動調適篩選:這個機制可確保篩選器、連結和向量索引同時使用時,能發揮最佳成效。這項功能會在執行階段觀察查詢執行統計資料、瞭解篩選器的選擇性,並適應性地調整執行計畫,以決定篩選器應用程式和向量搜尋的最有效排序。
- 內嵌篩選:內嵌篩選是 ScaNN 演算法專用的最佳化策略,可同時執行向量搜尋和中繼資料篩選評估。這項功能會運用 PostgreSQL 次要索引 (例如 B-tree、GIN 或 GiST),建立符合篩選條件的資料列候選清單 (點陣圖)。後續的向量掃描只會計算預先篩選集中所含向量的距離,大幅減少運算負荷,尤其是在篩選條件具有適度選擇性的情況下。
與 Vertex AI 完美整合
AlloyDB AI 專為內建整合 Vertex AI 生態系統而設計,可直接在資料庫中使用 SQL 轉換及擴充資料。
自動生成嵌入內容
平台支援使用 google_ml_integration 擴充功能自動產生嵌入內容。這項功能可使用 Vertex AI 模型 (例如 text-embedding-005),將營運資料 (文字、圖片和影片) 轉換為向量嵌入。
- 模型註冊:使用
google_ml.create_model程序在資料庫中註冊 Vertex AI 模型 (嵌入和生成式)。 - 虛擬資料欄:使用
embedding()函式,系統會自動生成嵌入項目並保留在生成的資料欄中,確保向量資料與來源資料欄資料保持同步:
ALTER TABLE my_table
ADD COLUMN embedding vector(768)
GENERATED ALWAYS AS (embedding('text-embedding-005', source_column)) STORED;
查詢和生成式 AI 擴充功能
儲存向量嵌入後,開發人員就能在標準 SQL 中使用向量相似度運算子 (<=>) 執行精密的語意搜尋。此外,這些搜尋結果可直接傳遞至 gemini-2.0-flash-001 等生成式 AI 模型,並使用 google_ml.generate_content 等函式,以 RAG 為基礎豐富查詢內容,並產生易於理解的輸出內容。