AlloyDB AI 是 AlloyDB for PostgreSQL 的進階擴充功能,可直接在企業級關聯式資料庫中整合高效能向量處理功能。開發人員可運用這項服務,建構複雜的智慧型應用程式,瞭解結構化和非結構化格式資料的語意。AlloyDB AI 整合 SQL 功能和先進的向量搜尋技術,提供單一 AI 就緒平台,適用於資料管理和檢索增強生成 (RAG) 工作流程,不必另外部署及管理向量資料庫。
核心架構與效能
AlloyDB 使用 PostgreSQL 的 pgvector 擴充功能來提供向量功能。這項服務支援熱門的 HNSW 索引,以及可擴充最鄰近項目 (ScaNN) 索引。ScaNN 索引是根據 Google 搜尋多年的研究成果,開發出的最先進向量搜尋演算法。這項功能與 PostgreSQL 環境深度整合,可執行與 pgvector 相容的高速作業,以及進階語意查詢。
ScaNN 索引效能
與標準 PostgreSQL HNSW (階層式可導覽小世界) 索引相比,ScaNN 索引的速度大幅提升,可為嚴苛的 AI 工作負載提供必要的快速向量運算:
| 作業 | 效能提升 (相較於標準 PostgreSQL HNSW 索引) | 功能 |
|---|---|---|
| 建立索引 | 速度提升最高可達 10 倍 | 平行建立索引 |
| 向量搜尋查詢 | 速度提升最高 4 倍 | 索引自動維護 |
| 已篩選的向量搜尋查詢 | 速度提升最高可達 10 倍 | 企業級可觀測性 |
自動調整篩選條件和查詢最佳化
ScaNN 索引與 PostgreSQL 查詢規劃工具深度整合,可確保涉及向量相似度和標準結構化中繼資料篩選器的混合查詢,都能達到最佳效能。
- 自動調整篩選功能:這個機制可確保篩選器、彙整和向量索引同時使用時,能發揮最佳成效。這項功能會在執行階段觀察查詢執行統計資料、瞭解篩選器的選擇性,並適應性地調整執行計畫,以決定篩選器應用程式和向量搜尋的最有效排序。
- 內嵌篩選:內嵌篩選是 ScaNN 演算法專用的最佳化策略,可同時執行向量搜尋和中繼資料篩選器評估。這項功能會運用 PostgreSQL 次要索引 (例如 B-tree、GIN 或 GiST),建立符合篩選條件的資料列候選清單 (點陣圖)。後續的向量掃描只會計算預先篩選集中所含向量的距離,大幅減少運算負荷,特別是篩選條件具有適度的選擇性時。
與 Gemini Enterprise Agent Platform 輕鬆整合
AlloyDB AI 專為與 Agent Platform 生態系統內建整合而設計,可讓您使用 SQL 直接在資料庫中轉換及充實資料。
自動生成嵌入
這個平台支援使用 google_ml_integration 擴充功能自動產生嵌入內容。這項功能可讓您使用 Agent Platform 模型 (例如 text-embedding-005),將營運資料 (文字、圖片和影片) 轉換為向量嵌入。
- 模型註冊:使用
google_ml.create_model程序在資料庫中註冊 Agent Platform 模型 (嵌入和生成)。 - 虛擬資料欄:使用
embedding()函式,即可在產生的資料欄中自動產生並保存嵌入項目,確保向量資料與來源資料欄資料保持同步:
ALTER TABLE my_table
ADD COLUMN embedding vector(768)
GENERATED ALWAYS AS (embedding('text-embedding-005', source_column)) STORED;
查詢和生成式 AI 擴充功能
儲存向量嵌入後,開發人員就能在標準 SQL 中使用向量相似度運算子 (<=>) 執行精密的語意搜尋。此外,您可以使用 google_ml.generate_content 等函式,將這些搜尋結果直接傳遞至 gemini-2.0-flash-001 等生成式 AI 模型,以 RAG 為基礎豐富查詢內容,並產生易於理解的輸出內容。