搭配 RAG 的生成式 AI

請參閱下列架構指南,設計及部署採用檢索增強生成 (RAG) 技術的生成式 AI 應用程式。 Google Cloud

架構指南 說明
使用 Gemini Enterprise 和 Vertex AI 建構生成式 AI 的 RAG 基礎架構 以代理程式為主的架構,使用 Gemini Enterprise 做為統一平台,為需要即時資料可用性和豐富情境搜尋的企業應用程式,協調端對端 RAG 資料流。
使用 Vertex AI 和 Vector Search 建構生成式 AI 的 RAG 基礎架構 全代管無伺服器架構,可為大規模應用程式提供最佳化的高效能向量搜尋功能。
使用 Vertex AI 和 AlloyDB for PostgreSQL 建構生成式 AI 的 RAG 基礎架構 這類架構會將向量嵌入與作業資料一併儲存在全代管資料庫中,例如 AlloyDB for PostgreSQL。
快速入門解決方案:使用 Vertex AI 和 Cloud SQL 的生成式 AI RAG 這類架構會將向量嵌入與作業資料一併儲存在全代管資料庫 (例如 Cloud SQL) 中。
使用 GKE 和 Cloud SQL 建構生成式 AI 的 RAG 基礎架構 彈性的容器式架構,可提供最大程度的控制權,讓您使用 Ray、Hugging Face 和 LangChain 等開放原始碼工具建構自訂應用程式。
使用 Vertex AI 和 Spanner Graph 建構生成式 AI 的 GraphRAG 基礎架構 進階 RAG 架構結合向量搜尋和知識圖譜查詢,可擷取相互連結的脈絡資料,生成更詳細且相關的生成式 AI 回覆。
運用 Harness CI/CD 管道建構 RAG 應用程式 適用於 RAG 應用程式的持續整合 (CI) 和持續部署 (CD) pipeline 架構 Google Cloud。