使用 RAG 的生成式 AI

Last reviewed 2025-09-22 UTC

使用以下架构指南在 Google Cloud中设计和部署具有检索增强生成 (RAG) 功能的生成式 AI 应用。

架构指南	说明
使用 Gemini Enterprise 和 Vertex AI 的生成式 AI 的 RAG 基础架构	一种智能体驱动型架构，使用 Gemini Enterprise 作为统一平台来编排端到端 RAG 数据流，以满足需要实时数据可用性和丰富上下文搜索的企业应用的需求。
使用 Vertex AI 和 Vector Search 的生成式 AI 的 RAG 基础架构	一种全托管式无服务器架构，可为大规模应用提供经过优化的高性能向量搜索。
使用 Vertex AI 和 AlloyDB for PostgreSQL 的生成式 AI 的 RAG 基础架构	一种将向量嵌入与运营数据一起存储在全代管式数据库（如 AlloyDB for PostgreSQL）中的架构。
快速起步解决方案：使用 Vertex AI 和 Cloud SQL 的生成式 AI RAG	一种将向量嵌入与运营数据一起存储在全托管式数据库（如 Cloud SQL）中的架构。
使用 GKE 和 Cloud SQL 的生成式 AI 的 RAG 基础架构	一种灵活的基于容器的架构，可提供最大程度的控制，以便使用 Ray、Hugging Face 和 LangChain 等开源工具构建自定义应用。
使用 Vertex AI 和 Spanner Graph 为生成式 AI 构建 GraphRAG 基础设施	一种高级 RAG 架构，可将向量搜索与知识图谱查询相结合，以检索相互关联的上下文数据，从而生成更详细且更相关的生成式 AI 回答。
执行适用于 RAG 应用的 CI/CD 流水线	Google Cloud中 RAG 应用的持续集成 (CI) 和持续部署 (CD) 流水线架构。

使用 RAG 的生成式 AI 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。