使用以下架构指南来设计和部署在 Google Cloud中具有检索增强生成 (RAG) 功能的生成式 AI 应用。
| 架构指南 | 说明 |
|---|---|
| 使用 Gemini Enterprise 和 Vertex AI 的生成式 AI 的 RAG 基础架构 | 一种智能体驱动型架构,使用 Gemini Enterprise 作为统一平台来编排端到端 RAG 数据流,以满足需要实时数据可用性和丰富上下文搜索的企业应用的需求。 |
| 使用 Vertex AI 和 Vector Search 的生成式 AI 的 RAG 基础架构 | 一种全托管式无服务器架构,可为大规模应用提供经过优化的高性能向量搜索。 |
| 使用 Vertex AI 和 AlloyDB for PostgreSQL 的生成式 AI 的 RAG 基础架构 | 一种将向量嵌入与运营数据一起存储在全代管式数据库(如 AlloyDB for PostgreSQL)中的架构。 |
| 快速起步解决方案:使用 Vertex AI 和 Cloud SQL 的生成式 AI RAG | 一种将向量嵌入与运营数据一起存储在全托管式数据库(如 Cloud SQL)中的架构。 |
| 使用 GKE 和 Cloud SQL 的生成式 AI 的 RAG 基础架构 | 一种灵活的基于容器的架构,可提供最大程度的控制,以便使用 Ray、Hugging Face 和 LangChain 等开源工具构建自定义应用。 |
| 使用 Vertex AI 和 Spanner Graph 为生成式 AI 构建 GraphRAG 基础设施 | 一种高级 RAG 架构,可将向量搜索与知识图谱查询相结合,以检索相互关联的上下文数据,从而生成更详细且更相关的生成式 AI 回答。 |
| 执行适用于 RAG 应用的 CI/CD 流水线 | Google Cloud中 RAG 应用的持续集成 (CI) 和持续部署 (CD) 流水线架构。 |