Last reviewed 2025-01-06 UTC
架构中心中的本文档提供了架构指南,可帮助您在 Google Cloud中构建和部署生成式 AI 工作负载。
如需了解如何基于基础模型设置、部署、评估和运行生成式 AI 应用,请参阅部署和运行生成式 AI 应用。
概要架构
以下指南针对生成式 AI 的特定业务和技术应用场景提供了高级别架构:
| 指南 | 说明 |
|---|---|
| 生成个性化的营销活动 | 为个性化营销活动生成媒体素材资源。 |
| 生成个性化商品推荐 | 根据用户偏好为零售应用生成个性化产品推荐。 |
| 根据音频文件生成播客 | 根据媒体文件(例如体育赛事的实时解说)生成播客。 |
| 为客户支持服务请求生成解决方案 | 生成对客户问题的回答,例如技术支持请求。 |
参考架构
以下指南提供了详细的架构示例和设计建议,可帮助您针对特定应用场景部署生成式 AI 工作负载和基础设施:
| 指南 | 说明 |
|---|---|
| 自动执行保险索赔的利用率审核 | 改进健康保险索赔的事先授权 (PA) 和利用率审核 (UR) 流程。 |
| 使用 Gemini Enterprise 和 Vertex AI 的 RAG 基础架构 | 编排智能体 RAG 工作流,以实现实时数据可用性和丰富的上下文搜索。 |
| 使用 Vertex AI 和 Vector Search 的 RAG 基础架构 | 为大规模应用提供经过优化的高性能向量搜索。 |
| 使用 Vertex AI 和 AlloyDB for PostgreSQL 的 RAG 基础架构 | 将向量嵌入与运营数据一起存储在全托管式 AlloyDB for PostgreSQL 数据库中。 |
| 使用 Vertex AI 和 Cloud SQL 的 RAG 基础架构 | 将矢量嵌入与运营数据一起存储在全托管式 Cloud SQL 数据库中。 |
| 使用 GKE 和 Cloud SQL 的 RAG 基础设施 | 使用 Ray、Hugging Face 和 LangChain 等开源工具构建自定义 RAG 应用。 |
| 使用 Vertex AI 和 Spanner Graph 的 GraphRAG 基础设施 | 将向量搜索与知识图谱查询相结合,以检索相互关联的上下文数据。 |
| 支持 RAG 的生成式 AI 应用的专用连接 | 使用共享 VPC 保护支持 RAG 的生成式 AI 应用的网络基础设施。 |
| 执行适用于 RAG 应用的 CI/CD 流水线 | 为 RAG 应用设置持续集成 (CI) 和持续部署 (CD) 流水线。 |