生成式 AI 架构指南

Last reviewed 2025-01-06 UTC

架构中心中的本文档提供了架构指南,可帮助您在 Google Cloud中构建和部署生成式 AI 工作负载。

如需了解如何基于基础模型设置、部署、评估和运行生成式 AI 应用,请参阅部署和运行生成式 AI 应用

概要架构

以下指南针对生成式 AI 的特定业务和技术应用场景提供了高级别架构:

指南 说明
生成个性化的营销活动 为个性化营销活动生成媒体素材资源。
生成个性化商品推荐 根据用户偏好为零售应用生成个性化产品推荐。
根据音频文件生成播客 根据媒体文件(例如体育赛事的实时解说)生成播客。
为客户支持服务请求生成解决方案 生成对客户问题的回答,例如技术支持请求。

参考架构

以下指南提供了详细的架构示例和设计建议,可帮助您针对特定应用场景部署生成式 AI 工作负载和基础设施:

指南 说明
自动执行保险索赔的利用率审核 改进健康保险索赔的事先授权 (PA) 和利用率审核 (UR) 流程。
使用 Gemini Enterprise 和 Vertex AI 的 RAG 基础架构 编排智能体 RAG 工作流,以实现实时数据可用性和丰富的上下文搜索。
使用 Vertex AI 和 Vector Search 的 RAG 基础架构 为大规模应用提供经过优化的高性能向量搜索。
使用 Vertex AI 和 AlloyDB for PostgreSQL 的 RAG 基础架构 将向量嵌入与运营数据一起存储在全托管式 AlloyDB for PostgreSQL 数据库中。
使用 Vertex AI 和 Cloud SQL 的 RAG 基础架构 将矢量嵌入与运营数据一起存储在全托管式 Cloud SQL 数据库中。
使用 GKE 和 Cloud SQL 的 RAG 基础设施 使用 Ray、Hugging Face 和 LangChain 等开源工具构建自定义 RAG 应用。
使用 Vertex AI 和 Spanner Graph 的 GraphRAG 基础设施 将向量搜索与知识图谱查询相结合,以检索相互关联的上下文数据。
支持 RAG 的生成式 AI 应用的专用连接 使用共享 VPC 保护支持 RAG 的生成式 AI 应用的网络基础设施。
执行适用于 RAG 应用的 CI/CD 流水线 为 RAG 应用设置持续集成 (CI) 和持续部署 (CD) 流水线。