生成式 AI 架构指南

Last reviewed 2025-01-06 UTC

架构中心中的本文档提供了架构指南，可帮助您在 Google Cloud中构建和部署生成式 AI 工作负载。

如需了解如何基于基础模型设置、部署、评估和运行生成式 AI 应用，请参阅部署和运行生成式 AI 应用。

概要架构

以下指南针对生成式 AI 的特定业务和技术应用场景提供了高级别架构：

以下指南提供了详细的架构示例和设计建议，可帮助您针对特定应用场景部署生成式 AI 工作负载和基础设施：

指南	说明
自动执行保险索赔的利用率审核	改进健康保险索赔的事先授权 (PA) 和利用率审核 (UR) 流程。
使用 Gemini Enterprise 和 Vertex AI 的 RAG 基础架构	编排智能体 RAG 工作流，以实现实时数据可用性和丰富的上下文搜索。
使用 Vertex AI 和 Vector Search 的 RAG 基础架构	为大规模应用提供经过优化的高性能向量搜索。
使用 Vertex AI 和 AlloyDB for PostgreSQL 的 RAG 基础架构	将向量嵌入与运营数据一起存储在全托管式 AlloyDB for PostgreSQL 数据库中。
使用 Vertex AI 和 Cloud SQL 的 RAG 基础架构	将矢量嵌入与运营数据一起存储在全托管式 Cloud SQL 数据库中。
使用 GKE 和 Cloud SQL 的 RAG 基础设施	使用 Ray、Hugging Face 和 LangChain 等开源工具构建自定义 RAG 应用。
使用 Vertex AI 和 Spanner Graph 的 GraphRAG 基础设施	将向量搜索与知识图谱查询相结合，以检索相互关联的上下文数据。
支持 RAG 的生成式 AI 应用的专用连接	使用共享 VPC 保护支持 RAG 的生成式 AI 应用的网络基础设施。
执行适用于 RAG 应用的 CI/CD 流水线	为 RAG 应用设置持续集成 (CI) 和持续部署 (CD) 流水线。