本文档简要介绍了用于设计、构建和部署 AI 及机器学习应用的架构指南。
为了帮助您找到适合自己角色和需求的指南,我们提供了以下类型的架构指南:
- 设计指南:规范性的跨产品指南,可帮助您规划和设计云架构。
- 参考架构:针对特定工作负载的详细架构示例和设计建议。
- 应用场景:用于解决特定业务问题的高级架构示例。
- 部署指南和快速起步解决方案:用于部署特定架构的分步说明或代码。
智能体 AI
智能体 AI 应用通过自主规划和多步骤工作流程解决开放式问题。
如需在 Google Cloud上构建代理式 AI 应用,请先参阅以下指南:
- 设计指南:选择智能体 AI 架构组件
- 设计指南:为智能体 AI 系统选择设计模式
- 参考架构: Google Cloud中的多智能体 AI 系统
- 探索更多自主 AI 架构指南。
生成式 AI
借助生成式 AI 应用,用户可以使用 AI 创建摘要、发现复杂的隐藏关联,或生成新内容。
如需在 Google Cloud上构建生成式 AI 应用,请先参阅以下指南:
- 设计指南:部署和运行生成式 AI 应用
- 设计指南:为您的生成式 AI 应用选择模型和基础设施
- 参考架构: 使用 RAG 的生成式 AI
机器学习应用和运营
强大的机器学习运维 (MLOps) 是每项 AI 计划的基础,从分类和回归模型到复杂的生成式 AI 和智能体 AI 系统,无不如此。
如需在 Google Cloud上构建和运行机器学习应用,请先参阅以下指南:
- 设计指南: 在 Google Cloud上实现机器学习的最佳实践
- 蓝图:在企业中构建和部署生成式 AI 和机器学习模型
- 参考架构: 使用 Dataflow 和 Cloud Vision API 构建机器学习视觉分析解决方案
- 参考架构: Google Cloud上的跨孤岛和跨设备联邦学习
- 探索更多 ML 应用和运营架构指南。
AI 和机器学习基础设施
AI 和 ML 应用的性能、费用和可伸缩性直接取决于底层的基础设施。机器学习生命周期的每个阶段对计算、存储和网络都有独特的要求。
以下资源可帮助您为 AI 和机器学习工作负载设计和选择合适的基础设施:
- 设计指南:为 Google Cloud中的 AI 和机器学习工作负载设计存储
- 参考架构:使用 Cloud Storage FUSE 优化 AI 和机器学习工作负载
- 参考架构:使用 Google Cloud Managed Lustre 优化 AI 和机器学习工作负载