本文档提供了一个代理型 AI 系统的高级架构,用于编排与不同企业系统的交互。编排器代理可自动执行复杂流程,并通过现代对话式界面统一对多个企业系统的访问。这些系统可以是商业第三方应用,也可以是专有的内部系统。这种设计方法消除了点对点系统集成,因此您的操作员可以避免不断进行上下文切换(转椅处理)。
本文档的目标受众群体包括在云端构建和管理智能体 AI 应用的架构师、开发者和管理员。本文档假定您对智能体 AI 有基本的了解。
架构
下图展示了一个多层架构,其中,编排器代理使用 AI 将来自多个渠道的客户互动路由到相应的后端系统。
架构中的组件按以下层级进行组织:
| 图层 | 组件 |
|---|---|
| 互动渠道 | 在示例架构中,客户端通过以下多个渠道与 agentic AI 系统进行交互:
|
| Agentic 核心 | 该架构的核心组件是使用智能体开发套件 (ADK) 构建并部署在 Cloud Run 上的编排器代理。编排器管理多智能体系统。此无服务器平台使用 Identity and Access Management (IAM) 为代理的 REST API 提供可伸缩性和访问权限控制。 为了在多步任务中保持状态,代理使用内置 ADK 支持在 Vertex AI 会话服务或 Cloud Storage 中持久保留状态数据。 |
| 与后端系统的标准化集成 | 对于代理与后端系统之间的通信,该架构使用部署在 Cloud Run 上的 Model Context Protocol (MCP) 服务器。
每个 MCP 服务器都将特定后端系统的 API 作为一组标准化工具公开。MCP 服务器构成了一个防腐层,可将代理与后端系统隔离开来。此方法有助于避免代理与后端系统紧密耦合。它简化了代理的逻辑,并让您能够独立于代理来更新后端系统。 |
| 后端系统 | 在示例架构中,AI 代理会协调对以下后端系统的访问:
|
使用的产品
此示例架构使用以下 Google Cloud 产品:
- Vertex AI:一个机器学习平台,用于训练和部署机器学习模型和 AI 应用以及自定义 LLM,以在依托 AI 技术的应用中使用。
- Cloud Run:一个无服务器计算平台,可让您直接在 Google 可伸缩的基础设施之上运行容器。
- Pub/Sub:一种异步且可伸缩的通讯服务,可将生成消息的服务与处理这些消息的服务分离开。
- Gemini Enterprise:一个全托管式安全平台,用于在企业内部署和管理 AI 智能体。
- Gemini:Google 开发的一系列多模态 AI 模型。
- Cloud Storage:适用于各种数据类型的费用低廉且不受限制的对象存储区。数据可从 Google Cloud内部和外部访问,并且跨位置进行复制以实现冗余。
- Cloud SQL:一种全托管式关系型数据库服务,可帮助您在 Google Cloud上预配、操作和管理 MySQL、PostgreSQL 和 SQL Server 数据库。
使用场景
此架构适用于以下应用场景:
- 自动执行不同外部应用和内部应用之间的“转椅”处理。
- 无需大规模迁移,即可为多个旧版系统创建统一的界面。
- 为现有业务流程添加智能对话功能。
- 通过事件驱动型功能逐步完成应用的现代化改造。
该架构具有以下优势:
- 效率:自动执行重复性任务,减少人为失误,让您的团队专注于增值任务。
- 可伸缩性:使用事件驱动型方法来独立开发、部署和扩缩服务。
- 增强用户体验:构建现代化的灵活界面,以集成复杂的业务流程。
- 面向未来的集成:使用 MCP 服务器标准化与后端系统的集成,以便您可以独立替换和升级后端系统。
设计考虑事项
如需在生产环境中实现此架构,请考虑以下建议:
- 安全性:对于 Cloud Run 服务,请使用专用 IAM 服务账号,并根据最小权限原则授予权限。通过配置 Cloud Run 入口控制来限制对经过身份验证的调用者的访问,从而保护代理的 API。
- 可观测性:在分布式系统中,日志记录和跟踪对于问题排查至关重要。如需了解整个代理工作流,请对服务进行检测,以将结构化日志写入 Cloud Logging 并将跟踪记录发送到 Cloud Trace。
- 性能:Cloud Run 会根据需求自动扩缩,并在没有负载时缩减到零。对于对延迟时间较为敏感的应用,您可以通过配置实例数下限来最大限度地减少冷启动。
- 部署自动化:使用基础架构即代码 (IaC) 工具(例如 Terraform)自动预配和管理资源。 IaC 有助于确保在开发、暂存和生产环境中实现可重复且可审核的部署。
- 治理:使用 App Design Center 简化应用基础设施的设计和部署。您可以使用应用设计中心来定义纳入组织治理规则和最佳实践的模板。
后续步骤
- (Codelab) 在 Cloud Run 上部署安全的 MCP 服务器。
- (Codelab)构建和部署在 Cloud Run 上使用 MCP 服务器的代理。
- (Codelab) 使用事件异步调用智能体 AI 应用。
- (Google 技能课程)使用 ADK 构建智能代理。
- (代码示例)在 GitHub 中探索更多使用 ADK 构建代理的代码示例。
- 如需简要了解 Google Cloud中特定于 AI 和机器学习工作负载的架构原则和建议,请参阅 Well-Architected Framework 中的 AI 和机器学习视角。
贡献者
作者:Casey West | 架构技术推广工程师, Google Cloud
其他贡献者:
- Amina Mansour | Cloud Platform 评估团队负责人
- Kumar Dhanagopal | 跨产品解决方案开发者
- Leonid Yankulin | 开发者关系工程师