构建、部署和管理 AI 智能体,这些智能体使用推理和工具来执行复杂的企业任务,例如自动化工作流、发现多个系统中的信息以及生成内容。Agent Platform 为整个智能体生命周期提供端到端环境,包括低代码和代码优先开发工具;托管式运行时;以及用于安全、治理和可观测性的集成服务。
选择开发路径
您可以根据技术要求和专业知识,使用以下两种主要路径构建智能体:
- Agent Studio(低代码):一个协作式可视化工作区,用于发现模型、设计提示和构建智能体,无需编写代码。非常适合快速原型设计和以业务为中心的智能体。
- 智能体开发套件 (ADK)(代码优先):一个强大的框架,供开发者构建复杂的多智能体编排,并对逻辑、工具和环境模拟进行精细控制。
平台架构
Agent Platform 提供了一套集成的工具和服务,可在四个关键支柱中支持端到端智能体生命周期:
- 构建:使用低代码 Studio 或代码优先 ADK 创建智能体。访问 Model Garden 中的 200 多个基础模型。
- 扩缩:将智能体部署到全代管式运行时,其中包含集成式会话管理和长期记忆库。
- **治理**:使用唯一身份保护智能体,在注册表中集中管理工具访问权限,并使用智能体网关强制执行政策。
- **优化**:通过生成式 AI 评估提高质量,并通过 Cloud 可观测性和拓扑深入了解情况。
构建
“构建”支柱提供原始智能和连接(包括 Model Garden、ADK 和 MCP)。主要组件包括:
- Agent Studio:提供用于创建智能体的低代码开发环境。
- Agent Garden: 提供预构建的智能体示例库,可加快常见 AI 模式和使用场景的智能体开发。
- 智能体开发套件 (ADK): 用于复杂智能体和编排逻辑的代码优先开发。
- Model Garden:一个包含 200 多个基础模型的库,这些模型来自 Google、合作伙伴和开源社区,可供发现和实验。
扩缩
“扩缩”支柱提供托管式运行时、无服务器效率和长期记忆,用于部署和运行智能体。主要组件包括:
Agent Runtime
Agent Runtime 是一个全代管式运行时环境 (Agent Runtime),用于托管、部署和伸缩使用 ADK 或其他工具构建的智能体。
会话
会话用于 在单次对话过程中维护用户与智能体之间的互动历史记录 。会话为正在进行的互动提供上下文,并且是生成长期记忆的来源。
记忆库
记忆库通过提取、存储、 和检索多个会话中有关用户的个性化信息, 为智能体提供长期记忆,从而实现个性化和跨会话连续性。
治理
“治理”支柱提供全面的工具来管理代理身份 (IAM)、智能体网关和 Model Armor。主要组件包括:
AI 应用
一个 App Hub 应用在逻辑上将提供业务功能的服务和工作负载分组。AI 应用通过函数调用、主动规划和编排的智能体网格等专用功能扩展了这一概念。智能体在部署后会自动映射到这些应用。
Agent Registry
将智能体部署到 Agent Platform 后,它们会自动注册到 Agent Registry。在部署期间,您可以将智能体关联到现有 AI 应用,也可以自动创建一个新应用。
注册表为您的所有 Google 智能体、第三方智能体和 MCP 服务器提供了一个可查询的集中式存储区。它会捕获关键元数据,包括版本、框架(如 ADK)以及 MCP 工具名称和注释等功能。
查询注册表以获取端点,并使用 代理身份 为用户委托的身份验证配置托管式 OAuth 2.0 连接。底层 代理身份身份验证管理器 负责处理 OAuth 和刷新令牌管理的复杂性,使智能体能够代表用户安全地调用工具,而无需开发者管理敏感凭据。
代理身份
部署智能体时,必须为智能体配置 智能体身份,这是一种唯一的 SPIFFE 格式 ID,可作为共享服务账号的精细替代方案。IAM 直接支持此 ID,管理员可以直接向智能体分配特定权限(例如对 Cloud Storage 存储分区或 BigQuery 数据集的权限)。此身份还可与 代理身份身份验证管理器 搭配使用,以实现用户委托的工具访问,从而提供清晰的审核跟踪记录。智能体网关使用此身份在所有智能体互动中强制执行精细的访问权限控制。
智能体网关
智能体流量由 智能体网关 管理,这是一个全代管式网络组件,用于管理来自智能体的所有流量。它充当运行时强制执行点,拦截对工具或其他智能体的调用,以强制执行访问权限控制政策并支持 Model Armor 检查工具调用和响应。
App Design Center
App Design Center 可帮助您 为 AI 应用设计和预配安全的基础设施模板。它可确保依赖的服务(例如智能体网关、Model Armor 安全政策和 IAM 配置)在您的环境中正确实例化。App Design Center 可简化确保从智能体部署的那一刻起就强制执行治理政策的过程。
优化
“优化”支柱提供取证可观测性和评估工具,以提高智能体的性能和质量。主要组件包括:
Cloud Observability
Cloud Observability 套件(Cloud Trace、Cloud Logging、Cloud Monitoring 和拓扑)在您使用 ADK 进行部署时,默认会从代理收集信息,从而深入了解代理的性能和行为。它使用 Open Telemetry 协议从 Agent Platform、智能体网关和 Model Armor 收集跟踪记录(执行路径)、日志(事件和错误)和指标(延迟时间、令牌使用情况)。借助这种统一的遥测数据,您可以调试故障、监控费用、跟踪智能体推理的完整路径,以及查看应用拓扑。
评估
借助 GenAI Evaluation Service ,您可以使用 Auto SxS 对智能体质量进行在线评估。
常见使用场景
智能体可应用于各种企业场景:
- 客户支持 :通过将智能体与知识库和工单系统集成,自动回复常见咨询并解决工单。
- 信息发现 :让用户能够使用自然语言搜索分散的内部系统(例如 Google 云端硬盘、Jira 和 Slack),以查找专家或项目状态。
- 业务运营 :自动执行重复性任务,例如安排会议、准备每日简报或处理费用报告。
- 销售和营销 :使用实时企业数据起草个性化外展内容、总结广告系列效果或研究潜在客户。
- 软件开发 :帮助开发者调试代码、浏览复杂的代码库或排查基础设施问题。
管理界面
Agent Platform 是平台和安全管理员管理整个智能体生命周期的中央控制台。Gemini Enterprise Admin 用于管理 Gemini Enterprise 实例中的智能体并添加智能体。它与 Agent Registry 和智能体网关集成。 Google Workspace 管理控制台用于管理 Gemini Enterprise 智能体与 Google Workspace 服务和数据之间的互动。
Agent Platform
- Agent Registry:查看、管理、版本控制、注册和监控智能体。
- 智能体网关管理:配置、管理和监控智能体网关。
- 政策执行:定义和应用 IAM 和 Model Armor 政策。
- 可观测性:监控智能体指标、跟踪记录、日志,并直观呈现智能体依赖项和互动。
- 身份:管理智能体服务账号和权限。
- 安全:与 Security Command Center 集成以进行威胁检测。
- 审核日志记录:跟踪智能体活动。
- 在 Agent Platform 中构建、扩缩和优化工作流。
Gemini Enterprise Admin
- 管理 Gemini Enterprise 许可和用户。
- 管理 Gemini Enterprise 实例和数据连接器。
- 关联到智能体网关,为 Gemini Enterprise 实例设置路由。
- 从智能体和工具注册表向 Gemini Enterprise 实例添加智能体和工具(还支持 BYO-MCP 和 A2A 智能体的现有路径)。
- 管理 Gemini Enterprise 智能体的用户权限。
- 使用 Gemini Enterprise 智能体的工具启用可观测性(日志、指标、跟踪记录) Google Cloud 。
- 直接前往 Agent Platform 以执行政策并实现额外的可观测性。
Google Workspace 管理控制台
- 为 Google Workspace 用户启用或停用 Gemini Enterprise 服务。
- 管理 Google Workspace 用户访问 Gemini Enterprise 智能体的权限。
- 对智能体数据访问权限强制执行 Google Workspace 网域政策。
- Google Workspace 审核日志记录智能体互动。
- 将管理员直接转到 Agent Platform 以进行 智能体网关配置。
- 关联到 Agent Platform 以进行 全面的智能体治理。