Agent Runtime 是一组可让开发者在生产环境中部署、管理和扩缩 AI 智能体的服务。Agent Runtime 负责处理基础设施,使智能体在生产环境中能够自动伸缩,因此您可以专注于创建应用。Agent Runtime 提供以下服务,您可以单独使用这些服务,也可以组合使用:
- 运行时:
- 部署和扩缩智能体 利用托管式运行时和端到端管理功能。
- 使用系统依赖项的构建时安装脚本自定义智能体的容器映像。
- 使用安全功能,包括 VPC-SC 合规性以及身份验证和 IAM 的配置。
- 访问模型和工具,例如函数 调用。
- 部署使用 不同 Python 框架 和 Agent2Agent 开放协议构建的智能体。
- 质量和评估 (预览版):使用 集成的 Gen AI Evaluation Service 评估智能体质量,并通过 Gemini 模型训练运行优化智能体。
- Agent Platform 会话:借助 Agent Platform 会话,您可以存储用户与智能体之间的个别互动,为对话上下文提供明确的来源。
- Agent Platform 记忆库:借助 Agent Runtime Agent Platform 记忆库,您可以存储和检索会话信息 打造个性化智能体互动体验。
- 代码执行: 借助 Agent Runtime 代码执行,您的智能体可以在安全、隔离且 受管理的沙盒环境中运行代码。
- 示例存储区 (预览版):存储和动态检索少样本示例,以提升智能体性能。
- 可观测性:通过 Google Cloud Trace(支持 OpenTelemetry)、 Cloud Monitoring 和 Cloud Logging 了解智能体行为。
- 治理:Agent Runtime 支持多项功能,可帮助您
在生产环境中治理智能体,并满足您的安全和企业需求:
- 使用 Security Command Center 检测威胁:Agent Runtime 威胁检测 (预览版)是 Security Command Center 的一项内置服务,可帮助您检测和 调查部署到 Agent Runtime 的智能体可能遭受的攻击。
- 智能体身份 (预览版):在 Agent Runtime 上使用智能体时,使用 Identity Access Management (IAM) 智能体身份提供 安全和访问权限管理功能。
- Agent Gateway (预览版):使用 Agent Gateway 为智能体 通信定义规则,并对连接到项目和从项目连接的 智能体、客户端和工具强制执行安全和访问权限控制政策。 Google Cloud
在 Agent Runtime 上创建和部署
在 Agent Runtime 上构建智能体的工作流如下:
- 设置环境:设置您的 Google 项目并安装最新版本的 Agent Platform SDK for Python。
- **开发智能体**:开发 可在 Agent Runtime 上部署的智能体。
- 部署智能体:部署 智能体在 Agent Runtime 托管式运行时上。
- 使用智能体:通过发送 API 请求来查询 智能体。
- **管理已部署的 智能体** :管理和 删除已部署到 Agent Runtime 的智能体。
这些步骤如下图所示:
支持的框架
下表介绍了 Agent Runtime 为各种智能体框架提供的支持级别:
| 支持级别 | 智能体框架 |
|---|---|
| 自定义模板:您可以调整自定义模板,以支持 从框架部署到 Agent Runtime。 | CrewAI、 自定义 框架 |
| Agent Platform SDK 集成:Agent Runtime 在 Agent Platform SDK 和文档中按框架提供托管式 模板。 | AG2、 LlamaIndex |
| 全面集成:这些功能已集成,可在 框架、Agent Runtime 和更广泛的 Google Cloud 生态系统中运行。 | 智能体 开发套件 (ADK)、 LangChain、 LangGraph |
使用 Agents CLI 在生产环境中部署
Agents CLI 是 Gemini Enterprise Agent Platform 的统一 命令行界面和技能集。 它为编码智能体和开发者提供了一条可预测的智能体开发生命周期路径:搭建、评估、部署、发布和观测。 Agents CLI 提供以下内容:
- 预构建的智能体模板 :ReAct、RAG、多智能体和其他模板。
- 互动式平台:测试您的智能体并与之互动。
- 自动化基础设施:使用 Terraform 来简化 资源管理。
- CI/CD 流水线:利用 Cloud Build 实现自动化部署工作流。
- 可观测性:内置对 Cloud Trace 和 Cloud Logging 的支持。
如需开始使用,请参阅 快速入门。
使用场景
如需通过端到端示例了解 Agent Runtime,请参阅以下资源:
点击即可展开使用场景
企业级安全
Agent Runtime 支持多项功能,可帮助您满足企业安全要求、遵守组织的安全政策,并遵循安全最佳实践。支持以下功能:
VPC Service Controls:Agent Runtime 支持 VPC Service Controls ,以加强数据安全性并降低数据渗漏风险。如需了解详情,请参阅 Agent Runtime VPC Service Controls。
Private Service Connect 接口:对于 Agent Runtime, PSC-I 可让您的智能体 与用户 VPC 中以私密方式托管的服务进行交互。如需了解详情,请参阅将 Private Service Connect 接口与 Agent Runtime搭配使用。
客户管理的加密密钥 (CMEK):Agent Runtime 支持 CMEK,以便您使用自己的加密密钥保护数据, 从而获得用于保护 中静态数据的密钥的所有权和完全控制权 Google Cloud。如需了解详情,请参阅 Agent Runtime CMEK。
数据驻留 (DRZ):Agent Runtime 支持数据驻留 (DRZ){/3),以确保所有静态数据都 存储在指定区域内。
HIPAA:作为 Agent Platform 的一部分,Agent Runtime 支持 HIPAA 工作负载。
Access Transparency:Access Transparency 中的日志记录了 Google 员工在访问您的内容时所执行的操作。如需详细了解如何为 Agent Runtime 启用 Access Transparency,请参阅 Agent Platform 中的 Access Transparency。
下表显示了每个 Agent Platform 服务支持哪些企业安全功能:
| 安全功能 | Agent Runtime | 会话 | 记忆库 | Example Store | 代码执行 |
|---|---|---|---|---|---|
| VPC Service Controls | 是 | 是 | 是 | 否 | 是 |
| 客户管理的加密密钥 | 是 | 是 | 是 | 否 | 是 |
| 数据驻留 (DRZ)(静态) | 是 | 是 | 是 | 否 | 是 |
| HIPAA | 是 | 是 | 是 | 是 | 是 |
| Access Transparency | 是 | 是 | 是 | 否 | 否 |
| Access Approval | 是 | 是 | 是 | 否 | 否 |
支持的区域
如需查看 Agent Runtime 支持的区域列表,请参阅 位置 。
Quota
如需了解 Agent Runtime 配额信息,请参阅配额和系统 限制。
价格
Agent Runtime 提供免费层级。如需了解 Agent Runtime 的价格,请参阅 Gemini Enterprise Agent Platform 价格。
迁移到基于客户端的 SDK
Agent Platform SDK 中的 agent_engines 模块正在重构为基于客户端的设计,主要原因如下:
- 为了与 智能体开发套件 (ADK) 和 Google Gen AI SDK 在规范类型表示方面保持一致。这可确保以一致且标准化的方式在不同 SDK 中表示数据类型,从而简化互操作性并减少转换开销。
- 用于在多项目 多位置应用中对 Google Cloud 参数进行客户端级范围限定。这样,应用就可以通过为每个客户端实例配置特定的 项目和位置信息设置,来管理与不同 Google Cloud 项目和 地理位置的资源之间的互动。
- 提高 Agent Runtime 服务的可发现性和凝聚力