Agent Runtime

Agent Runtime 是一组可让开发者在生产环境中部署、管理和扩缩 AI 智能体的服务。Agent Runtime 负责处理基础设施,使智能体在生产环境中能够自动伸缩,因此您可以专注于创建应用。Agent Runtime 提供以下服务,您可以单独使用这些服务,也可以组合使用:

  • 运行时:
    • 部署和扩缩智能体 利用托管式运行时和端到端管理功能。
    • 使用系统依赖项的构建时安装脚本自定义智能体的容器映像。
    • 使用安全功能,包括 VPC-SC 合规性以及身份验证和 IAM 的配置。
    • 访问模型和工具,例如函数 调用
    • 部署使用 不同 Python 框架Agent2Agent 开放协议构建的智能体。
  • 质量和评估 (预览版):使用 集成的 Gen AI Evaluation Service 评估智能体质量,并通过 Gemini 模型训练运行优化智能体。
  • Agent Platform 会话:借助 Agent Platform 会话,您可以存储用户与智能体之间的个别互动,为对话上下文提供明确的来源。
  • Agent Platform 记忆库:借助 Agent Runtime Agent Platform 记忆库,您可以存储和检索会话信息 打造个性化智能体互动体验。
  • 代码执行: 借助 Agent Runtime 代码执行,您的智能体可以在安全、隔离且 受管理的沙盒环境中运行代码。
  • 示例存储区 (预览版):存储和动态检索少样本示例,以提升智能体性能。
  • 可观测性:通过 Google Cloud Trace(支持 OpenTelemetry)、 Cloud MonitoringCloud Logging 了解智能体行为。
  • 治理:Agent Runtime 支持多项功能,可帮助您 在生产环境中治理智能体,并满足您的安全和企业需求:
    • 使用 Security Command Center 检测威胁Agent Runtime 威胁检测 (预览版)是 Security Command Center 的一项内置服务,可帮助您检测和 调查部署到 Agent Runtime 的智能体可能遭受的攻击。
    • 智能体身份 (预览版):在 Agent Runtime 上使用智能体时,使用 Identity Access Management (IAM) 智能体身份提供 安全和访问权限管理功能。
    • Agent Gateway (预览版):使用 Agent Gateway 为智能体 通信定义规则,并对连接到项目和从项目连接的 智能体、客户端和工具强制执行安全和访问权限控制政策。 Google Cloud

在 Agent Runtime 上创建和部署

在 Agent Runtime 上构建智能体的工作流如下:

  1. 设置环境:设置您的 Google 项目并安装最新版本的 Agent Platform SDK for Python。
  2. **开发智能体**:开发 可在 Agent Runtime 上部署的智能体。
  3. 部署智能体:部署 智能体在 Agent Runtime 托管式运行时上。
  4. 使用智能体:通过发送 API 请求来查询 智能体。
  5. **管理已部署的 智能体** :管理和 删除已部署到 Agent Runtime 的智能体。

这些步骤如下图所示:

创建和部署智能体 

支持的框架

下表介绍了 Agent Runtime 为各种智能体框架提供的支持级别:

支持级别 智能体框架
自定义模板:您可以调整自定义模板,以支持 从框架部署到 Agent Runtime。 CrewAI自定义 框架
Agent Platform SDK 集成:Agent Runtime 在 Agent Platform SDK 和文档中按框架提供托管式 模板。 AG2LlamaIndex
全面集成:这些功能已集成,可在 框架、Agent Runtime 和更广泛的 Google Cloud 生态系统中运行。 智能体 开发套件 (ADK)LangChainLangGraph

使用 Agents CLI 在生产环境中部署

Agents CLI 是 Gemini Enterprise Agent Platform 的统一 命令行界面和技能集。 它为编码智能体和开发者提供了一条可预测的智能体开发生命周期路径:搭建、评估、部署、发布和观测。 Agents CLI 提供以下内容:

  • 预构建的智能体模板 :ReAct、RAG、多智能体和其他模板。
  • 互动式平台:测试您的智能体并与之互动。
  • 自动化基础设施:使用 Terraform 来简化 资源管理。
  • CI/CD 流水线:利用 Cloud Build 实现自动化部署工作流。
  • 可观测性:内置对 Cloud Trace 和 Cloud Logging 的支持。

如需开始使用,请参阅 快速入门

使用场景

如需通过端到端示例了解 Agent Runtime,请参阅以下资源:

点击即可展开使用场景

使用场景 说明 链接
通过连接到公共 API 来构建智能体 货币换算。

创建一个连接到货币兑换应用的函数,使模型能够为诸如“今天欧元兑美元的汇率是多少?”之类的查询提供准确的答案。
Agent Platform SDK (Python) 笔记本 - 使用 Agent Runtime 构建和部署智能体简介
设计社区太阳能项目。

确定潜在 位置,查询相关政府办公室和供应商,并查看 区域和建筑物的卫星图像和太阳能板发电潜力,以找到安装太阳能板的最佳位置。
Agent Platform SDK (Python) 笔记本 - 构建 和部署 Google 地图 API 智能体
通过连接到数据库来构建智能体 与 AlloyDB 和 Cloud SQL for PostgreSQL 集成。 博文 - 宣布推出适用于 AlloyDB 和 Cloud SQL for PostgreSQL 的 LangChain on Gemini Enterprise Agent Platform

Agent Platform SDK (Python) 笔记本 - 将使用 Cloud SQL for PostgreSQL 的 RAG 应用部署到 Agent Runtime

Agent Platform SDK (Python) 笔记本 - 将使用 AlloyDB for PostgreSQL 的 RAG 应用部署到 Agent Runtime
使用可访问数据库中数据的工具构建智能体。 Agent Platform SDK (Python) 笔记本 - 使用 Agent Runtime 和 MCP Toolbox for Databases 部署智能体
使用自然语言查询和理解结构化数据存储区。 Agent Platform SDK (Python) 笔记本 - 在 Agent Search 上使用 Agent Runtime 和 RAG 构建对话式搜索智能体
使用自然语言查询和理解图表数据库 博文 - 将 Agent Runtime 与 LangChain 和 Neo4j 搭配使用的生成式 AI GraphRAG 和 AI 智能体
使用自然语言查询和理解矢量存储区 博文 - 使用 MongoDB Atlas 和 Agent Runtime 简化生成式 AI RAG
使用智能体开发套件构建智能体 使用智能体开发套件构建和部署智能体。 智能体开发套件 - 部署到 Agent Runtime
使用 OSS 框架构建智能体 使用 OneTwo 开源框架构建和部署代理。 博文 - OneTwo 和 Agent Runtime:探索 上的高级 AI 智能体开发 Google Cloud
使用 LangGraph 开源框架构建和部署代理。 Agent Platform SDK (Python) 笔记本 - 使用 Agent Runtime 构建和部署 LangGraph 应用
调试和优化代理 使用 OpenTelemetry 和 Cloud Trace 构建和跟踪代理。 Agent Platform SDK (Python) 笔记本 - 调试和优化智能体:Agent Runtime 中的跟踪指南
使用 A2A protocol 构建多智能体系统(预览版) 构建可互操作的智能体,使其能够与其他智能体进行通信和协作,而无需考虑其框架。 如需了解详情,请参阅 A2A protocol 文档

企业级安全

Agent Runtime 支持多项功能,可帮助您满足企业安全要求、遵守组织的安全政策,并遵循安全最佳实践。支持以下功能:

下表显示了每个 Agent Platform 服务支持哪些企业安全功能:

安全功能 Agent Runtime 会话 记忆库 Example Store 代码执行
VPC Service Controls
客户管理的加密密钥
数据驻留 (DRZ)(静态)
HIPAA
Access Transparency
Access Approval

支持的区域

如需查看 Agent Runtime 支持的区域列表,请参阅 位置

Quota

如需了解 Agent Runtime 配额信息,请参阅配额和系统 限制

价格

Agent Runtime 提供免费层级。如需了解 Agent Runtime 的价格,请参阅 Gemini Enterprise Agent Platform 价格

迁移到基于客户端的 SDK

Agent Platform SDK 中的 agent_engines 模块正在重构为基于客户端的设计,主要原因如下:

  • 为了与 智能体开发套件 (ADK) 和 Google Gen AI SDK 在规范类型表示方面保持一致。这可确保以一致且标准化的方式在不同 SDK 中表示数据类型,从而简化互操作性并减少转换开销。
  • 用于在多项目 多位置应用中对 Google Cloud 参数进行客户端级范围限定。这样,应用就可以通过为每个客户端实例配置特定的 项目和位置信息设置,来管理与不同 Google Cloud 项目和 地理位置的资源之间的互动。
  • 提高 Agent Runtime 服务的可发现性和凝聚力

后续步骤

指南

设置环境以使用 Agent Platform 运行时。

资源

获取 Agent Platform 开发支持。