部署代理

如需在 Vertex AI Agent Engine 上部署智能体,请按以下步骤操作:

  1. 完成前提条件
  2. (可选)配置智能体以进行部署
  3. 创建 AgentEngine 实例
  4. (可选)获取智能体资源 ID
  5. (可选)列出支持的操作
  6. (可选)为所部署的智能体授予权限

您还可以使用 Agent Starter Pack 模板进行部署。

前提条件

在部署智能体之前,请确保您已完成以下任务:

  1. 设置您的环境
  2. 开发智能体

(可选)配置智能体以进行部署

您可以为智能体进行以下可选配置:

创建 AgentEngine 实例

如需在 Vertex AI 上部署智能体,请使用 client.agent_engines.create 传入 local_agent 对象以及任何可选配置

remote_agent = client.agent_engines.create(
    agent=local_agent,                                  # Optional.
    config={
        "requirements": requirements,                   # Optional.
        "extra_packages": extra_packages,               # Optional.
        "gcs_dir_name": gcs_dir_name,                   # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
    },
)

部署需要几分钟时间完成,在此期间,系统会在后台执行以下步骤:

  1. 系统会在本地生成以下制品的软件包:

    • *.pkl:与 local_agent 对应的 pickle 文件。
    • requirements.txt:包含软件包要求的文本文件。
    • dependencies.tar.gz:包含任何额外软件包的 tar 文件。
  2. 该软件包会上传到 Cloud Storage(位于相应的文件夹下),用来暂存制品。

  3. PackageSpec 中指定了相应制品的 Cloud Storage URI。

  4. Vertex AI Agent Engine 服务会接收请求,并在后端构建容器并启动 HTTP 服务器。

部署延迟时间取决于安装所需软件包花费的总时间。部署后,remote_agent 对应于在 Vertex AI 上运行的 local_agent 的实例,您可以查询或删除该实例。该实例独立于智能体的本地实例。

remote_agent 对象对应于包含以下属性的 AgentEngine 类:

(可选)获取智能体资源 ID

每个已部署的智能体都有一个唯一标识符。您可以运行以下命令来获取所部署智能体的资源名称:

remote_agent.api_resource.name

响应应如以下字符串所示:

"projects/PROJECT_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"

其中

  • PROJECT_ID 是所部署智能体运行的 Google Cloud 项目 ID

  • LOCATION 是所部署智能体运行所在的区域

  • RESOURCE_ID 是所部署智能体的 ID,以 reasoningEngine 资源的形式表示。

(可选)列出支持的操作

每个已部署的智能体都有一份支持的操作列表。您可以运行以下命令来获取已部署的智能体支持的操作列表:

remote_agent.operation_schemas()

每个操作的架构都是一个字典,用于记录您可以调用的智能体方法的相关信息。支持的操作集取决于您用于开发智能体的框架:

(可选)为所部署的智能体授予权限

如果需要向所部署的智能体授予任何其他权限,请按照为智能体设置身份和权限中的说明操作。

后续步骤