管理已部署的代理

本页介绍了如何管理已部署到 Vertex AI Agent Engine 托管运行时的代理。在 Vertex AI 中，已部署的代理是 reasoningEngine 类型的资源。

列出已部署的代理

列出给定项目和位置的所有已部署代理：

控制台

在 Google Cloud 控制台中，前往 Vertex AI Agent Engine 页面。

前往 Agent Engine

属于所选项目的已部署代理会显示在列表中。您可以使用过滤字段按指定列过滤列表。

Python 版 Vertex AI SDK

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

for agent in client.agent_engines.list():
    print(agent)

如需按 display_name 过滤列表，请执行以下操作：

for agent in client.agent_engines.list(
    config={
        "filter": 'display_name="DISPLAY_NAME"',
    },
):
    print(agent)

REST

调用 reasoningEngines.list 方法。

在使用任何请求数据之前，请先进行以下替换：

PROJECT_ID：您的 GCP 项目 ID
LOCATION：支持的区域

HTTP 方法和网址：

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

如需发送您的请求，请展开以下选项之一：

curl（Linux、macOS 或 Cloud Shell）

注意：以下命令假定您已使用您的用户账号通过运行 gcloud init 或 gcloud auth login 登录 gcloud CLI，或者使用了 Cloud Shell，这会使您自动登录 gcloud CLI。您可以运行 gcloud auth list 来检查当前活跃的账号。

执行以下命令：

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines"

PowerShell (Windows)

注意：以下命令假定您已使用您的用户账号通过运行 gcloud init 或 gcloud auth login 登录 gcloud CLI。您可以运行 gcloud auth list 来检查当前活跃的账号。

执行以下命令：

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines" | Select-Object -Expand Content

您应该会收到一个成功的状态代码 (2xx) 和一个空响应。

获取已部署的代理

每个已部署的代理都有一个唯一的 RESOURCE_ID 标识符。如需了解详情，请参阅部署代理。

控制台

在 Google Cloud 控制台中，前往 Vertex AI Agent Engine 页面。

前往 Agent Engine

属于所选项目的已部署代理会显示在列表中。您可以使用过滤字段按指定列过滤列表。
点击指定代理的名称。系统会打开相应代理的指标页面。
（可选）如需查看代理的部署详细信息，请点击部署详细信息。系统会打开部署详情窗格。如需关闭该窗格，请点击完成。
（可选）如需查看代理的 query 和 streamQuery 网址，请点击 API 网址。系统随即会打开 API 网址窗格。如需关闭该窗格，请点击完成。

Python 版 Vertex AI SDK

通过以下代码，您可以获取特定的已部署代理：

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

remote_agent = client.agent_engines.get(
    name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

调用 reasoningEngines.get 方法。

在使用任何请求数据之前，请先进行以下替换：

PROJECT_ID：您的 GCP 项目 ID
LOCATION：支持的区域
RESOURCE_ID：已部署代理的资源 ID

HTTP 方法和网址：

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

如需发送您的请求，请展开以下选项之一：

curl（Linux、macOS 或 Cloud Shell）

执行以下命令：

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell (Windows)

注意：以下命令假定您已使用您的用户账号通过运行 gcloud init 或 gcloud auth login 登录 gcloud CLI。您可以运行 gcloud auth list 来检查当前活跃的账号。

执行以下命令：

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

您应该会收到一个成功的状态代码 (2xx) 和一个空响应。

更新已部署的代理

您可以同时更新已部署代理的一个或多个字段，但必须至少指定一个要更新的字段。更新已部署的代理所需的时间取决于所执行的更新，但通常需要几秒到几分钟。

控制台

在 Google Cloud 控制台中，前往 Vertex AI Agent Engine 页面。

前往 Agent Engine
点击指定代理对应的更多操作菜单 ()。
点击修改。系统会打开相应代理的修改窗格。
修改代理的显示名称或说明。
点击保存。

Python 版 Vertex AI SDK

如需将已部署的代理（对应于 RESOURCE_NAME）更新为更新后的代理（对应于 UPDATED_AGENT），请执行以下操作：

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.update(
    name=RESOURCE_NAME,                    # Required.
    agent=UPDATED_AGENT,                   # Optional.
    config={                                                # Optional.
        "requirements": REQUIREMENTS,      # Optional.
        "display_name": "DISPLAY_NAME",    # Optional.
        "description": "DESCRIPTION",      # Optional.
        "extra_packages": EXTRA_PACKAGES,  # Optional.
    },
)

这些参数与部署代理时使用的参数相同。

REST

调用 reasoningEngines.patch 方法并提供 update_mask 以指定要更新的字段。

在使用任何请求数据之前，请先进行以下替换：

PROJECT_ID：您的 GCP 项目 ID
LOCATION：支持的区域
RESOURCE_ID：已部署代理的资源 ID
update_mask：要更新的以英文逗号分隔的字段列表

HTTP 方法和网址：

PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"

请求 JSON 正文：

{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}

如需发送您的请求，请展开以下选项之一：

curl（Linux、macOS 或 Cloud Shell）

将请求正文保存在名为 request.json 的文件中，然后执行以下命令：

curl -X PATCH \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description""

PowerShell (Windows)

注意：以下命令假定您已使用您的用户账号通过运行 gcloud init 或 gcloud auth login 登录 gcloud CLI。您可以运行 gcloud auth list 来检查当前活跃的账号。

将请求正文保存在名为 request.json 的文件中，然后执行以下命令：

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method PATCH `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"" | Select-Object -Expand Content

您应该会收到一个成功的状态代码 (2xx) 和一个空响应。

为已部署的代理配置遥测

如果您在代理开发期间启用了轨迹，则可以使用 Google Cloud 控制台为已部署的代理配置遥测。

为已部署且启用了遥测功能的代理配置遥测：

在 Google Cloud 控制台中，前往 Vertex AI Agent Engine 页面。

前往 Agent Engine

属于所选项目的 Agent Engine 实例会显示在列表中。您可以使用过滤字段按指定列过滤列表。
找到 Agent Engine 实例对应的行。在遥测配置列下，点击配置。系统会打开服务配置面板。
您可以进行以下配置：
- 可观测性：您可以配置以下内容：
  - 启用 OpenTelemetry 跟踪记录和日志的插桩：如需填充代理可观测性信息中心和跟踪记录页面，请点击切换开关，将其切换到开启位置。
  - 启用提示输入和回答输出的日志记录：如需收集并存储用户提示和回答的完整内容，请点击相应切换开关，将其切换到开启位置。
  如果您的代理停用了遥测数据收集功能，您需要重新部署代理并将 Vertex AI SDK 版本更新为 >= 1.126.1，才能查看可观测性的配置选项。
- 容器：为已部署的代理配置容器设置：
  - 扩缩：输入实例数下限和实例数上限。
  - 资源：为每个容器选择内存和 CPU 的限制。
  - 容器并发：输入实例数下限，以设置每个容器和代理服务器的并发数。建议值为 (2 * CPU + 1)，默认值为 9。
- 访问权限：点击 IAM 中的管理权限，以管理关联服务账号的代理权限。
- 部署详情：查看智能体的部署详情，包括资源名称和显示名称。
- 记忆库：查看智能体的记忆库详细信息，包括记忆生成和记忆搜索。
点击更新或关闭。

查看已部署代理的指标

对于已部署的代理，您可以使用控制台查看代理的指标：

在 Google Cloud 控制台中，前往 Vertex AI Agent Engine 页面。

前往 Agent Engine

属于所选项目的已部署代理会显示在列表中。您可以使用过滤字段按指定列过滤列表。
点击代理的名称。系统会显示所选代理的信息中心。
选择以下任一信息中心标签页：
- 概览：查看代理的指标摘要信息中心，包括代理延迟时间、代理请求数和代理错误率。
- 模型：查看代理模型指标的信息中心，包括模型调用次数、模型错误率和模型令牌使用情况。
- 工具：查看代理工具的指标信息中心，包括工具调用次数、工具错误率和工具延迟时间。
- 使用情况：查看代理使用情况的指标信息中心，包括输入和输出的令牌使用情况、容器 CPU 分配和容器内存分配。
- 日志：如果您为代理启用了 Cloud Logging，则可查看代理的日志。

Vertex AI Agent Engine 信息中心

删除已部署的代理

从 Vertex AI Agent Engine 托管式运行时中删除已部署的代理。

控制台

在 Google Cloud 控制台中，前往 Vertex AI Agent Engine 页面。

前往 Agent Engine
点击指定代理对应的更多操作菜单 ()。
点击删除。
点击删除代理。

Python 版 Vertex AI SDK

如果您已有所部署代理的实例（作为 remote_agent），则可以运行以下命令：

remote_agent.delete(
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

或者，您也可以通过以下方式调用 agent_engines.delete() 来删除与 RESOURCE_NAME 对应的已部署代理：

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.delete(
    name=RESOURCE_NAME,
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

REST

调用 reasoningEngines.delete 方法。

在使用任何请求数据之前，请先进行以下替换：

PROJECT_ID：您的 GCP 项目 ID
LOCATION：支持的区域
RESOURCE_ID：已部署代理的资源 ID

HTTP 方法和网址：

DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

如需发送您的请求，请展开以下选项之一：

curl（Linux、macOS 或 Cloud Shell）

执行以下命令：

curl -X DELETE \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell (Windows)

注意：以下命令假定您已使用您的用户账号通过运行 gcloud init 或 gcloud auth login 登录 gcloud CLI。您可以运行 gcloud auth list 来检查当前活跃的账号。

执行以下命令：

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method DELETE `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

您应该会收到一个成功的状态代码 (2xx) 和一个空响应。

管理已部署的代理 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

列出已部署的代理

控制台

Python 版 Vertex AI SDK

REST

curl（Linux、macOS 或 Cloud Shell）

PowerShell (Windows)

获取已部署的代理

控制台

Python 版 Vertex AI SDK

REST

curl（Linux、macOS 或 Cloud Shell）

PowerShell (Windows)

更新已部署的代理

控制台

Python 版 Vertex AI SDK

REST

curl（Linux、macOS 或 Cloud Shell）

PowerShell (Windows)

为已部署的代理配置遥测

查看已部署代理的指标

删除已部署的代理

控制台

Python 版 Vertex AI SDK

REST

curl（Linux、macOS 或 Cloud Shell）

PowerShell (Windows)

后续步骤

管理已部署的代理