Gerenciar agentes implantados

Nesta página, descrevemos como gerenciar agentes implantados no ambiente de execução gerenciado do Vertex AI Agent Engine. Os agentes implantados são recursos do tipo reasoningEngine na Vertex AI.

Listar agentes implantados

Liste todos os agentes implantados em um determinado projeto e local:

Console

No console Google Cloud , acesse a página Vertex AI Agent Engine.

Acessar o Agent Engine

Os agentes implantados que fazem parte do projeto selecionado aparecem na lista. Use o campo Filtro para filtrar a lista pela coluna especificada.

SDK da Vertex AI para Python

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

for agent in client.agent_engines.list():
    print(agent)

Para filtrar a lista por display_name:

for agent in client.agent_engines.list(
    config={
        "filter": 'display_name="DISPLAY_NAME"',
    },
):
    print(agent)

REST

Chame o método reasoningEngines.list.

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

PROJECT_ID: ID do projeto do GCP
LOCATION: uma região compatível

Método HTTP e URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

Para enviar a solicitação, expanda uma destas opções:

curl (Linux, macOS ou Cloud Shell)

Observação: o comando a seguir pressupõe que você tenha feito login na CLI do gcloud com sua conta de usuário executando gcloud init ou gcloud auth login, ou usando o Cloud Shell, que faz login automaticamente na CLI gcloud. . Para saber qual é a conta ativa no momento, execute o comando gcloud auth list.

Execute o seguinte comando:

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines"

PowerShell (Windows)

Observação: o comando a seguir pressupõe que você tenha feito login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login . Para saber qual é a conta ativa no momento, execute o comando gcloud auth list.

execute o seguinte comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines" | Select-Object -Expand Content

Você receberá um código de status bem-sucedido (2xx) e uma resposta vazia.

Receber um agente implantado

Cada agente implantado tem um identificador RESOURCE_ID exclusivo. Para saber mais, consulte Implantar um agente.

Console

No console Google Cloud , acesse a página Vertex AI Agent Engine.

Acessar o Agent Engine

Os agentes implantados que fazem parte do projeto selecionado aparecem na lista. Use o campo Filtro para filtrar a lista pela coluna especificada.
Clique no nome do agente especificado. A página Métricas do agente é aberta.
(Opcional) Para conferir os detalhes da implantação do agente, clique em Detalhes da implantação. O painel Detalhes da implantação será aberto. Para fechar o painel, clique em Concluído.
(Opcional) Para conferir os URLs query e streamQuery do agente, clique em URLs da API. O painel URLs da API será aberto. Para fechar o painel, clique em Concluído.

SDK da Vertex AI para Python

O código a seguir permite receber um agente implantado específico:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

remote_agent = client.agent_engines.get(
    name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Chame o método reasoningEngines.get.

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

PROJECT_ID: ID do projeto do GCP
LOCATION: uma região compatível
RESOURCE_ID: o ID do recurso do agente implantado

Método HTTP e URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Para enviar a solicitação, expanda uma destas opções:

curl (Linux, macOS ou Cloud Shell)

Execute o seguinte comando:

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell (Windows)

execute o seguinte comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

Você receberá um código de status bem-sucedido (2xx) e uma resposta vazia.

Atualizar um agente implantado

É possível atualizar um ou mais campos do agente implantado ao mesmo tempo, mas é necessário especificar pelo menos um dos campos a serem atualizados. O tempo necessário para atualizar o agente implantado depende da atualização que está sendo realizada, mas geralmente leva de alguns segundos a alguns minutos.

Console

No console Google Cloud , acesse a página Vertex AI Agent Engine.

Acessar o Agent Engine
No agente especificado, clique no menu mais ações ().
Clique em Editar. O painel Editar do agente é aberto.
Edite o Nome de exibição ou a Descrição do agente.
Clique em Salvar.

SDK da Vertex AI para Python

Para atualizar um agente implantado (correspondente a RESOURCE_NAME) para um agente atualizado (correspondente a UPDATED_AGENT):

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.update(
    name=RESOURCE_NAME,                    # Required.
    agent=UPDATED_AGENT,                   # Optional.
    config={                                                # Optional.
        "requirements": REQUIREMENTS,      # Optional.
        "display_name": "DISPLAY_NAME",    # Optional.
        "description": "DESCRIPTION",      # Optional.
        "extra_packages": EXTRA_PACKAGES,  # Optional.
    },
)

Os argumentos são os mesmos de quando você implanta um agente.

REST

Chame o método reasoningEngines.patch e forneça um update_mask para especificar quais campos serão atualizados.

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

PROJECT_ID: ID do projeto do GCP
LOCATION: uma região compatível
RESOURCE_ID: o ID do recurso do agente implantado
update_mask: uma lista de campos separados por vírgulas a serem atualizados

Método HTTP e URL:

PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"

Corpo JSON da solicitação:

{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}

Para enviar a solicitação, expanda uma destas opções:

curl (Linux, macOS ou Cloud Shell)

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X PATCH \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description""

PowerShell (Windows)

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method PATCH `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"" | Select-Object -Expand Content

Você receberá um código de status bem-sucedido (2xx) e uma resposta vazia.

Configurar a telemetria do agente implantado

Se você ativou os rastreamentos durante o desenvolvimento do agente, use o console do Google Cloud para configurar a telemetria do agente implantado.

Configure a telemetria para agentes implantados com a telemetria ativada:

No console Google Cloud , acesse a página Vertex AI Agent Engine.

Acessar o Agent Engine

As instâncias do Agent Engine que fazem parte do projeto selecionado aparecem na lista. Use o campo Filtro para filtrar a lista pela coluna especificada.
Encontre a linha da sua instância do Agent Engine. Na coluna Configuração de telemetria, clique em Configurar. O painel Configuração do serviço é aberto.
Você pode fazer as seguintes configurações:
- Observabilidade: é possível configurar o seguinte:
  - Ative a instrumentação de traces e registros do OpenTelemetry: para preencher o painel de observabilidade do agente e as páginas de rastreamento, clique no botão para a posição "Ativado".
  - Ativar a geração de registros de entradas de comandos e saídas de respostas: para coletar e armazenar o conteúdo completo dos comandos e respostas dos usuários, clique na chave para a posição ativada.
  Se a coleta de telemetria estiver desativada para seu agente, será necessário reimplantar o agente e atualizar a versão do SDK da Vertex AI para >= 1.126.1 para ver as opções de configuração da observabilidade.
- Contêineres: configure as configurações de contêiner para o agente implantado:
  - Escalonamento: insira um Número mínimo de instâncias e um Número máximo de instâncias.
  - Recursos: selecione limites para Memória e CPU de cada contêiner.
  - Simultaneidade de contêineres: insira um Número mínimo de instâncias para definir a simultaneidade de cada contêiner e servidor de agente. O valor recomendado é (2 * CPU + 1), e o valor padrão é 9.
- Acesso e permissões: clique em Gerenciar permissões no IAM para gerenciar permissões do agente na conta de serviço associada.
- Detalhes da implantação: veja detalhes da implantação do agente, incluindo Nome do recurso e Nome de exibição.
- Banco de memória: confira os detalhes do Banco de memória do agente, incluindo Geração de memória e Pesquisa na memória.
Clique em Atualizar ou Fechar.

Ver métricas do seu agente implantado

Para agentes implantados, use o console para conferir as métricas do seu agente:

No console Google Cloud , acesse a página Vertex AI Agent Engine.

Acessar o Agent Engine

Os agentes implantados que fazem parte do projeto selecionado aparecem na lista. Use o campo Filtro para filtrar a lista pela coluna especificada.
Clique no nome do agente. O painel do agente selecionado é exibido.
Selecione uma das seguintes guias Painel:
- Visão geral: confira um painel de resumo das métricas do seu agente, incluindo latência, contagem de solicitações e taxa de erros.
- Modelos: confira um painel de métricas do modelo do seu agente, incluindo o número de chamadas, a taxa de erros e o uso de tokens.
- Ferramentas: confira um painel de métricas das ferramentas do seu agente, incluindo número de chamadas de ferramentas, taxa de erros e latência.
- Uso: confira um painel de métricas sobre o uso do seu agente, incluindo uso de tokens por entrada e saída, alocação de CPU e memória de contêineres.
- Registros: veja os registros do seu agente se você ativou o Cloud Logging para ele.

Painel do Vertex AI Agent Engine

Excluir um agente implantado

Excluir um agente implantado do ambiente de execução gerenciado do Vertex AI Agent Engine.

Console

No console Google Cloud , acesse a página Vertex AI Agent Engine.

Acessar o Agent Engine
No agente especificado, clique no menu mais ações ().
Clique em Excluir.
Clique em Excluir agente.

SDK da Vertex AI para Python

Se você já tiver uma instância do agente implantado (como remote_agent), execute o seguinte comando:

remote_agent.delete(
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

Como alternativa, chame agent_engines.delete() para excluir o agente implantado correspondente a RESOURCE_NAME da seguinte maneira:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.delete(
    name=RESOURCE_NAME,
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

REST

Chame o método reasoningEngines.delete.

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

PROJECT_ID: ID do projeto do GCP
LOCATION: uma região compatível
RESOURCE_ID: o ID do recurso do agente implantado

Método HTTP e URL:

DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Para enviar a solicitação, expanda uma destas opções:

curl (Linux, macOS ou Cloud Shell)

Execute o seguinte comando:

curl -X DELETE \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell (Windows)

execute o seguinte comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method DELETE `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

Você receberá um código de status bem-sucedido (2xx) e uma resposta vazia.

Gerenciar agentes implantados Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Listar agentes implantados

Console

SDK da Vertex AI para Python

REST

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

Receber um agente implantado

Console

SDK da Vertex AI para Python

REST

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

Atualizar um agente implantado

Console

SDK da Vertex AI para Python

REST

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

Configurar a telemetria do agente implantado

Ver métricas do seu agente implantado

Excluir um agente implantado

Console

SDK da Vertex AI para Python

REST

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

A seguir

Gerenciar agentes implantados