A observabilidade de agentes na Plataforma de agentes do Gemini Enterprise oferece visibilidade abrangente sobre a performance, o comportamento e a integridade dos agentes implantados e dos servidores do Protocolo de Contexto de Modelo (MCP, na sigla em inglês). Ao monitorar as principais métricas, rastrear caminhos de execução e observar o sistema multiagente como um todo, é possível diagnosticar problemas, otimizar o consumo de recursos e melhorar a confiabilidade dos agentes.
Este documento oferece uma visão geral das ferramentas de observabilidade disponíveis na Plataforma de agentes do Gemini Enterprise, incluindo a topologia de todo o sistema, o monitoramento de agentes individuais e as métricas do servidor MCP.
Configuração de telemetria
Para preencher esses painéis, topologias e traces de observabilidade, os agentes precisam ser configurados para enviar dados de telemetria no formato OpenTelemetry para sistemas de armazenamento no Google Cloud Observability.
Verifique se os ambientes de agente e servidor MCP estão configurados corretamente para emitir esses dados. Os componentes integrados emitem telemetria automaticamente no formato OpenTelemetry. Google Cloud Por exemplo, o Model Armor emite telemetria padronizada de forma nativa, permitindo que você exponha e monitore interceptações de políticas em tempo real diretamente nos dados de trace, sem exigir instrumentação personalizada.
Para instruções e requisitos de configuração de telemetria do agente, consulte os seguintes recursos:
- Para instrumentar agentes criados com o ADK, consulte Instrumentar aplicativos do ADK com o OpenTelemetry.
- Para instrumentar agentes no ambiente de execução de agentes que não foram criados com o ADK, consulte Instrumentar aplicativos de IA generativa.
- Para telemetria do servidor MCP, consulte Usar o Cloud Trace para monitorar o uso da ferramenta MCP.
- Para telemetria do Model Armor, consulte Configurar a geração de registros do Model Armor.
Topologia do agente
A visualização de topologia multiagente oferece um mapa visual de todo o sistema da arquitetura multiagente. Ela mostra as relações e os fluxos de tráfego em tempo real em todos os agentes e servidores MCP conhecidos pelo Agent Registry. Essa visualização agregada ajuda a entender dependências complexas e identificar possíveis gargalos no ecossistema.
Além da visualização de topologia multiagente, também é possível conferir as dependências específicas de entrada e saída de um único agente. Essa visualização de topologia de agente único é baseada em dados de trace do agente selecionado.
Para instruções detalhadas sobre como navegar e interpretar gráficos de topologia de agentes, consulte Conferir relações e topologia de agentes.
Indicadores de observabilidade
A Plataforma de agentes do Gemini Enterprise oferece observabilidade por meio de métricas, traces e registros.
Ao selecionar um agente específico no registro, a guia Observabilidade oferece um conjunto de painéis direcionados para monitorar a integridade operacional, a performance e a utilização da infraestrutura. Use a navegação à esquerda na guia Observabilidade para alternar entre as seguintes visualizações:
- Visão geral:acompanha o uso de alto nível no período selecionado, incluindo o total de sessões, a média de turnos por sessão e o total de invocações de agentes. Os gráficos de séries temporais mostram o uso de tokens (entrada versus saída), o volume geral de tráfego de agentes, os percentis de latência (p50, p95, p99) e as taxas de erro.
- Avaliação:mostra monitores on-line para avaliação contínua da qualidade. Isso inclui widgets de séries temporais que rastreiam a qualidade média da resposta, as métricas de segurança, as taxas de alucinação e a qualidade do uso da ferramenta.
- Modelos:detalha o desempenho pelo modelo de fundação subjacente. É possível monitorar a latência p95, o número total de chamadas, as taxas de erro, as falhas de cota e o uso de tokens isolados por modelos específicos.
- Ferramentas:monitora as ferramentas e os serviços externos conectados ao agente. Essa visualização detalha a latência p95, o número de chamadas e as taxas de erro por ferramenta, bem como a frequência de interações em que nenhuma ferramenta foi chamada.
- Uso:fornece métricas de infraestrutura para o ambiente de execução do agente, incluindo alocação de CPU e memória do contêiner e uso de tokens.
- Registros:mostra um fluxo filtrável de registros de agentes brutos, incluindo gravidade, carimbos de data/hora e resumos de execução para solução de problemas detalhada. Para mais informações, consulte Visualizar registros de agentes.
Além dos painéis na guia Observabilidade, é possível usar a guia Traces do agente para inspecionar a execução detalhada de sessões específicas, incluindo gráficos acíclicos direcionados de intervalos e entradas/saídas. Para mais informações, consulte Visualizar traces de agentes. Também é possível usar a guia Topologia para conferir as dependências específicas de entrada e saída desse único agente.
Para servidores MCP, é possível monitorar a contagem de solicitações e a duração da solicitação p95 para acompanhar a utilização e a capacidade de resposta.
Convenções de IA generativa do OpenTelemetry
Os traces de agentes e os registros de comandos e respostas dependem muito das convenções semânticas do OpenTelemetry para sistemas de IA generativa a fim de padronizar como a telemetria de IA generativa é capturada, estruturada e informada.
A adesão a essas convenções é fundamental para o rastreamento de agentes, porque estabelece um formato universal e independente de fornecedor para descrever fluxos de trabalho de agentes complexos e de várias etapas, como execuções de ferramentas, etapas de recuperação e consumo de tokens. Essa padronização ajuda a interoperabilidade perfeita em diferentes back-ends de observabilidade e ferramentas de análise, tanto dentro quanto fora do Google Cloud.
A seguir
- Conferir relações de agentes como um gráfico de topologia.
- Conferir traces de agentes para depurar o comportamento deles.
- Avaliar seus agentes.