La observabilidad del agente en Agent Platform de Gemini Enterprise proporciona visibilidad integral del rendimiento, el comportamiento y el estado de los agentes implementados y los servidores del Protocolo de contexto del modelo (MCP). Si supervisas las métricas clave, rastreas las rutas de ejecución y observas el sistema multiagente en su totalidad, puedes diagnosticar problemas, optimizar el consumo de recursos y mejorar la confiabilidad de tus agentes.
En este documento, se proporciona una descripción general de las herramientas de observabilidad disponibles en Agent Platform de Gemini Enterprise, incluida la topología en todo el sistema, la supervisión de agentes individuales y las métricas del servidor MCP.
Configuración de telemetría
Para propagar estos paneles, topologías y seguimientos de observabilidad, los agentes deben configurarse para enviar datos de telemetría en formato OpenTelemetry a los sistemas de almacenamiento en Google Cloud Observability.
Asegúrate de que los entornos del agente y del servidor MCP estén configurados correctamente para emitir estos datos. Los componentes integrados emiten automáticamente telemetría en formato OpenTelemetry. Google Cloud Por ejemplo, Model Armor emite telemetría estandarizada de forma nativa, lo que te permite exponer y supervisar sin problemas las intercepciones de políticas en tiempo real directamente dentro de tus datos de seguimiento sin necesidad de instrumentación personalizada.
Para obtener instrucciones y requisitos de configuración de la telemetría del agente, consulta los siguientes recursos:
- Para instrumentar agentes compilados con el ADK, consulta Instrumenta aplicaciones del ADK con OpenTelemetry.
- Para instrumentar agentes en Agent Runtime que no se compilaron con el ADK, consulta Instrumenta aplicaciones de IA generativa.
- Para obtener información sobre la telemetría del servidor MCP, consulta Usa Cloud Trace para supervisar el uso de la herramienta MCP.
- Para obtener información sobre la telemetría de Model Armor, consulta Configura el registro de Model Armor.
Topología del agente
La vista de topología multiagente proporciona un mapa visual de todo el sistema de la arquitectura de tu sistema multiagente. Muestra las relaciones en tiempo real y los flujos de tráfico en todos los agentes y servidores MCP que conoce tu Agent Registry. Esta vista agregada te ayuda a comprender las dependencias complejas y a identificar posibles cuellos de botella en todo tu ecosistema.
Además de la vista de topología multiagente, también puedes ver las dependencias específicas entrantes y salientes de un solo agente. Esta vista de topología de un solo agente se basa en los datos de seguimiento del agente seleccionado.
Para obtener instrucciones detalladas sobre cómo navegar por los gráficos de topología del agente y cómo interpretarlos, consulta Visualiza las relaciones y la topología del agente.
Indicadores de observabilidad
Agent Platform de Gemini Enterprise proporciona observabilidad a través de métricas, seguimientos y registros.
Cuando seleccionas un agente específico del registro, la pestaña Observabilidad proporciona un conjunto de paneles segmentados para supervisar su estado operativo, rendimiento y utilización de la infraestructura. Usa la navegación de la izquierda dentro de la pestaña Observabilidad para alternar entre las siguientes vistas:
- Descripción general: Realiza un seguimiento del uso de alto nivel durante el período seleccionado, incluidas las sesiones totales, los turnos promedio por sesión y las invocaciones totales del agente. Los gráficos de series temporales muestran el uso de tokens (entrada versus salida), el volumen general de tráfico del agente, los percentiles de latencia (p50, p95, p99) y las tasas de error.
- Evaluación: Muestra supervisores en línea para la evaluación continua de la calidad. Esto incluye widgets de series temporales que realizan un seguimiento de la calidad promedio de la respuesta, las métricas de seguridad, las tasas de alucinación y la calidad del uso de herramientas.
- Modelos: Desglosa el rendimiento según el modelo de base subyacente. Puedes supervisar la latencia de p95, los recuentos totales de llamadas, las tasas de error, las fallas de cuota y el uso de tokens aislados por modelos específicos.
- Herramientas: Supervisa las herramientas y los servicios externos conectados al agente. En esta vista, se detallan la latencia de p95, los recuentos de llamadas y las tasas de error por herramienta, así como la frecuencia de las interacciones en las que no se llamó a ninguna herramienta.
- Uso: Proporciona métricas a nivel de la infraestructura para el entorno de ejecución del agente, incluida la asignación de CPU del contenedor, la asignación de memoria del contenedor y el uso de tokens.
- Registros: Muestra un flujo filtrable de registros de agentes sin procesar, incluida la gravedad, las marcas de tiempo y los resúmenes de ejecución para la solución de problemas detallada. Para obtener más información, consulta Visualiza los registros del agente.
Además de los paneles en la pestaña Observabilidad, puedes usar la pestaña Seguimientos del agente para inspeccionar la ejecución paso a paso de sesiones específicas, incluidos los grafos acíclicos dirigidos de intervalos y entradas o salidas. Para obtener más información, consulta Visualiza los seguimientos del agente. También puedes usar la pestaña Topología para ver las dependencias específicas entrantes y salientes de ese agente único.
En el caso de los servidores MCP, puedes supervisar el recuento de solicitudes y la duración de la solicitud de p95 para hacer un seguimiento de la utilización y la capacidad de respuesta.
Convenciones de OpenTelemetry para IA generativa
Los seguimientos de agentes y los registros de solicitud y respuesta dependen en gran medida de las convenciones semánticas de OpenTelemetry para los sistemas de IA generativa para estandarizar la forma en que se captura, estructura y notifica la telemetría de IA generativa.
Cumplir con estas convenciones es fundamental para el seguimiento de agentes, ya que establece un formato universal y agnóstico del proveedor para describir flujos de trabajo complejos y de varios pasos del agente, como ejecuciones de herramientas, pasos de recuperación y consumo de tokens. Esta estandarización ayuda a lograr una interoperabilidad sin problemas en diferentes backends de observabilidad y herramientas de estadísticas, tanto dentro como fuera de Google Cloud.
¿Qué sigue?
- Visualiza las relaciones del agente como un grafo de topología.
- Visualiza los seguimientos del agente para depurar su comportamiento.
- Evalúa tus agentes.