Resumen de observabilidad

La observabilidad de los agentes en Gemini Enterprise Agent Platform proporciona visibilidad integral del rendimiento, el comportamiento y el estado de los agentes implementados y los servidores del Protocolo de contexto del modelo (MCP). Si supervisas las métricas clave, haces un seguimiento de las rutas de ejecución y observas tu sistema multiagente en su totalidad, puedes diagnosticar problemas, optimizar el consumo de recursos y mejorar la confiabilidad de tus agentes.

En este documento, se proporciona una descripción general de las herramientas de observabilidad disponibles en Gemini Enterprise Agent Platform, incluida la topología en todo el sistema, la supervisión de agentes individuales y las métricas del servidor de MCP.

Configuración de la telemetría

Para completar estos paneles, topologías y registros de observabilidad, tus agentes deben configurarse para enviar datos de telemetría en formato OpenTelemetry a los sistemas de almacenamiento en Google Cloud Observability.

Asegúrate de que los entornos de tu agente y servidor de MCP estén configurados correctamente para emitir estos datos. Los componentes Google Cloud integrados emiten automáticamente telemetría en el formato de OpenTelemetry. Por ejemplo, Model Armor emite de forma nativa telemetría estandarizada, lo que te permite exponer y supervisar sin problemas las intercepciones de políticas en tiempo real directamente en tus datos de seguimiento sin necesidad de instrumentación personalizada.

Para obtener instrucciones y requisitos de configuración de la telemetría del agente, consulta los siguientes recursos:

Topología del agente

La vista de topología multiagente proporciona un mapa visual de todo el sistema de la arquitectura de tu sistema multiagente. Muestra las relaciones y los flujos de tráfico en tiempo real entre todos los agentes y servidores de MCP conocidos por tu registro de agentes. Esta vista agregada te ayuda a comprender las dependencias complejas y a identificar posibles cuellos de botella en todo tu ecosistema.

Además de la vista de topología multiagente, también puedes ver las dependencias específicas entrantes y salientes de un solo agente. Esta vista de topología de un solo agente se basa en los datos de registro del agente seleccionado.

Para obtener instrucciones detalladas sobre cómo navegar por los gráficos de topología del agente y cómo interpretarlos, consulta Cómo ver las relaciones y la topología del agente.

Indicadores de observabilidad

Gemini Enterprise Agent Platform proporciona observabilidad a través de métricas, registros y seguimientos.

Cuando seleccionas un agente específico del registro, la pestaña Observabilidad proporciona un conjunto de paneles segmentados para supervisar su estado operativo, rendimiento y utilización de la infraestructura. Usa la navegación de la izquierda en la pestaña Observabilidad para alternar entre las siguientes vistas:

  • Resumen: Realiza un seguimiento del uso general durante el período seleccionado, incluidas las sesiones totales, los turnos promedio por sesión y las invocaciones totales del agente. Los gráficos de series temporales muestran el uso de tokens (entrada en comparación con salida), el volumen general de tráfico del agente, los percentiles de latencia (p50, p95 y p99) y las tasas de error.
  • Evaluación: Muestra monitores en línea para la evaluación continua de la calidad. Esto incluye widgets de series temporales que hacen un seguimiento de la calidad promedio de las respuestas, las métricas de seguridad, las tasas de alucinación y la calidad del uso de herramientas.
  • Modelos: Desglosa el rendimiento según el modelo de base subyacente. Puedes supervisar la latencia del percentil 95, los recuentos totales de llamadas, las tasas de error, las fallas de cuota y el uso de tokens aislados por modelos específicos.
  • Herramientas: Supervisa las herramientas y los servicios externos conectados al agente. En esta vista, se detallan la latencia del percentil 95, los recuentos de llamadas y las tasas de error por herramienta, así como la frecuencia de las interacciones en las que no se llamó a ninguna herramienta.
  • Uso: Proporciona métricas a nivel de la infraestructura para el entorno de ejecución del agente, incluida la asignación de CPU y memoria del contenedor, y el uso de tokens.
  • Registros: Muestra un flujo filtrable de registros sin procesar del agente, incluidos la gravedad, las marcas de tiempo y los resúmenes de ejecución para la solución de problemas detallada. Para obtener más información, consulta Cómo ver los registros del agente.

Además de los paneles en la pestaña Observabilidad, puedes usar la pestaña Traces del agente para inspeccionar la ejecución paso a paso de sesiones específicas, incluidos los grafos acíclicos dirigidos de intervalos y entradas/salidas. Para obtener más información, consulta Cómo ver los registros de seguimiento del agente. También puedes usar la pestaña Topology para ver las dependencias específicas entrantes y salientes de ese agente único.

En el caso de los servidores de MCP, puedes supervisar el recuento de solicitudes y la duración de la solicitud de p95 para hacer un seguimiento de la utilización y la capacidad de respuesta.

Convenciones de OpenTelemetry para la IA generativa

Los registros de seguimiento del agente y de instrucciones y respuestas dependen en gran medida de las Convenciones semánticas de OpenTelemetry para sistemas de IA generativa para estandarizar la forma en que se captura, estructura y registra la telemetría de la IA generativa.

Cumplir con estas convenciones es fundamental para el seguimiento de agentes, ya que establece un formato universal y sin dependencias del proveedor para describir flujos de trabajo complejos de varios pasos, como ejecuciones de herramientas, pasos de recuperación y consumo de tokens. Esta estandarización ayuda a lograr una interoperabilidad fluida en diferentes backends de observabilidad y herramientas de análisis, tanto dentro como fuera de Google Cloud.

¿Qué sigue?