L'osservabilità degli agenti nella piattaforma Gemini Enterprise Agent offre una visibilità completa su prestazioni, comportamento e integrità degli agenti di cui è stato eseguito il deployment e dei server Model Context Protocol (MCP). Monitorando le metriche chiave, tracciando i percorsi di esecuzione e osservando il sistema multi-agente nel suo complesso, puoi diagnosticare i problemi, ottimizzare il consumo di risorse e migliorare l'affidabilità degli agenti.
Questo documento fornisce una panoramica degli strumenti di osservabilità disponibili nella piattaforma Gemini Enterprise Agent, tra cui la topologia a livello di sistema, il monitoraggio dei singoli agenti e le metriche del server MCP.
Configurazione della telemetria
Per compilare queste dashboard, topologie e tracce di osservabilità, gli agenti devono essere configurati per inviare dati di telemetria in formato OpenTelemetry ai sistemi di archiviazione in Google Cloud Observability.
Assicurati che gli ambienti dell'agente e del server MCP siano configurati correttamente per emettere questi dati. I componenti Google Cloud integrati emettono automaticamente dati di telemetria nel formato OpenTelemetry. Ad esempio, Model Armor emette in modo nativo telemetria standardizzata, consentendoti di esporre e monitorare senza problemi le intercettazioni dei criteri in tempo reale direttamente all'interno dei dati di traccia senza richiedere strumentazione personalizzata.
Per le istruzioni e i requisiti di configurazione della telemetria dell'agente, consulta le seguenti risorse:
- Per instrumentare gli agenti creati con ADK, consulta Instrumentare le applicazioni ADK con OpenTelemetry.
- Per instrumentare gli agenti su Agent Runtime che non sono stati creati con ADK, consulta Instrumentare le applicazioni di AI generativa.
- Per la telemetria del server MCP, consulta Utilizzare Cloud Trace per monitorare l'utilizzo dello strumento MCP.
- Per la telemetria di Model Armor, vedi Configura la registrazione nel log di Model Armor.
Topologia dell'agente
La visualizzazione della topologia multi-agente fornisce una mappa visiva a livello di sistema dell'architettura del sistema multi-agente. Mostra le relazioni e i flussi di traffico in tempo reale tra tutti gli agenti e i server MCP noti al tuo Agent Registry. Questa visualizzazione aggregata ti aiuta a comprendere le dipendenze complesse e a identificare i potenziali colli di bottiglia nel tuo ecosistema.
Oltre alla visualizzazione della topologia multi-agente, puoi anche visualizzare le dipendenze in entrata e in uscita specifiche per un singolo agente. Questa visualizzazione della topologia con un singolo agente si basa sui dati di traccia dell'agente selezionato.
Per istruzioni dettagliate su come navigare e interpretare i grafici della topologia degli agenti, vedi Visualizzare le relazioni e la topologia degli agenti.
Indicatori di osservabilità
La piattaforma agentica Gemini Enterprise fornisce osservabilità tramite metriche, tracce e log.
Quando selezioni un agente specifico dal registro, la scheda Osservabilità fornisce una suite di dashboard mirate per monitorare l'integrità operativa, le prestazioni e l'utilizzo dell'infrastruttura. Utilizza il menu di navigazione a sinistra all'interno della scheda Osservabilità per passare da una visualizzazione all'altra:
- Panoramica:monitora l'utilizzo di alto livello nel periodo di tempo selezionato, inclusi sessioni totali, turni medi per sessione e invocazioni totali dell'agente. I grafici delle serie temporali mostrano l'utilizzo dei token (input e output), il volume complessivo del traffico dell'agente, i percentili di latenza (p50, p95, p99) e i tassi di errore.
- Valutazione:mostra i monitor online per la valutazione continua della qualità. Sono inclusi widget delle serie temporali che monitorano la qualità media delle risposte, le metriche di sicurezza, i tassi di allucinazione e la qualità dell'utilizzo degli strumenti.
- Modelli:suddivide il rendimento in base al foundation model sottostante. Puoi monitorare la latenza p95, il numero totale di chiamate, i tassi di errore, gli errori di quota e l'utilizzo dei token isolati per modelli specifici.
- Strumenti:monitora gli strumenti e i servizi esterni connessi all'agente. Questa visualizzazione mostra in dettaglio la latenza p95, i conteggi delle chiamate e i tassi di errore per strumento, nonché la frequenza delle interazioni in cui non è stato chiamato alcun strumento.
- Utilizzo:fornisce metriche a livello di infrastruttura per l'ambiente di runtime dell'agente, tra cui allocazione della CPU del container, allocazione della memoria del container e utilizzo dei token.
- Log:mostra un flusso filtrabile di log dell'agente non elaborati, inclusi gravità, timestamp e riepiloghi di esecuzione per la risoluzione dei problemi in dettaglio. Per saperne di più, consulta Visualizzare i log dell'agente.
Oltre alle dashboard nella scheda Osservabilità, puoi utilizzare la scheda Tracce dell'agente per ispezionare l'esecuzione passo passo di sessioni specifiche, inclusi i grafi aciclici diretti di span e input/output. Per maggiori informazioni, vedi Visualizzare le tracce dell'agente. Puoi anche utilizzare la scheda Topologia per visualizzare le dipendenze in entrata e in uscita specifiche per un singolo agente.
Per i server MCP, puoi monitorare il conteggio delle richieste e la durata delle richieste p95 per monitorare l'utilizzo e la reattività.
Convenzioni di OpenTelemetry per l'AI generativa
Le tracce degli agenti e i log di prompt e risposte si basano in gran parte sulle Convenzioni semantiche di OpenTelemetry per i sistemi di AI generativa per standardizzare il modo in cui la telemetria dell'AI generativa viene acquisita, strutturata e segnalata.
Il rispetto di queste convenzioni è fondamentale per il tracciamento degli agenti perché stabilisce un formato universale e indipendente dal fornitore per descrivere flussi di lavoro complessi e in più passaggi degli agenti, come esecuzioni di strumenti, passaggi di recupero e consumo di token. Questa standardizzazione consente un'interoperabilità perfetta tra diversi backend di osservabilità e strumenti di analisi, sia all'interno che all'esterno di Google Cloud.
Passaggi successivi
- Visualizza le relazioni tra agenti come grafico della topologia.
- Visualizza le tracce dell'agente per eseguire il debug del comportamento dell'agente.
- Valuta i tuoi agenti.