Panoramica sull'osservabilità

L'osservabilità degli agenti nella piattaforma Gemini Enterprise Agent offre una visibilità completa su prestazioni, comportamento e integrità degli agenti di cui è stato eseguito il deployment e dei server Model Context Protocol (MCP). Monitorando le metriche chiave, tracciando i percorsi di esecuzione e osservando il sistema multi-agente nel suo complesso, puoi diagnosticare i problemi, ottimizzare il consumo di risorse e migliorare l'affidabilità degli agenti.

Questo documento fornisce una panoramica degli strumenti di osservabilità disponibili nella piattaforma Gemini Enterprise Agent, tra cui la topologia a livello di sistema, il monitoraggio dei singoli agenti e le metriche del server MCP.

Configurazione della telemetria

Per compilare queste dashboard, topologie e tracce di osservabilità, gli agenti devono essere configurati per inviare dati di telemetria in formato OpenTelemetry ai sistemi di archiviazione in Google Cloud Observability.

Assicurati che gli ambienti dell'agente e del server MCP siano configurati correttamente per emettere questi dati. I componenti Google Cloud integrati emettono automaticamente dati di telemetria nel formato OpenTelemetry. Ad esempio, Model Armor emette in modo nativo telemetria standardizzata, consentendoti di esporre e monitorare senza problemi le intercettazioni dei criteri in tempo reale direttamente all'interno dei dati di traccia senza richiedere strumentazione personalizzata.

Per le istruzioni e i requisiti di configurazione della telemetria dell'agente, consulta le seguenti risorse:

Topologia dell'agente

La visualizzazione della topologia multi-agente fornisce una mappa visiva a livello di sistema dell'architettura del sistema multi-agente. Mostra le relazioni e i flussi di traffico in tempo reale tra tutti gli agenti e i server MCP noti al tuo Agent Registry. Questa visualizzazione aggregata ti aiuta a comprendere le dipendenze complesse e a identificare i potenziali colli di bottiglia nel tuo ecosistema.

Oltre alla visualizzazione della topologia multi-agente, puoi anche visualizzare le dipendenze in entrata e in uscita specifiche per un singolo agente. Questa visualizzazione della topologia con un singolo agente si basa sui dati di traccia dell'agente selezionato.

Per istruzioni dettagliate su come navigare e interpretare i grafici della topologia degli agenti, vedi Visualizzare le relazioni e la topologia degli agenti.

Indicatori di osservabilità

La piattaforma agentica Gemini Enterprise fornisce osservabilità tramite metriche, tracce e log.

Quando selezioni un agente specifico dal registro, la scheda Osservabilità fornisce una suite di dashboard mirate per monitorare l'integrità operativa, le prestazioni e l'utilizzo dell'infrastruttura. Utilizza il menu di navigazione a sinistra all'interno della scheda Osservabilità per passare da una visualizzazione all'altra:

  • Panoramica:monitora l'utilizzo di alto livello nel periodo di tempo selezionato, inclusi sessioni totali, turni medi per sessione e invocazioni totali dell'agente. I grafici delle serie temporali mostrano l'utilizzo dei token (input e output), il volume complessivo del traffico dell'agente, i percentili di latenza (p50, p95, p99) e i tassi di errore.
  • Valutazione:mostra i monitor online per la valutazione continua della qualità. Sono inclusi widget delle serie temporali che monitorano la qualità media delle risposte, le metriche di sicurezza, i tassi di allucinazione e la qualità dell'utilizzo degli strumenti.
  • Modelli:suddivide il rendimento in base al foundation model sottostante. Puoi monitorare la latenza p95, il numero totale di chiamate, i tassi di errore, gli errori di quota e l'utilizzo dei token isolati per modelli specifici.
  • Strumenti:monitora gli strumenti e i servizi esterni connessi all'agente. Questa visualizzazione mostra in dettaglio la latenza p95, i conteggi delle chiamate e i tassi di errore per strumento, nonché la frequenza delle interazioni in cui non è stato chiamato alcun strumento.
  • Utilizzo:fornisce metriche a livello di infrastruttura per l'ambiente di runtime dell'agente, tra cui allocazione della CPU del container, allocazione della memoria del container e utilizzo dei token.
  • Log:mostra un flusso filtrabile di log dell'agente non elaborati, inclusi gravità, timestamp e riepiloghi di esecuzione per la risoluzione dei problemi in dettaglio. Per saperne di più, consulta Visualizzare i log dell'agente.

Oltre alle dashboard nella scheda Osservabilità, puoi utilizzare la scheda Tracce dell'agente per ispezionare l'esecuzione passo passo di sessioni specifiche, inclusi i grafi aciclici diretti di span e input/output. Per maggiori informazioni, vedi Visualizzare le tracce dell'agente. Puoi anche utilizzare la scheda Topologia per visualizzare le dipendenze in entrata e in uscita specifiche per un singolo agente.

Per i server MCP, puoi monitorare il conteggio delle richieste e la durata delle richieste p95 per monitorare l'utilizzo e la reattività.

Convenzioni di OpenTelemetry per l'AI generativa

Le tracce degli agenti e i log di prompt e risposte si basano in gran parte sulle Convenzioni semantiche di OpenTelemetry per i sistemi di AI generativa per standardizzare il modo in cui la telemetria dell'AI generativa viene acquisita, strutturata e segnalata.

Il rispetto di queste convenzioni è fondamentale per il tracciamento degli agenti perché stabilisce un formato universale e indipendente dal fornitore per descrivere flussi di lavoro complessi e in più passaggi degli agenti, come esecuzioni di strumenti, passaggi di recupero e consumo di token. Questa standardizzazione consente un'interoperabilità perfetta tra diversi backend di osservabilità e strumenti di analisi, sia all'interno che all'esterno di Google Cloud.

Passaggi successivi