Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Panoramica sull'osservabilità

L'osservabilità degli agenti nella piattaforma Gemini Enterprise Agent offre una visibilità completa su prestazioni, comportamento e integrità degli agenti di cui è stato eseguito il deployment e dei server Model Context Protocol (MCP). Monitorando le metriche chiave, tracciando i percorsi di esecuzione e osservando il sistema multi-agente nel suo complesso, puoi diagnosticare i problemi, ottimizzare il consumo di risorse e migliorare l'affidabilità degli agenti.

Questo documento fornisce una panoramica degli strumenti di osservabilità disponibili nella piattaforma Gemini Enterprise Agent, tra cui la topologia a livello di sistema, il monitoraggio dei singoli agenti e le metriche del server MCP.

Configurazione della telemetria

Per compilare queste dashboard, topologie e tracce di osservabilità, gli agenti devono essere configurati per inviare dati di telemetria in formato OpenTelemetry ai sistemi di archiviazione in Google Cloud Observability.

Assicurati che gli ambienti dell'agente e del server MCP siano configurati correttamente per emettere questi dati. I componenti Google Cloud integrati emettono automaticamente dati di telemetria nel formato OpenTelemetry. Ad esempio, Model Armor emette in modo nativo telemetria standardizzata, consentendoti di esporre e monitorare senza problemi le intercettazioni dei criteri in tempo reale direttamente all'interno dei dati di traccia senza richiedere strumentazione personalizzata.

Per le istruzioni e i requisiti di configurazione della telemetria dell'agente, consulta le seguenti risorse:

Per instrumentare gli agenti creati con ADK, consulta Instrumentare le applicazioni ADK con OpenTelemetry.
Per instrumentare gli agenti su Agent Runtime che non sono stati creati con ADK, consulta Instrumentare le applicazioni di AI generativa.
Per la telemetria del server MCP, consulta Utilizzare Cloud Trace per monitorare l'utilizzo dello strumento MCP.
Per la telemetria di Model Armor, vedi Configura la registrazione nel log di Model Armor.

Topologia dell'agente

La visualizzazione della topologia multi-agente fornisce una mappa visiva a livello di sistema dell'architettura del sistema multi-agente. Mostra le relazioni e i flussi di traffico in tempo reale tra tutti gli agenti e i server MCP noti al tuo Agent Registry. Questa visualizzazione aggregata ti aiuta a comprendere le dipendenze complesse e a identificare i potenziali colli di bottiglia nel tuo ecosistema.

Oltre alla visualizzazione della topologia multi-agente, puoi anche visualizzare le dipendenze in entrata e in uscita specifiche per un singolo agente. Questa visualizzazione della topologia con un singolo agente si basa sui dati di traccia dell'agente selezionato.

Per istruzioni dettagliate su come navigare e interpretare i grafici della topologia degli agenti, vedi Visualizzare le relazioni e la topologia degli agenti.

Indicatori di osservabilità

La piattaforma agentica Gemini Enterprise fornisce osservabilità tramite metriche, tracce e log.

Quando selezioni un agente specifico dal registro, la scheda Osservabilità fornisce una suite di dashboard mirate per monitorare l'integrità operativa, le prestazioni e l'utilizzo dell'infrastruttura. Utilizza il menu di navigazione a sinistra all'interno della scheda Osservabilità per passare da una visualizzazione all'altra:

Panoramica:monitora l'utilizzo di alto livello nel periodo di tempo selezionato, inclusi sessioni totali, turni medi per sessione e invocazioni totali dell'agente. I grafici delle serie temporali mostrano l'utilizzo dei token (input e output), il volume complessivo del traffico dell'agente, i percentili di latenza (p50, p95, p99) e i tassi di errore.
Valutazione:mostra i monitor online per la valutazione continua della qualità. Sono inclusi widget delle serie temporali che monitorano la qualità media delle risposte, le metriche di sicurezza, i tassi di allucinazione e la qualità dell'utilizzo degli strumenti.
Modelli:suddivide il rendimento in base al foundation model sottostante. Puoi monitorare la latenza p95, il numero totale di chiamate, i tassi di errore, gli errori di quota e l'utilizzo dei token isolati per modelli specifici.
Strumenti:monitora gli strumenti e i servizi esterni connessi all'agente. Questa visualizzazione mostra in dettaglio la latenza p95, i conteggi delle chiamate e i tassi di errore per strumento, nonché la frequenza delle interazioni in cui non è stato chiamato alcun strumento.
Utilizzo:fornisce metriche a livello di infrastruttura per l'ambiente di runtime dell'agente, tra cui allocazione della CPU del container, allocazione della memoria del container e utilizzo dei token.
Log:mostra un flusso filtrabile di log dell'agente non elaborati, inclusi gravità, timestamp e riepiloghi di esecuzione per la risoluzione dei problemi in dettaglio. Per saperne di più, consulta Visualizzare i log dell'agente.

Oltre alle dashboard nella scheda Osservabilità, puoi utilizzare la scheda Tracce dell'agente per ispezionare l'esecuzione passo passo di sessioni specifiche, inclusi i grafi aciclici diretti di span e input/output. Per maggiori informazioni, vedi Visualizzare le tracce dell'agente. Puoi anche utilizzare la scheda Topologia per visualizzare le dipendenze in entrata e in uscita specifiche per un singolo agente.

Per i server MCP, puoi monitorare il conteggio delle richieste e la durata delle richieste p95 per monitorare l'utilizzo e la reattività.

Convenzioni di OpenTelemetry per l'AI generativa

Le tracce degli agenti e i log di prompt e risposte si basano in gran parte sulle Convenzioni semantiche di OpenTelemetry per i sistemi di AI generativa per standardizzare il modo in cui la telemetria dell'AI generativa viene acquisita, strutturata e segnalata.

Il rispetto di queste convenzioni è fondamentale per il tracciamento degli agenti perché stabilisce un formato universale e indipendente dal fornitore per descrivere flussi di lavoro complessi e in più passaggi degli agenti, come esecuzioni di strumenti, passaggi di recupero e consumo di token. Questa standardizzazione consente un'interoperabilità perfetta tra diversi backend di osservabilità e strumenti di analisi, sia all'interno che all'esterno di Google Cloud.

Passaggi successivi

Visualizza le relazioni tra agenti come grafico della topologia.
Visualizza le tracce dell'agente per eseguire il debug del comportamento dell'agente.
Valuta i tuoi agenti.