Strumento: get_evaluation_run
Recupera i dettagli dell'esecuzione della valutazione specificata.
Il seguente esempio mostra come utilizzare curl per richiamare lo strumento MCP get_evaluation_run.
| Curl Request |
|---|
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "get_evaluation_run", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
Schema di input
Messaggio di richiesta per EvaluationService.GetEvaluationRun.
GetEvaluationRunRequest
| Rappresentazione JSON |
|---|
{ "name": string } |
| Campi | |
|---|---|
name |
Obbligatorio. Il nome della risorsa dell'esecuzione della valutazione da recuperare. |
Schema di output
Un'esecuzione della valutazione rappresenta tutti i risultati della valutazione ottenuti da un'esecuzione della valutazione.
EvaluationRun
| Rappresentazione JSON |
|---|
{ "name": string, "displayName": string, "evaluationResults": [ string ], "createTime": string, "initiatedBy": string, "appVersion": string, "appVersionDisplayName": string, "changelog": string, "changelogCreateTime": string, "evaluations": [ string ], "evaluationDataset": string, "evaluationType": enum ( |
| Campi | |
|---|---|
name |
Identificatore. L'identificatore univoco dell'esecuzione della valutazione. Formato: |
displayName |
Facoltativo. Nome visualizzato definito dall'utente dell'esecuzione della valutazione. Valore predefinito: " |
evaluationResults[] |
Solo output. I risultati della valutazione che fanno parte di questa esecuzione. Formato: |
createTime |
Solo output. Timestamp di creazione dell'esecuzione della valutazione. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: |
initiatedBy |
Solo output. L'utente che ha avviato l'esecuzione della valutazione. |
appVersion |
Solo output. La versione dell'app da valutare. Formato: |
appVersionDisplayName |
Solo output. Il nome visualizzato del |
changelog |
Solo output. Il log delle modifiche della versione dell'app su cui è stata eseguita la valutazione. Questo campo viene compilato se l'utente esegue la valutazione sull'ultima versione/bozza. |
changelogCreateTime |
Solo output. L'ora di creazione del log delle modifiche della versione dell'app su cui è stata eseguita la valutazione. Questo campo viene compilato se l'utente esegue la valutazione sull'ultima versione/bozza. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: |
evaluations[] |
Solo output. Le valutazioni che fanno parte di questa esecuzione. L'elenco può contenere valutazioni di entrambi i tipi. Questo campo si esclude a vicenda con |
evaluationDataset |
Solo output. Il set di dati di valutazione a cui è associata questa esecuzione. Questo campo si esclude a vicenda con |
evaluationType |
Solo output. Il tipo di valutazioni in questa esecuzione. |
state |
Solo output. Lo stato dell'esecuzione della valutazione. |
progress |
Solo output. L'avanzamento dell'esecuzione della valutazione. |
config |
Solo output. La configurazione utilizzata nell'esecuzione. |
error |
Solo output. Deprecato: utilizza error_info. Errori rilevati durante l'esecuzione. |
errorInfo |
Solo output. Informazioni sugli errori per l'esecuzione della valutazione. |
evaluationRunSummaries |
Solo output. Mappa del nome della valutazione a EvaluationRunSummary. Un oggetto contenente un elenco di coppie |
latencyReport |
Solo output. Report sulla latenza per l'esecuzione della valutazione. |
runCount |
Solo output. Il numero di volte in cui sono state eseguite le valutazioni all'interno dell'esecuzione. |
personaRunConfigs[] |
Solo output. La configurazione da utilizzare per l'esecuzione per persona. |
optimizationConfig |
Facoltativo. Configurazione per l'esecuzione del passaggio di ottimizzazione dopo l'esecuzione della valutazione. Se non viene impostato, il passaggio di ottimizzazione non verrà eseguito. |
scheduledEvaluationRun |
Solo output. Il nome della risorsa di esecuzione della valutazione pianificata che ha creato questa esecuzione della valutazione. Questo campo viene impostato solo se l'esecuzione della valutazione è stata creata da un'esecuzione della valutazione pianificata. Formato: |
goldenRunMethod |
Solo output. Il metodo utilizzato per eseguire la valutazione. |
Timestamp
| Rappresentazione JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campi | |
|---|---|
seconds |
Rappresenta i secondi di tempo UTC a partire dall'epoca Unix 1970-01-01T00:00:00Z. Deve essere compreso tra -62135596800 e 253402300799 inclusi (corrispondenti a 0001-01-01T00:00:00Z e 9999-12-31T23:59:59Z). |
nanos |
Frazioni di secondo non negative con risoluzione in nanosecondi. Questo campo è la parte in nanosecondi della durata, non un'alternativa ai secondi. I valori negativi dei secondi con frazioni devono comunque avere valori non negativi dei nanosecondi che vengono conteggiati in avanti nel tempo. Deve essere compreso tra 0 e 999.999.999 inclusi. |
Avanzamento
| Rappresentazione JSON |
|---|
{ "totalCount": integer, "failedCount": integer, "errorCount": integer, "completedCount": integer, "passedCount": integer } |
| Campi | |
|---|---|
totalCount |
Solo output. Numero totale di risultati della valutazione in questa esecuzione. |
failedCount |
Solo output. Numero di risultati della valutazione completati con esito NON RIUSCITO. (EvaluationResult.execution_state è COMPLETED e EvaluationResult.evaluation_status è FAIL). |
errorCount |
Solo output. Numero di risultati della valutazione la cui esecuzione non è riuscita. (EvaluationResult.execution_state è ERROR). |
completedCount |
Solo output. Numero di risultati della valutazione completati correttamente. (EvaluationResult.execution_state è COMPLETED). |
passedCount |
Solo output. Numero di risultati della valutazione completati con esito PASS. (EvaluationResult.execution_state è COMPLETED e EvaluationResult.evaluation_status è PASS). |
EvaluationConfig
| Rappresentazione JSON |
|---|
{ "inputAudioConfig": { object ( |
| Campi | |
|---|---|
inputAudioConfig |
Facoltativo. Configurazione per l'elaborazione dell'audio di input. |
outputAudioConfig |
Facoltativo. Configurazione per la generazione dell'audio di output. |
evaluationChannel |
Facoltativo. Il canale da valutare. |
toolCallBehaviour |
Facoltativo. Specifica se la valutazione deve utilizzare chiamate di strumenti reali o fittizi. |
InputAudioConfig
| Rappresentazione JSON |
|---|
{
"audioEncoding": enum ( |
| Campi | |
|---|---|
audioEncoding |
Obbligatorio. La codifica dei dati audio di input. |
sampleRateHertz |
Obbligatorio. La frequenza di campionamento (in hertz) dei dati audio di input. |
noiseSuppressionLevel |
Facoltativo. Indica se attivare la soppressione del rumore nell'audio di input. I valori disponibili sono "low", "moderate", "high", "very_high". |
OutputAudioConfig
| Rappresentazione JSON |
|---|
{
"audioEncoding": enum ( |
| Campi | |
|---|---|
audioEncoding |
Obbligatorio. La codifica dei dati audio di output. |
sampleRateHertz |
Obbligatorio. La frequenza di campionamento (in hertz) dei dati audio di output. |
Stato
| Rappresentazione JSON |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| Campi | |
|---|---|
code |
Il codice di stato, che deve essere un valore enum di |
message |
Un messaggio di errore rivolto agli sviluppatori, che deve essere in inglese. Qualsiasi messaggio di errore rivolto agli utenti deve essere localizzato e inviato nel campo |
details[] |
Un elenco di messaggi contenenti i dettagli dell'errore. Esiste un insieme comune di tipi di messaggi da utilizzare per le API. Un oggetto contenente campi di tipo arbitrario. Un campo aggiuntivo |
Qualsiasi
| Rappresentazione JSON |
|---|
{ "typeUrl": string, "value": string } |
| Campi | |
|---|---|
typeUrl |
Identifica il tipo di messaggio Protobuf serializzato con un riferimento URI costituito da un prefisso che termina con una barra e il nome del tipo completo. Esempio: type.googleapis.com/google.protobuf.StringValue Questa stringa deve contenere almeno un carattere Il prefisso è arbitrario e le implementazioni di Protobuf devono semplicemente rimuovere tutto fino all'ultimo Tutte le stringhe URL di tipo devono essere riferimenti URI validi con l'ulteriore limitazione (per il formato di testo) che il contenuto del riferimento deve essere costituito solo da caratteri alfanumerici, sequenze di escape codificate in percentuale e caratteri del seguente insieme (esclusi i backtick esterni): Nella progettazione originale di |
value |
Contiene una serializzazione Protobuf del tipo descritto da type_url. Una stringa con codifica in base64. |
EvaluationErrorInfo
| Rappresentazione JSON |
|---|
{
"errorType": enum ( |
| Campi | |
|---|---|
errorType |
Solo output. Il tipo di errore. |
errorMessage |
Solo output. Il messaggio di errore. |
sessionId |
Solo output. L'ID sessione della conversazione che ha causato l'errore. |
EvaluationRunSummariesEntry
| Rappresentazione JSON |
|---|
{
"key": string,
"value": {
object ( |
| Campi | |
|---|---|
key |
|
value |
|
EvaluationRunSummary
| Rappresentazione JSON |
|---|
{ "passedCount": integer, "failedCount": integer, "errorCount": integer } |
| Campi | |
|---|---|
passedCount |
Solo output. Numero di risultati superati per la valutazione associata in questa esecuzione. |
failedCount |
Solo output. Numero di risultati non riusciti per la valutazione associata in questa esecuzione. |
errorCount |
Solo output. Numero di risultati di errore per la valutazione associata in questa esecuzione. |
LatencyReport
| Rappresentazione JSON |
|---|
{ "toolLatencies": [ { object ( |
| Campi | |
|---|---|
toolLatencies[] |
Solo output. Elenco non ordinato. Metriche di latenza per ogni strumento. |
callbackLatencies[] |
Solo output. Elenco non ordinato. Metriche di latenza per ogni callback. |
guardrailLatencies[] |
Solo output. Elenco non ordinato. Metriche di latenza per ogni guardrail. |
llmCallLatencies[] |
Solo output. Elenco non ordinato. Metriche di latenza per ogni chiamata LLM. |
sessionCount |
Solo output. Il numero totale di sessioni prese in considerazione nel report sulla latenza. |
ToolLatency
| Rappresentazione JSON |
|---|
{ "toolDisplayName": string, "latencyMetrics": { object ( |
| Campi | |
|---|---|
toolDisplayName |
Solo output. Il nome visualizzato dello strumento. |
latencyMetrics |
Solo output. Le metriche di latenza per lo strumento. |
Campo unione tool_identifier. L'identificatore dello strumento. tool_identifier può essere solo uno dei seguenti tipi: |
|
tool |
Solo output. Formato: |
toolsetTool |
Solo output. L'identificatore dello strumento del toolset. |
ToolsetTool
| Rappresentazione JSON |
|---|
{ "toolset": string, "toolId": string } |
| Campi | |
|---|---|
toolset |
Obbligatorio. Il nome della risorsa del Toolset da cui deriva questo strumento. Formato: |
toolId |
Facoltativo. L'ID dello strumento per filtrare gli strumenti per cui recuperare lo schema. |
LatencyMetrics
| Rappresentazione JSON |
|---|
{ "p50Latency": string, "p90Latency": string, "p99Latency": string, "callCount": integer } |
| Campi | |
|---|---|
p50Latency |
Solo output. Latenza del 50° percentile. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con " |
p90Latency |
Solo output. Latenza del 90° percentile. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con " |
p99Latency |
Solo output. Latenza del 99° percentile. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con " |
callCount |
Solo output. Il numero di volte in cui è stata chiamata la risorsa. |
Durata
| Rappresentazione JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campi | |
|---|---|
seconds |
Secondi firmati dell'intervallo di tempo. Deve essere compreso tra -315.576.000.000 e +315.576.000.000 inclusi. Nota: questi limiti vengono calcolati in base a: 60 sec/min * 60 min/ora * 24 ore/giorno * 365,25 giorni/anno * 10.000 anni |
nanos |
Frazioni di secondo con segno con risoluzione in nanosecondi dell'intervallo di tempo. Le durate inferiori a un secondo sono rappresentate con un campo |
CallbackLatency
| Rappresentazione JSON |
|---|
{
"stage": string,
"latencyMetrics": {
object ( |
| Campi | |
|---|---|
stage |
Solo output. La fase del richiamo. |
latencyMetrics |
Solo output. Le metriche di latenza per il callback. |
GuardrailLatency
| Rappresentazione JSON |
|---|
{
"guardrail": string,
"guardrailDisplayName": string,
"latencyMetrics": {
object ( |
| Campi | |
|---|---|
guardrail |
Solo output. Il nome della barriera di protezione. Formato: |
guardrailDisplayName |
Solo output. Il nome visualizzato della barriera protettiva. |
latencyMetrics |
Solo output. Le metriche di latenza per la barriera protettiva. |
LlmCallLatency
| Rappresentazione JSON |
|---|
{
"model": string,
"latencyMetrics": {
object ( |
| Campi | |
|---|---|
model |
Solo output. Il nome del modello. |
latencyMetrics |
Solo output. Le metriche di latenza per la chiamata LLM. |
PersonaRunConfig
| Rappresentazione JSON |
|---|
{ "persona": string, "taskCount": integer } |
| Campi | |
|---|---|
persona |
Facoltativo. La persona da utilizzare per la valutazione. Formato: |
taskCount |
Facoltativo. Il numero di attività da eseguire per la persona. |
OptimizationConfig
| Rappresentazione JSON |
|---|
{
"generateLossReport": boolean,
"assistantSession": string,
"reportSummary": string,
"shouldSuggestFix": boolean,
"status": enum ( |
| Campi | |
|---|---|
generateLossReport |
Facoltativo. Se generare un report di perdita. |
assistantSession |
Solo output. La sessione dell'assistente da utilizzare per l'ottimizzazione in base a questa esecuzione della valutazione. Formato: |
reportSummary |
Solo output. Il riepilogo della denuncia di smarrimento. |
shouldSuggestFix |
Solo output. Se suggerire una correzione per le perdite. |
status |
Solo output. Lo stato dell'esecuzione dell'ottimizzazione. |
errorMessage |
Solo output. Il messaggio di errore se l'esecuzione dell'ottimizzazione non è riuscita. |
lossReport |
Solo output. Il report sulle perdite generato. |
Struct
| Rappresentazione JSON |
|---|
{ "fields": { string: value, ... } } |
| Campi | |
|---|---|
fields |
Mappa non ordinata di valori con tipo dinamico. Un oggetto contenente un elenco di coppie |
FieldsEntry
| Rappresentazione JSON |
|---|
{ "key": string, "value": value } |
| Campi | |
|---|---|
key |
|
value |
|
Valore
| Rappresentazione JSON |
|---|
{ // Union field |
| Campi | |
|---|---|
Campo unione kind. Il tipo di valore. kind può essere solo uno dei seguenti tipi: |
|
nullValue |
Rappresenta un valore null. |
numberValue |
Rappresenta un valore double. |
stringValue |
Rappresenta un valore stringa. |
boolValue |
Rappresenta un valore booleano. |
structValue |
Rappresenta un valore strutturato. |
listValue |
Rappresenta un |
ListValue
| Rappresentazione JSON |
|---|
{ "values": [ value ] } |
| Campi | |
|---|---|
values[] |
Campo ripetuto di valori con tipo dinamico. |
Annotazioni dello strumento
Suggerimento distruttivo: ❌ | Suggerimento idempotente: ✅ | Suggerimento di sola lettura: ✅ | Suggerimento open world: ❌