MCP Tools Reference: ces.googleapis.com

Strumento: list_evaluation_runs

Elenca le esecuzioni della valutazione.

Il seguente esempio mostra come utilizzare curl per richiamare lo strumento MCP list_evaluation_runs.

Curl Request
                  
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \
--header 'content-type: application/json' \
--header 'accept: application/json, text/event-stream' \
--data '{
  "method": "tools/call",
  "params": {
    "name": "list_evaluation_runs",
    "arguments": {
      // provide these details according to the tool's MCP specification
    }
  },
  "jsonrpc": "2.0",
  "id": 1
}'
                

Schema di input

Messaggio di richiesta per EvaluationService.ListEvaluationRuns.

ListEvaluationRunsRequest

Rappresentazione JSON
{
  "parent": string,
  "pageSize": integer,
  "pageToken": string,
  "filter": string,
  "orderBy": string
}
Campi
parent

string

Obbligatorio. Il nome della risorsa dell'app da cui elencare le esecuzioni della valutazione.

pageSize

integer

Facoltativo. Dimensioni della pagina richiesta. Il server potrebbe restituire meno elementi di quelli richiesti. Se non specificato, il server sceglierà un valore predefinito appropriato.

pageToken

string

Facoltativo. Il valore next_page_token restituito da una precedente chiamata EvaluationService.ListEvaluationRuns dell'elenco.

filter

string

Facoltativo. Filtro da applicare durante l'elenco delle esecuzioni della valutazione. Per maggiori dettagli, visita la pagina https://google.aip.dev/160.

orderBy

string

Facoltativo. Campo in base al quale ordinare. Sono supportati solo "name", "create_time" e "update_time". I campi temporali sono ordinati in ordine decrescente, mentre il campo del nome è ordinato in ordine crescente. Se non è incluso, il valore predefinito sarà "update_time". Per maggiori dettagli, visita la pagina https://google.aip.dev/132#ordering.

Schema di output

Messaggio di risposta per EvaluationService.ListEvaluationRuns.

ListEvaluationRunsResponse

Rappresentazione JSON
{
  "evaluationRuns": [
    {
      object (EvaluationRun)
    }
  ],
  "nextPageToken": string
}
Campi
evaluationRuns[]

object (EvaluationRun)

L'elenco delle esecuzioni della valutazione.

nextPageToken

string

Un token che può essere inviato come ListEvaluationRunsRequest.page_token per recuperare la pagina successiva. L'assenza di questo campo indica che non sono presenti pagine successive.

EvaluationRun

Rappresentazione JSON
{
  "name": string,
  "displayName": string,
  "evaluationResults": [
    string
  ],
  "createTime": string,
  "initiatedBy": string,
  "appVersion": string,
  "appVersionDisplayName": string,
  "changelog": string,
  "changelogCreateTime": string,
  "evaluations": [
    string
  ],
  "evaluationDataset": string,
  "evaluationType": enum (EvaluationType),
  "state": enum (EvaluationRunState),
  "progress": {
    object (Progress)
  },
  "config": {
    object (EvaluationConfig)
  },
  "error": {
    object (Status)
  },
  "errorInfo": {
    object (EvaluationErrorInfo)
  },
  "evaluationRunSummaries": {
    string: {
      object (EvaluationRunSummary)
    },
    ...
  },
  "latencyReport": {
    object (LatencyReport)
  },
  "runCount": integer,
  "personaRunConfigs": [
    {
      object (PersonaRunConfig)
    }
  ],
  "optimizationConfig": {
    object (OptimizationConfig)
  },
  "scheduledEvaluationRun": string,
  "goldenRunMethod": enum (GoldenRunMethod)
}
Campi
name

string

Identificatore. L'identificatore univoco dell'esecuzione della valutazione. Formato: projects/{project}/locations/{location}/apps/{app}/evaluationRuns/{evaluationRun}

displayName

string

Facoltativo. Nome visualizzato definito dall'utente dell'esecuzione della valutazione. Valore predefinito: " run - ".

evaluationResults[]

string

Solo output. I risultati della valutazione che fanno parte di questa esecuzione. Formato: projects/{project}/locations/{location}/apps/{app}/evaluations/{evaluation}/results/{result}

createTime

string (Timestamp format)

Solo output. Timestamp di creazione dell'esecuzione della valutazione.

Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" o "2014-10-02T15:01:23+05:30".

initiatedBy

string

Solo output. L'utente che ha avviato l'esecuzione della valutazione.

appVersion

string

Solo output. La versione dell'app da valutare. Formato: projects/{project}/locations/{location}/apps/{app}/versions/{version}

appVersionDisplayName

string

Solo output. Il nome visualizzato del app_version rispetto al quale è stata eseguita la valutazione.

changelog

string

Solo output. Il log delle modifiche della versione dell'app su cui è stata eseguita la valutazione. Questo campo viene compilato se l'utente esegue la valutazione sull'ultima versione/bozza.

changelogCreateTime

string (Timestamp format)

Solo output. L'ora di creazione del log delle modifiche della versione dell'app su cui è stata eseguita la valutazione. Questo campo viene compilato se l'utente esegue la valutazione sull'ultima versione/bozza.

Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" o "2014-10-02T15:01:23+05:30".

evaluations[]

string

Solo output. Le valutazioni che fanno parte di questa esecuzione. L'elenco può contenere valutazioni di entrambi i tipi. Questo campo si esclude a vicenda con evaluation_dataset. Formato: projects/{project}/locations/{location}/apps/{app}/evaluations/{evaluation}

evaluationDataset

string

Solo output. Il set di dati di valutazione a cui è associata questa esecuzione. Questo campo si esclude a vicenda con evaluations. Formato: projects/{project}/locations/{location}/apps/{app}/evaluationDatasets/{evaluationDataset}

evaluationType

enum (EvaluationType)

Solo output. Il tipo di valutazioni in questa esecuzione.

state

enum (EvaluationRunState)

Solo output. Lo stato dell'esecuzione della valutazione.

progress

object (Progress)

Solo output. L'avanzamento dell'esecuzione della valutazione.

config

object (EvaluationConfig)

Solo output. La configurazione utilizzata nell'esecuzione.

error
(deprecated)

object (Status)

Solo output. Deprecato: utilizza error_info. Errori rilevati durante l'esecuzione.

errorInfo

object (EvaluationErrorInfo)

Solo output. Informazioni sugli errori per l'esecuzione della valutazione.

evaluationRunSummaries

map (key: string, value: object (EvaluationRunSummary))

Solo output. Mappa del nome della valutazione a EvaluationRunSummary.

Un oggetto contenente un elenco di coppie "key": value. Esempio: { "name": "wrench", "mass": "1.3kg", "count": "3" }.

latencyReport

object (LatencyReport)

Solo output. Report sulla latenza per l'esecuzione della valutazione.

runCount

integer

Solo output. Il numero di volte in cui sono state eseguite le valutazioni all'interno dell'esecuzione.

personaRunConfigs[]

object (PersonaRunConfig)

Solo output. La configurazione da utilizzare per l'esecuzione per persona.

optimizationConfig

object (OptimizationConfig)

Facoltativo. Configurazione per l'esecuzione del passaggio di ottimizzazione dopo l'esecuzione della valutazione. Se non viene impostato, il passaggio di ottimizzazione non verrà eseguito.

scheduledEvaluationRun

string

Solo output. Il nome della risorsa di esecuzione della valutazione pianificata che ha creato questa esecuzione della valutazione. Questo campo viene impostato solo se l'esecuzione della valutazione è stata creata da un'esecuzione della valutazione pianificata. Formato: projects/{project}/locations/{location}/apps/{app}/scheduledEvaluationRuns/{scheduled_evaluation_run}

goldenRunMethod

enum (GoldenRunMethod)

Solo output. Il metodo utilizzato per eseguire la valutazione.

Timestamp

Rappresentazione JSON
{
  "seconds": string,
  "nanos": integer
}
Campi
seconds

string (int64 format)

Rappresenta i secondi di tempo UTC a partire dall'epoca Unix 1970-01-01T00:00:00Z. Deve essere compreso tra -62135596800 e 253402300799 inclusi (corrispondenti a 0001-01-01T00:00:00Z e 9999-12-31T23:59:59Z).

nanos

integer

Frazioni di secondo non negative con risoluzione in nanosecondi. Questo campo è la parte in nanosecondi della durata, non un'alternativa ai secondi. I valori negativi dei secondi con frazioni devono comunque avere valori non negativi dei nanosecondi che vengono conteggiati in avanti nel tempo. Deve essere compreso tra 0 e 999.999.999 inclusi.

Avanzamento

Rappresentazione JSON
{
  "totalCount": integer,
  "failedCount": integer,
  "errorCount": integer,
  "completedCount": integer,
  "passedCount": integer
}
Campi
totalCount

integer

Solo output. Numero totale di risultati della valutazione in questa esecuzione.

failedCount

integer

Solo output. Numero di risultati della valutazione completati con esito NON RIUSCITO. (EvaluationResult.execution_state è COMPLETED e EvaluationResult.evaluation_status è FAIL).

errorCount

integer

Solo output. Numero di risultati della valutazione la cui esecuzione non è riuscita. (EvaluationResult.execution_state è ERROR).

completedCount

integer

Solo output. Numero di risultati della valutazione completati correttamente. (EvaluationResult.execution_state è COMPLETED).

passedCount

integer

Solo output. Numero di risultati della valutazione completati con esito PASS. (EvaluationResult.execution_state è COMPLETED e EvaluationResult.evaluation_status è PASS).

EvaluationConfig

Rappresentazione JSON
{
  "inputAudioConfig": {
    object (InputAudioConfig)
  },
  "outputAudioConfig": {
    object (OutputAudioConfig)
  },
  "evaluationChannel": enum (EvaluationChannel),
  "toolCallBehaviour": enum (EvaluationToolCallBehaviour)
}
Campi
inputAudioConfig
(deprecated)

object (InputAudioConfig)

Facoltativo. Configurazione per l'elaborazione dell'audio di input.

outputAudioConfig
(deprecated)

object (OutputAudioConfig)

Facoltativo. Configurazione per la generazione dell'audio di output.

evaluationChannel

enum (EvaluationChannel)

Facoltativo. Il canale da valutare.

toolCallBehaviour

enum (EvaluationToolCallBehaviour)

Facoltativo. Specifica se la valutazione deve utilizzare chiamate di strumenti reali o fittizi.

InputAudioConfig

Rappresentazione JSON
{
  "audioEncoding": enum (AudioEncoding),
  "sampleRateHertz": integer,
  "noiseSuppressionLevel": string
}
Campi
audioEncoding

enum (AudioEncoding)

Obbligatorio. La codifica dei dati audio di input.

sampleRateHertz

integer

Obbligatorio. La frequenza di campionamento (in hertz) dei dati audio di input.

noiseSuppressionLevel

string

Facoltativo. Indica se attivare la soppressione del rumore nell'audio di input. I valori disponibili sono "low", "moderate", "high", "very_high".

OutputAudioConfig

Rappresentazione JSON
{
  "audioEncoding": enum (AudioEncoding),
  "sampleRateHertz": integer
}
Campi
audioEncoding

enum (AudioEncoding)

Obbligatorio. La codifica dei dati audio di output.

sampleRateHertz

integer

Obbligatorio. La frequenza di campionamento (in hertz) dei dati audio di output.

Stato

Rappresentazione JSON
{
  "code": integer,
  "message": string,
  "details": [
    {
      "@type": string,
      field1: ...,
      ...
    }
  ]
}
Campi
code

integer

Il codice di stato, che deve essere un valore enum di google.rpc.Code.

message

string

Un messaggio di errore rivolto agli sviluppatori, che deve essere in inglese. Qualsiasi messaggio di errore rivolto agli utenti deve essere localizzato e inviato nel campo google.rpc.Status.details o localizzato dal client.

details[]

object

Un elenco di messaggi contenenti i dettagli dell'errore. Esiste un insieme comune di tipi di messaggi da utilizzare per le API.

Un oggetto contenente campi di tipo arbitrario. Un campo aggiuntivo "@type" contenente un URI che identifica il tipo. Esempio: { "id": 1234, "@type": "types.example.com/standard/id" }.

Qualsiasi

Rappresentazione JSON
{
  "typeUrl": string,
  "value": string
}
Campi
typeUrl

string

Identifica il tipo di messaggio Protobuf serializzato con un riferimento URI costituito da un prefisso che termina con una barra e il nome del tipo completo.

Esempio: type.googleapis.com/google.protobuf.StringValue

Questa stringa deve contenere almeno un carattere / e il contenuto dopo l'ultimo / deve essere il nome completo del tipo in forma canonica, senza un punto iniziale. Non scrivere uno schema su questi riferimenti URI in modo che i client non tentino di contattarli.

Il prefisso è arbitrario e le implementazioni di Protobuf devono semplicemente rimuovere tutto fino all'ultimo / incluso per identificare il tipo. type.googleapis.com/ è un prefisso predefinito comune richiesto da alcune implementazioni legacy. Questo prefisso non indica l'origine del tipo e non è previsto che gli URI che lo contengono rispondano a richieste.

Tutte le stringhe URL di tipo devono essere riferimenti URI validi con l'ulteriore limitazione (per il formato di testo) che il contenuto del riferimento deve essere costituito solo da caratteri alfanumerici, sequenze di escape codificate in percentuale e caratteri del seguente insieme (esclusi i backtick esterni): /-.~_!$&()*+,;=. Nonostante consentiamo le codifiche in percentuale, le implementazioni non devono eseguirne l'escape per evitare confusione con i parser esistenti. Ad esempio, type.googleapis.com%2FFoo deve essere rifiutato.

Nella progettazione originale di Any, è stata presa in considerazione la possibilità di avviare un servizio di risoluzione dei tipi in questi URL di tipo, ma Protobuf non ne ha mai implementato uno e considera il contatto con questi URL problematico e un potenziale problema di sicurezza. Non tentare di contattare gli URL dei tipi.

value

string (bytes format)

Contiene una serializzazione Protobuf del tipo descritto da type_url.

Una stringa con codifica in base64.

EvaluationErrorInfo

Rappresentazione JSON
{
  "errorType": enum (ErrorType),
  "errorMessage": string,
  "sessionId": string
}
Campi
errorType

enum (ErrorType)

Solo output. Il tipo di errore.

errorMessage

string

Solo output. Il messaggio di errore.

sessionId

string

Solo output. L'ID sessione della conversazione che ha causato l'errore.

EvaluationRunSummariesEntry

Rappresentazione JSON
{
  "key": string,
  "value": {
    object (EvaluationRunSummary)
  }
}
Campi
key

string

value

object (EvaluationRunSummary)

EvaluationRunSummary

Rappresentazione JSON
{
  "passedCount": integer,
  "failedCount": integer,
  "errorCount": integer
}
Campi
passedCount

integer

Solo output. Numero di risultati superati per la valutazione associata in questa esecuzione.

failedCount

integer

Solo output. Numero di risultati non riusciti per la valutazione associata in questa esecuzione.

errorCount

integer

Solo output. Numero di risultati di errore per la valutazione associata in questa esecuzione.

LatencyReport

Rappresentazione JSON
{
  "toolLatencies": [
    {
      object (ToolLatency)
    }
  ],
  "callbackLatencies": [
    {
      object (CallbackLatency)
    }
  ],
  "guardrailLatencies": [
    {
      object (GuardrailLatency)
    }
  ],
  "llmCallLatencies": [
    {
      object (LlmCallLatency)
    }
  ],
  "sessionCount": integer
}
Campi
toolLatencies[]

object (ToolLatency)

Solo output. Elenco non ordinato. Metriche di latenza per ogni strumento.

callbackLatencies[]

object (CallbackLatency)

Solo output. Elenco non ordinato. Metriche di latenza per ogni callback.

guardrailLatencies[]

object (GuardrailLatency)

Solo output. Elenco non ordinato. Metriche di latenza per ogni guardrail.

llmCallLatencies[]

object (LlmCallLatency)

Solo output. Elenco non ordinato. Metriche di latenza per ogni chiamata LLM.

sessionCount

integer

Solo output. Il numero totale di sessioni prese in considerazione nel report sulla latenza.

ToolLatency

Rappresentazione JSON
{
  "toolDisplayName": string,
  "latencyMetrics": {
    object (LatencyMetrics)
  },

  // Union field tool_identifier can be only one of the following:
  "tool": string,
  "toolsetTool": {
    object (ToolsetTool)
  }
  // End of list of possible types for union field tool_identifier.
}
Campi
toolDisplayName

string

Solo output. Il nome visualizzato dello strumento.

latencyMetrics

object (LatencyMetrics)

Solo output. Le metriche di latenza per lo strumento.

Campo unione tool_identifier. L'identificatore dello strumento. tool_identifier può essere solo uno dei seguenti tipi:
tool

string

Solo output. Formato: projects/{project}/locations/{location}/apps/{app}/tools/{tool}.

toolsetTool

object (ToolsetTool)

Solo output. L'identificatore dello strumento del toolset.

ToolsetTool

Rappresentazione JSON
{
  "toolset": string,
  "toolId": string
}
Campi
toolset

string

Obbligatorio. Il nome della risorsa del Toolset da cui deriva questo strumento. Formato: projects/{project}/locations/{location}/apps/{app}/toolsets/{toolset}

toolId

string

Facoltativo. L'ID dello strumento per filtrare gli strumenti per cui recuperare lo schema.

LatencyMetrics

Rappresentazione JSON
{
  "p50Latency": string,
  "p90Latency": string,
  "p99Latency": string,
  "callCount": integer
}
Campi
p50Latency

string (Duration format)

Solo output. Latenza del 50° percentile.

Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "s". Esempio: "3.5s".

p90Latency

string (Duration format)

Solo output. Latenza del 90° percentile.

Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "s". Esempio: "3.5s".

p99Latency

string (Duration format)

Solo output. Latenza del 99° percentile.

Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "s". Esempio: "3.5s".

callCount

integer

Solo output. Il numero di volte in cui è stata chiamata la risorsa.

Durata

Rappresentazione JSON
{
  "seconds": string,
  "nanos": integer
}
Campi
seconds

string (int64 format)

Secondi firmati dell'intervallo di tempo. Deve essere compreso tra -315.576.000.000 e +315.576.000.000 inclusi. Nota: questi limiti vengono calcolati in base a: 60 sec/min * 60 min/ora * 24 ore/giorno * 365,25 giorni/anno * 10.000 anni

nanos

integer

Frazioni di secondo con segno con risoluzione in nanosecondi dell'intervallo di tempo. Le durate inferiori a un secondo sono rappresentate con un campo seconds pari a 0 e un campo nanos positivo o negativo. Per durate di un secondo o più, un valore diverso da zero per il campo nanos deve avere lo stesso segno del campo seconds. Deve essere compreso tra -999.999.999 e +999.999.999 inclusi.

CallbackLatency

Rappresentazione JSON
{
  "stage": string,
  "latencyMetrics": {
    object (LatencyMetrics)
  }
}
Campi
stage

string

Solo output. La fase del richiamo.

latencyMetrics

object (LatencyMetrics)

Solo output. Le metriche di latenza per il callback.

GuardrailLatency

Rappresentazione JSON
{
  "guardrail": string,
  "guardrailDisplayName": string,
  "latencyMetrics": {
    object (LatencyMetrics)
  }
}
Campi
guardrail

string

Solo output. Il nome della barriera di protezione. Formato: projects/{project}/locations/{location}/apps/{app}/guardrails/{guardrail}.

guardrailDisplayName

string

Solo output. Il nome visualizzato della barriera protettiva.

latencyMetrics

object (LatencyMetrics)

Solo output. Le metriche di latenza per la barriera protettiva.

LlmCallLatency

Rappresentazione JSON
{
  "model": string,
  "latencyMetrics": {
    object (LatencyMetrics)
  }
}
Campi
model

string

Solo output. Il nome del modello.

latencyMetrics

object (LatencyMetrics)

Solo output. Le metriche di latenza per la chiamata LLM.

PersonaRunConfig

Rappresentazione JSON
{
  "persona": string,
  "taskCount": integer
}
Campi
persona

string

Facoltativo. La persona da utilizzare per la valutazione. Formato: projects/{project}/locations/{location}/apps/{app}/evaluationPersonas/{evaluationPersona}

taskCount

integer

Facoltativo. Il numero di attività da eseguire per la persona.

OptimizationConfig

Rappresentazione JSON
{
  "generateLossReport": boolean,
  "assistantSession": string,
  "reportSummary": string,
  "shouldSuggestFix": boolean,
  "status": enum (OptimizationStatus),
  "errorMessage": string,
  "lossReport": {
    object
  }
}
Campi
generateLossReport

boolean

Facoltativo. Se generare un report di perdita.

assistantSession

string

Solo output. La sessione dell'assistente da utilizzare per l'ottimizzazione in base a questa esecuzione della valutazione. Formato: projects/{project}/locations/{location}/apps/{app}/assistantSessions/{assistantSession}

reportSummary

string

Solo output. Il riepilogo della denuncia di smarrimento.

shouldSuggestFix

boolean

Solo output. Se suggerire una correzione per le perdite.

status

enum (OptimizationStatus)

Solo output. Lo stato dell'esecuzione dell'ottimizzazione.

errorMessage

string

Solo output. Il messaggio di errore se l'esecuzione dell'ottimizzazione non è riuscita.

lossReport

object (Struct format)

Solo output. Il report sulle perdite generato.

Struct

Rappresentazione JSON
{
  "fields": {
    string: value,
    ...
  }
}
Campi
fields

map (key: string, value: value (Value format))

Mappa non ordinata di valori con tipo dinamico.

Un oggetto contenente un elenco di coppie "key": value. Esempio: { "name": "wrench", "mass": "1.3kg", "count": "3" }.

FieldsEntry

Rappresentazione JSON
{
  "key": string,
  "value": value
}
Campi
key

string

value

value (Value format)

Valore

Rappresentazione JSON
{

  // Union field kind can be only one of the following:
  "nullValue": null,
  "numberValue": number,
  "stringValue": string,
  "boolValue": boolean,
  "structValue": {
    object
  },
  "listValue": array
  // End of list of possible types for union field kind.
}
Campi
Campo unione kind. Il tipo di valore. kind può essere solo uno dei seguenti tipi:
nullValue

null

Rappresenta un valore null.

numberValue

number

Rappresenta un valore double.

stringValue

string

Rappresenta un valore stringa.

boolValue

boolean

Rappresenta un valore booleano.

structValue

object (Struct format)

Rappresenta un valore strutturato.

listValue

array (ListValue format)

Rappresenta un Value ripetuto.

ListValue

Rappresentazione JSON
{
  "values": [
    value
  ]
}
Campi
values[]

value (Value format)

Campo ripetuto di valori con tipo dinamico.

Annotazioni dello strumento

Suggerimento distruttivo: ❌ | Suggerimento idempotente: ✅ | Suggerimento di sola lettura: ✅ | Suggerimento open world: ❌