Ferramenta: get_evaluation_run
Recebe detalhes da execução de avaliação especificada.
O exemplo a seguir demonstra como usar curl para invocar a ferramenta get_evaluation_run MCP.
| Solicitação curl |
|---|
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "get_evaluation_run", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
Esquema de entrada
Mensagem de solicitação para EvaluationService.GetEvaluationRun.
GetEvaluationRunRequest
| Representação JSON |
|---|
{ "name": string } |
| Campos | |
|---|---|
name |
Obrigatório. O nome do recurso da execução de avaliação a ser recuperada. |
Esquema de saída
Uma execução de avaliação representa todos os resultados de uma execução de avaliação.
EvaluationRun
| Representação JSON |
|---|
{ "name": string, "displayName": string, "evaluationResults": [ string ], "createTime": string, "initiatedBy": string, "appVersion": string, "appVersionDisplayName": string, "changelog": string, "changelogCreateTime": string, "evaluations": [ string ], "evaluationDataset": string, "evaluationType": enum ( |
| Campos | |
|---|---|
name |
Identificador. O identificador exclusivo da execução da avaliação. Formato: |
displayName |
Opcional. Nome de exibição definido pelo usuário da execução da avaliação. Padrão: " |
evaluationResults[] |
Apenas saída. Os resultados da avaliação que fazem parte desta execução. Formato: |
createTime |
Apenas saída. Carimbo de data/hora em que a execução da avaliação foi criada. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
initiatedBy |
Apenas saída. O usuário que iniciou a execução da avaliação. |
appVersion |
Apenas saída. A versão do app a ser avaliada. Formato: |
appVersionDisplayName |
Apenas saída. O nome de exibição do |
changelog |
Apenas saída. O changelog da versão do app em que a avaliação foi executada. Esse campo é preenchido se o usuário executar a avaliação na versão mais recente/rascunho. |
changelogCreateTime |
Apenas saída. O horário de criação do changelog da versão do app em que a avaliação foi executada. Esse campo é preenchido se o usuário executar a avaliação na versão mais recente/rascunho. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
evaluations[] |
Apenas saída. As avaliações que fazem parte desta execução. A lista pode conter avaliações de qualquer tipo. Esse campo é mutuamente exclusivo com |
evaluationDataset |
Apenas saída. O conjunto de dados de avaliação associado a esta execução. Esse campo é mutuamente exclusivo com |
evaluationType |
Apenas saída. O tipo de avaliações nesta execução. |
state |
Apenas saída. O estado da execução da avaliação. |
progress |
Apenas saída. O progresso da execução da avaliação. |
config |
Apenas saída. A configuração usada na execução. |
error |
Apenas saída. Descontinuado: use error_info. Erros encontrados durante a execução. |
errorInfo |
Apenas saída. Informações de erro para a execução da avaliação. |
evaluationRunSummaries |
Apenas saída. Mapa do nome da avaliação para EvaluationRunSummary. Um objeto com uma lista de pares |
latencyReport |
Apenas saída. Relatório de latência da execução da avaliação. |
runCount |
Apenas saída. O número de vezes que as avaliações dentro da execução foram realizadas. |
personaRunConfigs[] |
Apenas saída. A configuração a ser usada para a execução por persona. |
optimizationConfig |
Opcional. Configuração para executar a etapa de otimização após a execução da avaliação. Se não for definido, a etapa de otimização não será executada. |
scheduledEvaluationRun |
Apenas saída. O nome do recurso da execução de avaliação programada que criou esta execução de avaliação. Esse campo só é definido se a execução da avaliação foi criada por uma execução programada. Formato: |
goldenRunMethod |
Apenas saída. O método usado para executar a avaliação. |
Carimbo de data/hora
| Representação JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Representa os segundos do horário UTC desde a época Unix 1970-01-01T00:00:00Z. Precisa estar entre -62135596800 e 253402300799 (o que corresponde a 0001-01-01T00:00:00Z a 9999-12-31T23:59:59Z). |
nanos |
Frações não negativas de um segundo com resolução de nanossegundos. Esse campo é a parte de nanossegundos da duração, não uma alternativa aos segundos. Os valores de segundos negativos com frações ainda precisam ter valores em nanossegundos não negativos que representam períodos posteriores. O valor precisa ser de 0 a 999.999.999 (inclusive). |
Progresso
| Representação JSON |
|---|
{ "totalCount": integer, "failedCount": integer, "errorCount": integer, "completedCount": integer, "passedCount": integer } |
| Campos | |
|---|---|
totalCount |
Apenas saída. Número total de resultados da avaliação nesta execução. |
failedCount |
Apenas saída. Número de resultados de avaliação concluídos com um resultado de FALHA. (EvaluationResult.execution_state é COMPLETED e EvaluationResult.evaluation_status é FAIL). |
errorCount |
Apenas saída. Número de resultados de avaliação que não foram executados. (EvaluationResult.execution_state é ERROR). |
completedCount |
Apenas saída. Número de resultados de avaliação concluídos com êxito. (EvaluationResult.execution_state é COMPLETED). |
passedCount |
Apenas saída. Número de resultados de avaliação concluídos com um resultado de PASS. (EvaluationResult.execution_state é COMPLETED e EvaluationResult.evaluation_status é PASS). |
EvaluationConfig
| Representação JSON |
|---|
{ "inputAudioConfig": { object ( |
| Campos | |
|---|---|
inputAudioConfig |
Opcional. Configuração para processar o áudio de entrada. |
outputAudioConfig |
Opcional. Configuração para gerar o áudio de saída. |
evaluationChannel |
Opcional. O canal a ser avaliado. |
toolCallBehaviour |
Opcional. Especifica se a avaliação deve usar chamadas de ferramentas reais ou falsas. |
InputAudioConfig
| Representação JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obrigatório. A codificação dos dados de áudio de entrada. |
sampleRateHertz |
Obrigatório. A taxa de amostragem (em Hertz) dos dados de áudio de entrada. |
noiseSuppressionLevel |
Opcional. Define se a redução de ruído será ativada no áudio de entrada. Os valores disponíveis são "low", "moderate", "high", "very_high". |
OutputAudioConfig
| Representação JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obrigatório. A codificação dos dados de áudio de saída. |
sampleRateHertz |
Obrigatório. A taxa de amostragem (em Hertz) dos dados de áudio de saída. |
Status
| Representação JSON |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| Campos | |
|---|---|
code |
O código de status, que precisa ser um valor de enumeração de |
message |
Uma mensagem de erro em inglês para o desenvolvedor. Qualquer mensagem de erro para o usuário precisa ser localizada e enviada no campo |
details[] |
Uma lista de mensagens com os detalhes do erro. Há um conjunto comum de tipos de mensagens para as APIs usarem. Um objeto contendo campos de um tipo arbitrário. Um campo adicional |
Qualquer
| Representação JSON |
|---|
{ "typeUrl": string, "value": string } |
| Campos | |
|---|---|
typeUrl |
Identifica o tipo da mensagem Protobuf serializada com uma referência de URI que consiste em um prefixo que termina em uma barra e o nome de tipo totalmente qualificado. Exemplo: type.googleapis.com/google.protobuf.StringValue Essa string precisa conter pelo menos um caractere O prefixo é arbitrário, e as implementações do Protobuf devem remover tudo até o último Todas as strings de URL de tipo precisam ser referências de URI válidas com a restrição adicional (para o formato de texto) de que o conteúdo da referência deve consistir apenas em caracteres alfanuméricos, escapes codificados por porcentagem e caracteres no seguinte conjunto (sem incluir as crases externas): No design original do |
value |
Contém uma serialização Protobuf do tipo descrito por type_url. Uma string codificada em base64. |
EvaluationErrorInfo
| Representação JSON |
|---|
{
"errorType": enum ( |
| Campos | |
|---|---|
errorType |
Apenas saída. O tipo de erro. |
errorMessage |
Apenas saída. A mensagem de erro. |
sessionId |
Apenas saída. O ID da sessão da conversa que causou o erro. |
EvaluationRunSummariesEntry
| Representação JSON |
|---|
{
"key": string,
"value": {
object ( |
| Campos | |
|---|---|
key |
|
value |
|
EvaluationRunSummary
| Representação JSON |
|---|
{ "passedCount": integer, "failedCount": integer, "errorCount": integer } |
| Campos | |
|---|---|
passedCount |
Apenas saída. Número de resultados aprovados para a avaliação associada nesta execução. |
failedCount |
Apenas saída. Número de resultados com falha para a avaliação associada nesta execução. |
errorCount |
Apenas saída. Número de resultados de erro para a avaliação associada nesta execução. |
LatencyReport
| Representação JSON |
|---|
{ "toolLatencies": [ { object ( |
| Campos | |
|---|---|
toolLatencies[] |
Apenas saída. Lista não ordenada. Métricas de latência para cada ferramenta. |
callbackLatencies[] |
Apenas saída. Lista não ordenada. Métricas de latência para cada callback. |
guardrailLatencies[] |
Apenas saída. Lista não ordenada. Métricas de latência para cada proteção. |
llmCallLatencies[] |
Apenas saída. Lista não ordenada. Métricas de latência para cada chamada de LLM. |
sessionCount |
Apenas saída. O número total de sessões consideradas no relatório de latência. |
ToolLatency
| Representação JSON |
|---|
{ "toolDisplayName": string, "latencyMetrics": { object ( |
| Campos | |
|---|---|
toolDisplayName |
Apenas saída. O nome de exibição da ferramenta. |
latencyMetrics |
Apenas saída. As métricas de latência da ferramenta. |
Campo de união tool_identifier. O identificador da ferramenta. tool_identifier pode ser apenas de um dos tipos a seguir: |
|
tool |
Apenas saída. Formato: |
toolsetTool |
Apenas saída. O identificador da ferramenta do conjunto de ferramentas. |
ToolsetTool
| Representação JSON |
|---|
{ "toolset": string, "toolId": string } |
| Campos | |
|---|---|
toolset |
Obrigatório. O nome do recurso do conjunto de ferramentas de que essa ferramenta deriva. Formato: |
toolId |
Opcional. O ID da ferramenta para filtrar as ferramentas e recuperar o esquema. |
LatencyMetrics
| Representação JSON |
|---|
{ "p50Latency": string, "p90Latency": string, "p99Latency": string, "callCount": integer } |
| Campos | |
|---|---|
p50Latency |
Apenas saída. A latência do 50º percentil. Duração em segundos com até nove dígitos fracionários, terminando em " |
p90Latency |
Apenas saída. A latência no 90º percentil. Duração em segundos com até nove dígitos fracionários, terminando em " |
p99Latency |
Apenas saída. A latência do 99º percentil. Duração em segundos com até nove dígitos fracionários, terminando em " |
callCount |
Apenas saída. O número de vezes que o recurso foi chamado. |
Duração
| Representação JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Segundos assinados do período. Precisa estar entre -315.576.000.000 e +315.576.000.000 (inclusive). Observação: esses limites são calculados da seguinte forma: 60 s/min * 60 min/h * 24 h/dia * 365,25 dias/ano * 10.000 anos |
nanos |
Frações assinadas de um segundo com resolução de nanossegundos do período. Durações menores que um segundo são representadas com um campo |
CallbackLatency
| Representação JSON |
|---|
{
"stage": string,
"latencyMetrics": {
object ( |
| Campos | |
|---|---|
stage |
Apenas saída. O estágio do callback. |
latencyMetrics |
Apenas saída. As métricas de latência do callback. |
GuardrailLatency
| Representação JSON |
|---|
{
"guardrail": string,
"guardrailDisplayName": string,
"latencyMetrics": {
object ( |
| Campos | |
|---|---|
guardrail |
Apenas saída. O nome da proteção. Formato: |
guardrailDisplayName |
Apenas saída. O nome de exibição da proteção. |
latencyMetrics |
Apenas saída. As métricas de latência para o guardrail. |
LlmCallLatency
| Representação JSON |
|---|
{
"model": string,
"latencyMetrics": {
object ( |
| Campos | |
|---|---|
model |
Apenas saída. O nome do modelo. |
latencyMetrics |
Apenas saída. As métricas de latência da chamada de LLM. |
PersonaRunConfig
| Representação JSON |
|---|
{ "persona": string, "taskCount": integer } |
| Campos | |
|---|---|
persona |
Opcional. A persona a ser usada na avaliação. Formato: |
taskCount |
Opcional. O número de tarefas a serem executadas para a persona. |
OptimizationConfig
| Representação JSON |
|---|
{
"generateLossReport": boolean,
"assistantSession": string,
"reportSummary": string,
"shouldSuggestFix": boolean,
"status": enum ( |
| Campos | |
|---|---|
generateLossReport |
Opcional. Se um relatório de perda será gerado. |
assistantSession |
Apenas saída. A sessão do assistente a ser usada para a otimização com base nessa execução de avaliação. Formato: |
reportSummary |
Apenas saída. O resumo do relatório de perda. |
shouldSuggestFix |
Apenas saída. Se é necessário sugerir uma correção para as perdas. |
status |
Apenas saída. O status da execução da otimização. |
errorMessage |
Apenas saída. A mensagem de erro se a execução da otimização falhar. |
lossReport |
Apenas saída. O relatório de perdas gerado. |
Struct
| Representação JSON |
|---|
{ "fields": { string: value, ... } } |
| Campos | |
|---|---|
fields |
Mapa não ordenado de valores com tipagem dinâmica. Um objeto com uma lista de pares |
FieldsEntry
| Representação JSON |
|---|
{ "key": string, "value": value } |
| Campos | |
|---|---|
key |
|
value |
|
Valor
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união kind. O tipo de valor. kind pode ser apenas de um dos tipos a seguir: |
|
nullValue |
Representa um valor nulo. |
numberValue |
Representa um valor double. |
stringValue |
Representa um valor de string. |
boolValue |
Representa um valor booleano. |
structValue |
Representa um valor estruturado. |
listValue |
Representa um |
ListValue
| Representação JSON |
|---|
{ "values": [ value ] } |
| Campos | |
|---|---|
values[] |
Campo repetido de valores digitados dinamicamente. |
Anotações de ferramentas
Dica destrutiva: ❌ | Dica idempotente: ✅ | Dica somente leitura: ✅ | Dica de mundo aberto: ❌