MCP Tools Reference: ces.googleapis.com

Outil : get_evaluation_run

Accède aux détails de l'exécution de l'évaluation spécifiée.

L'exemple suivant montre comment utiliser curl pour appeler l'outil MCP get_evaluation_run.

Requête curl
                  
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \
--header 'content-type: application/json' \
--header 'accept: application/json, text/event-stream' \
--data '{
  "method": "tools/call",
  "params": {
    "name": "get_evaluation_run",
    "arguments": {
      // provide these details according to the tool's MCP specification
    }
  },
  "jsonrpc": "2.0",
  "id": 1
}'
                

Schéma d'entrée

Message de requête pour EvaluationService.GetEvaluationRun.

GetEvaluationRunRequest

Représentation JSON
{
  "name": string
}
Champs
name

string

Obligatoire. Nom de ressource de l'exécution d'évaluation à récupérer.

Schéma de sortie

Une exécution d'évaluation représente tous les résultats d'évaluation d'une exécution d'évaluation.

EvaluationRun

Représentation JSON
{
  "name": string,
  "displayName": string,
  "evaluationResults": [
    string
  ],
  "createTime": string,
  "initiatedBy": string,
  "appVersion": string,
  "appVersionDisplayName": string,
  "changelog": string,
  "changelogCreateTime": string,
  "evaluations": [
    string
  ],
  "evaluationDataset": string,
  "evaluationType": enum (EvaluationType),
  "state": enum (EvaluationRunState),
  "progress": {
    object (Progress)
  },
  "config": {
    object (EvaluationConfig)
  },
  "error": {
    object (Status)
  },
  "errorInfo": {
    object (EvaluationErrorInfo)
  },
  "evaluationRunSummaries": {
    string: {
      object (EvaluationRunSummary)
    },
    ...
  },
  "latencyReport": {
    object (LatencyReport)
  },
  "runCount": integer,
  "personaRunConfigs": [
    {
      object (PersonaRunConfig)
    }
  ],
  "optimizationConfig": {
    object (OptimizationConfig)
  },
  "scheduledEvaluationRun": string,
  "goldenRunMethod": enum (GoldenRunMethod)
}
Champs
name

string

Identifiant. Identifiant unique de l'exécution de l'évaluation. Format : projects/{project}/locations/{location}/apps/{app}/evaluationRuns/{evaluationRun}

displayName

string

Facultatif. Nom à afficher défini par l'utilisateur pour l'exécution de l'évaluation. Par défaut : " run - ".

evaluationResults[]

string

Uniquement en sortie. Résultats de l'évaluation qui font partie de cette exécution. Format : projects/{project}/locations/{location}/apps/{app}/evaluations/{evaluation}/results/{result}

createTime

string (Timestamp format)

Uniquement en sortie. Code temporel de la création de l'exécution de l'évaluation.

Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" ou "2014-10-02T15:01:23+05:30".

initiatedBy

string

Uniquement en sortie. Utilisateur ayant lancé l'exécution de l'évaluation.

appVersion

string

Uniquement en sortie. Version de l'application à évaluer. Format : projects/{project}/locations/{location}/apps/{app}/versions/{version}

appVersionDisplayName

string

Uniquement en sortie. Nom à afficher du app_version par rapport auquel l'évaluation a été exécutée.

changelog

string

Uniquement en sortie. Journal des modifications de la version de l'application par rapport à laquelle l'évaluation a été exécutée. Cette valeur est renseignée si l'utilisateur exécute l'évaluation sur la dernière version ou le brouillon.

changelogCreateTime

string (Timestamp format)

Uniquement en sortie. Heure de création du journal des modifications de la version de l'application par rapport à laquelle l'évaluation a été effectuée. Cette valeur est renseignée si l'utilisateur exécute l'évaluation sur la dernière version ou le brouillon.

Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" ou "2014-10-02T15:01:23+05:30".

evaluations[]

string

Uniquement en sortie. Évaluations incluses dans cette exécution. La liste peut contenir des évaluations de l'un ou l'autre type. Ce champ s'exclut mutuellement avec evaluation_dataset. Format : projects/{project}/locations/{location}/apps/{app}/evaluations/{evaluation}

evaluationDataset

string

Uniquement en sortie. Ensemble de données d'évaluation auquel cette exécution est associée. Ce champ s'exclut mutuellement avec evaluations. Format : projects/{project}/locations/{location}/apps/{app}/evaluationDatasets/{evaluationDataset}

evaluationType

enum (EvaluationType)

Uniquement en sortie. Type d'évaluations dans cette exécution.

state

enum (EvaluationRunState)

Uniquement en sortie. État de l'exécution de l'évaluation.

progress

object (Progress)

Uniquement en sortie. Progression de l'exécution de l'évaluation.

config

object (EvaluationConfig)

Uniquement en sortie. Configuration utilisée lors de l'exécution.

error
(deprecated)

object (Status)

Uniquement en sortie. Obsolète : utilisez error_info à la place. Erreurs rencontrées lors de l'exécution.

errorInfo

object (EvaluationErrorInfo)

Uniquement en sortie. Informations sur les erreurs liées à l'exécution de l'évaluation.

evaluationRunSummaries

map (key: string, value: object (EvaluationRunSummary))

Uniquement en sortie. Mappage du nom de l'évaluation sur EvaluationRunSummary.

Objet contenant une liste de paires "key": value. Exemple : { "name": "wrench", "mass": "1.3kg", "count": "3" }.

latencyReport

object (LatencyReport)

Uniquement en sortie. Rapport sur la latence pour l'exécution de l'évaluation.

runCount

integer

Uniquement en sortie. Nombre de fois que les évaluations de l'exécution ont été effectuées.

personaRunConfigs[]

object (PersonaRunConfig)

Uniquement en sortie. Configuration à utiliser pour l'exécution par persona.

optimizationConfig

object (OptimizationConfig)

Facultatif. Configuration pour exécuter l'étape d'optimisation après l'exécution de l'évaluation. Si elle n'est pas définie, l'étape d'optimisation ne sera pas exécutée.

scheduledEvaluationRun

string

Uniquement en sortie. Nom de ressource de l'exécution d'évaluation planifiée qui a créé cette exécution d'évaluation. Ce champ n'est défini que si l'exécution de l'évaluation a été créée par une exécution d'évaluation planifiée. Format : projects/{project}/locations/{location}/apps/{app}/scheduledEvaluationRuns/{scheduled_evaluation_run}

goldenRunMethod

enum (GoldenRunMethod)

Uniquement en sortie. Méthode utilisée pour exécuter l'évaluation.

Horodatage

Représentation JSON
{
  "seconds": string,
  "nanos": integer
}
Champs
seconds

string (int64 format)

Représente les secondes de l'heure UTC à partir de l'epoch Unix 1970-01-01T00:00:00Z. La valeur doit être comprise entre -62135596800 et 253402300799 inclus (ce qui correspond à 0001-01-01T00:00:00Z et 9999-12-31T23:59:59Z).

nanos

integer

Fractions de secondes non négatives avec une précision de l'ordre de la nanoseconde. Ce champ correspond à la partie en nanosecondes de la durée, et non à une alternative aux secondes. Les valeurs de secondes négatives avec des fractions doivent toujours comporter des valeurs de nanosecondes non négatives comptabilisées dans le temps. La valeur doit être comprise entre 0 et 999 999 999 inclus.

Progression

Représentation JSON
{
  "totalCount": integer,
  "failedCount": integer,
  "errorCount": integer,
  "completedCount": integer,
  "passedCount": integer
}
Champs
totalCount

integer

Uniquement en sortie. Nombre total de résultats d'évaluation dans cette exécution.

failedCount

integer

Uniquement en sortie. Nombre de résultats d'évaluation terminés avec un résultat ÉCHEC. (EvaluationResult.execution_state est défini sur COMPLETED et EvaluationResult.evaluation_status est défini sur FAIL).

errorCount

integer

Uniquement en sortie. Nombre de résultats d'évaluation dont l'exécution a échoué. (EvaluationResult.execution_state est défini sur ERROR).

completedCount

integer

Uniquement en sortie. Nombre de résultats d'évaluation qui ont abouti. (EvaluationResult.execution_state est défini sur COMPLETED).

passedCount

integer

Uniquement en sortie. Nombre de résultats d'évaluation terminés avec le résultat "RÉUSSITE". (EvaluationResult.execution_state est défini sur COMPLETED et EvaluationResult.evaluation_status est défini sur PASS).

EvaluationConfig

Représentation JSON
{
  "inputAudioConfig": {
    object (InputAudioConfig)
  },
  "outputAudioConfig": {
    object (OutputAudioConfig)
  },
  "evaluationChannel": enum (EvaluationChannel),
  "toolCallBehaviour": enum (EvaluationToolCallBehaviour)
}
Champs
inputAudioConfig
(deprecated)

object (InputAudioConfig)

Facultatif. Configuration pour le traitement de l'entrée audio.

outputAudioConfig
(deprecated)

object (OutputAudioConfig)

Facultatif. Configuration pour générer le contenu audio de sortie.

evaluationChannel

enum (EvaluationChannel)

Facultatif. Chaîne à évaluer.

toolCallBehaviour

enum (EvaluationToolCallBehaviour)

Facultatif. Indique si l'évaluation doit utiliser de vrais appels d'outils ou des outils factices.

InputAudioConfig

Représentation JSON
{
  "audioEncoding": enum (AudioEncoding),
  "sampleRateHertz": integer,
  "noiseSuppressionLevel": string
}
Champs
audioEncoding

enum (AudioEncoding)

Obligatoire. Encodage des données audio d'entrée.

sampleRateHertz

integer

Obligatoire. Taux d'échantillonnage (en hertz) des données audio d'entrée.

noiseSuppressionLevel

string

Facultatif. Indique si la suppression du bruit doit être activée pour l'entrée audio. Les valeurs disponibles sont "low", "moderate", "high" et "very_high".

OutputAudioConfig

Représentation JSON
{
  "audioEncoding": enum (AudioEncoding),
  "sampleRateHertz": integer
}
Champs
audioEncoding

enum (AudioEncoding)

Obligatoire. Encodage des données audio de sortie.

sampleRateHertz

integer

Obligatoire. Taux d'échantillonnage (en hertz) des données audio de sortie.

État

Représentation JSON
{
  "code": integer,
  "message": string,
  "details": [
    {
      "@type": string,
      field1: ...,
      ...
    }
  ]
}
Champs
code

integer

Code d'état, qui doit être une valeur d'énumération de google.rpc.Code.

message

string

Message d'erreur destiné au développeur, qui doit être en anglais. Tout message d'erreur destiné aux utilisateurs doit être localisé et envoyé dans le champ google.rpc.Status.details, ou localisé par le client.

details[]

object

Liste de messages comportant les détails de l'erreur. Il existe un ensemble commun de types de message utilisable par les API.

Objet contenant des champs d'un type arbitraire. Un champ supplémentaire "@type" contient un URI identifiant le type. Exemple : { "id": 1234, "@type": "types.example.com/standard/id" }.

Tous

Représentation JSON
{
  "typeUrl": string,
  "value": string
}
Champs
typeUrl

string

Identifie le type du message Protobuf sérialisé avec une référence URI composée d'un préfixe se terminant par une barre oblique et du nom de type complet.

Exemple : type.googleapis.com/google.protobuf.StringValue

Cette chaîne doit contenir au moins un caractère /, et le contenu après le dernier / doit être le nom complet du type sous forme canonique, sans point au début. N'écrivez pas de schéma sur ces références URI afin que les clients ne tentent pas de les contacter.

Le préfixe est arbitraire et les implémentations Protobuf sont censées supprimer tout ce qui précède le dernier / (y compris) pour identifier le type. type.googleapis.com/ est un préfixe par défaut courant requis par certaines anciennes implémentations. Ce préfixe n'indique pas l'origine du type, et les URI qui le contiennent ne sont pas censés répondre aux requêtes.

Toutes les chaînes d'URL de type doivent être des références URI légales avec la restriction supplémentaire (pour le format texte) que le contenu de la référence ne doit être composé que de caractères alphanumériques, d'échappements encodés en pourcentage et de caractères de l'ensemble suivant (sans les accents graves extérieurs) : /-.~_!$&()*+,;=. Bien que nous autorisions les encodages en pourcentage, les implémentations ne doivent pas les décoder pour éviter toute confusion avec les analyseurs existants. Par exemple, type.googleapis.com%2FFoo doit être rejeté.

Dans la conception d'origine de Any, la possibilité de lancer un service de résolution de type à ces URL de type a été envisagée, mais Protobuf n'en a jamais implémenté et considère que la prise de contact avec ces URL est problématique et constitue un problème de sécurité potentiel. N'essayez pas de contacter les URL de type.

value

string (bytes format)

Contient une sérialisation Protobuf du type décrit par type_url.

Chaîne encodée en base64.

EvaluationErrorInfo

Représentation JSON
{
  "errorType": enum (ErrorType),
  "errorMessage": string,
  "sessionId": string
}
Champs
errorType

enum (ErrorType)

Uniquement en sortie. Type d'erreur.

errorMessage

string

Uniquement en sortie. Message d'erreur.

sessionId

string

Uniquement en sortie. ID de session de la conversation à l'origine de l'erreur.

EvaluationRunSummariesEntry

Représentation JSON
{
  "key": string,
  "value": {
    object (EvaluationRunSummary)
  }
}
Champs
key

string

value

object (EvaluationRunSummary)

EvaluationRunSummary

Représentation JSON
{
  "passedCount": integer,
  "failedCount": integer,
  "errorCount": integer
}
Champs
passedCount

integer

Uniquement en sortie. Nombre de résultats réussis pour l'évaluation associée lors de cette exécution.

failedCount

integer

Uniquement en sortie. Nombre de résultats ayant échoué pour l'évaluation associée lors de cette exécution.

errorCount

integer

Uniquement en sortie. Nombre de résultats d'erreur pour l'évaluation associée lors de cette exécution.

LatencyReport

Représentation JSON
{
  "toolLatencies": [
    {
      object (ToolLatency)
    }
  ],
  "callbackLatencies": [
    {
      object (CallbackLatency)
    }
  ],
  "guardrailLatencies": [
    {
      object (GuardrailLatency)
    }
  ],
  "llmCallLatencies": [
    {
      object (LlmCallLatency)
    }
  ],
  "sessionCount": integer
}
Champs
toolLatencies[]

object (ToolLatency)

Uniquement en sortie. Liste non triée. Métriques de latence pour chaque outil.

callbackLatencies[]

object (CallbackLatency)

Uniquement en sortie. Liste non triée. Métriques de latence pour chaque rappel.

guardrailLatencies[]

object (GuardrailLatency)

Uniquement en sortie. Liste non triée. Métriques de latence pour chaque garde-fou.

llmCallLatencies[]

object (LlmCallLatency)

Uniquement en sortie. Liste non triée. Métriques de latence pour chaque appel LLM.

sessionCount

integer

Uniquement en sortie. Nombre total de sessions prises en compte dans le rapport sur la latence.

ToolLatency

Représentation JSON
{
  "toolDisplayName": string,
  "latencyMetrics": {
    object (LatencyMetrics)
  },

  // Union field tool_identifier can be only one of the following:
  "tool": string,
  "toolsetTool": {
    object (ToolsetTool)
  }
  // End of list of possible types for union field tool_identifier.
}
Champs
toolDisplayName

string

Uniquement en sortie. Nom à afficher de l'outil.

latencyMetrics

object (LatencyMetrics)

Uniquement en sortie. Métriques de latence de l'outil.

Champ d'union tool_identifier. Identifiant de l'outil. tool_identifier ne peut être qu'un des éléments suivants :
tool

string

Uniquement en sortie. Format : projects/{project}/locations/{location}/apps/{app}/tools/{tool}.

toolsetTool

object (ToolsetTool)

Uniquement en sortie. Identifiant de l'outil du toolset.

ToolsetTool

Représentation JSON
{
  "toolset": string,
  "toolId": string
}
Champs
toolset

string

Obligatoire. Nom de ressource de l'ensemble d'outils à partir duquel cet outil est dérivé. Format : projects/{project}/locations/{location}/apps/{app}/toolsets/{toolset}

toolId

string

Facultatif. ID de l'outil permettant de filtrer les outils pour récupérer le schéma.

LatencyMetrics

Représentation JSON
{
  "p50Latency": string,
  "p90Latency": string,
  "p99Latency": string,
  "callCount": integer
}
Champs
p50Latency

string (Duration format)

Uniquement en sortie. Latence au 50e centile.

Durée en secondes avec neuf chiffres au maximum après la virgule et se terminant par "s". Exemple : "3.5s"

p90Latency

string (Duration format)

Uniquement en sortie. Latence au 90e centile.

Durée en secondes avec neuf chiffres au maximum après la virgule et se terminant par "s". Exemple : "3.5s"

p99Latency

string (Duration format)

Uniquement en sortie. Latence au 99e centile.

Durée en secondes avec neuf chiffres au maximum après la virgule et se terminant par "s". Exemple : "3.5s"

callCount

integer

Uniquement en sortie. Nombre de fois où la ressource a été appelée.

Durée

Représentation JSON
{
  "seconds": string,
  "nanos": integer
}
Champs
seconds

string (int64 format)

Secondes signées de la durée. La valeur doit être comprise entre -315 576 000 000 et +315 576 000 000 (inclus). Remarque : Ces limites sont calculées à partir de : 60 s/min * 60 min/h * 24 h/jour * 365,25 jours/an * 10 000 ans

nanos

integer

Fractions de secondes signées avec une précision de l'ordre de la nanoseconde pour la durée. Les durées inférieures à une seconde sont représentées par un champ seconds égal à 0 et un champ nanos positif ou négatif. Pour les durées d'une seconde ou plus, une valeur non nulle pour le champ nanos doit avoir le même signe que le champ seconds. La valeur doit être comprise entre -999 999 999 et +999 999 999 inclus.

CallbackLatency

Représentation JSON
{
  "stage": string,
  "latencyMetrics": {
    object (LatencyMetrics)
  }
}
Champs
stage

string

Uniquement en sortie. Étape du rappel.

latencyMetrics

object (LatencyMetrics)

Uniquement en sortie. Métriques de latence pour le rappel.

GuardrailLatency

Représentation JSON
{
  "guardrail": string,
  "guardrailDisplayName": string,
  "latencyMetrics": {
    object (LatencyMetrics)
  }
}
Champs
guardrail

string

Uniquement en sortie. Nom du garde-fou. Format : projects/{project}/locations/{location}/apps/{app}/guardrails/{guardrail}.

guardrailDisplayName

string

Uniquement en sortie. Nom à afficher du garde-fou.

latencyMetrics

object (LatencyMetrics)

Uniquement en sortie. Métriques de latence pour le garde-fou.

LlmCallLatency

Représentation JSON
{
  "model": string,
  "latencyMetrics": {
    object (LatencyMetrics)
  }
}
Champs
model

string

Uniquement en sortie. Nom du modèle.

latencyMetrics

object (LatencyMetrics)

Uniquement en sortie. Métriques de latence pour l'appel LLM.

PersonaRunConfig

Représentation JSON
{
  "persona": string,
  "taskCount": integer
}
Champs
persona

string

Facultatif. Personnalité à utiliser pour l'évaluation. Format : projects/{project}/locations/{location}/apps/{app}/evaluationPersonas/{evaluationPersona}

taskCount

integer

Facultatif. Nombre de tâches à exécuter pour le persona.

OptimizationConfig

Représentation JSON
{
  "generateLossReport": boolean,
  "assistantSession": string,
  "reportSummary": string,
  "shouldSuggestFix": boolean,
  "status": enum (OptimizationStatus),
  "errorMessage": string,
  "lossReport": {
    object
  }
}
Champs
generateLossReport

boolean

Facultatif. Indique si un rapport sur les pertes doit être généré.

assistantSession

string

Uniquement en sortie. Session de l'assistant à utiliser pour l'optimisation en fonction de cette exécution d'évaluation. Format : projects/{project}/locations/{location}/apps/{app}/assistantSessions/{assistantSession}

reportSummary

string

Uniquement en sortie. Résumé du rapport sur les pertes.

shouldSuggestFix

boolean

Uniquement en sortie. Indique s'il faut suggérer une correction pour les pertes.

status

enum (OptimizationStatus)

Uniquement en sortie. État de l'exécution de l'optimisation.

errorMessage

string

Uniquement en sortie. Message d'erreur si l'exécution de l'optimisation a échoué.

lossReport

object (Struct format)

Uniquement en sortie. Rapport sur les pertes généré.

Struct

Représentation JSON
{
  "fields": {
    string: value,
    ...
  }
}
Champs
fields

map (key: string, value: value (Value format))

Carte non ordonnée de valeurs typées de manière dynamique.

Objet contenant une liste de paires "key": value. Exemple : { "name": "wrench", "mass": "1.3kg", "count": "3" }.

FieldsEntry

Représentation JSON
{
  "key": string,
  "value": value
}
Champs
key

string

value

value (Value format)

Valeur

Représentation JSON
{

  // Union field kind can be only one of the following:
  "nullValue": null,
  "numberValue": number,
  "stringValue": string,
  "boolValue": boolean,
  "structValue": {
    object
  },
  "listValue": array
  // End of list of possible types for union field kind.
}
Champs
Champ d'union kind. Type de valeur. kind ne peut être qu'un des éléments suivants :
nullValue

null

Représente une valeur nulle.

numberValue

number

Représente une valeur double.

stringValue

string

Représente une valeur de chaîne.

boolValue

boolean

Représente une valeur booléenne.

structValue

object (Struct format)

Représente une valeur structurée.

listValue

array (ListValue format)

Représente un Value répété.

ListValue

Représentation JSON
{
  "values": [
    value
  ]
}
Champs
values[]

value (Value format)

Champ répété de valeurs typées de manière dynamique.

Annotations d'outils

Indication destructive : ❌ | Indication idempotente : ✅ | Indication en lecture seule : ✅ | Indication Open World : ❌