Herramienta: update_evaluation
Actualiza la evaluación especificada. Asegúrate de pasar siempre una máscara de actualización en la entrada.
En el siguiente ejemplo, se muestra cómo usar curl para invocar la herramienta de MCP update_evaluation.
| Solicitud de Curl |
|---|
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "update_evaluation", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
Esquema de entrada
Mensaje de solicitud para EvaluationService.UpdateEvaluation.
UpdateEvaluationRequest
| Representación JSON |
|---|
{
"evaluation": {
object ( |
| Campos | |
|---|---|
evaluation |
Obligatorio. Es la evaluación que se actualizará. |
updateMask |
Es opcional. La máscara de campo se usa para controlar qué campos se actualizan. Si la máscara no está presente, se actualizarán todos los campos. Esta es una lista separada por comas de los nombres de campos completamente calificados. Ejemplo: |
Evaluación
| Representación JSON |
|---|
{ "name": string, "displayName": string, "description": string, "tags": [ string ], "evaluationDatasets": [ string ], "createTime": string, "createdBy": string, "updateTime": string, "lastUpdatedBy": string, "evaluationRuns": [ string ], "etag": string, "aggregatedMetrics": { object ( |
| Campos | |
|---|---|
name |
Es el identificador. Es el identificador único de esta evaluación. Formato: |
displayName |
Obligatorio. Es el nombre visible de la evaluación definido por el usuario. Es único dentro de una app. |
description |
Es opcional. Es la descripción de la evaluación definida por el usuario. |
tags[] |
Es opcional. Son etiquetas definidas por el usuario para categorizar la evaluación. |
evaluationDatasets[] |
Solo salida. Es la lista de conjuntos de datos de evaluación a los que pertenece la evaluación. Formato: |
createTime |
Solo salida. Es la marca de tiempo de cuando se creó la evaluación. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
createdBy |
Solo salida. Es el usuario que creó la evaluación. |
updateTime |
Solo salida. Marca de tiempo de la última actualización de la evaluación. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
lastUpdatedBy |
Solo salida. Es el usuario que actualizó la evaluación por última vez. |
evaluationRuns[] |
Solo salida. Son los EvaluationRuns con los que se asocia esta Evaluación. |
etag |
Solo salida. Es el ETag que se usa para garantizar que el objeto no haya cambiado durante una operación de lectura, modificación y escritura. Si el ETag está vacío, la actualización reemplazará cualquier cambio simultáneo. |
aggregatedMetrics |
Solo salida. Son las métricas agregadas de esta evaluación en todas las ejecuciones. |
lastCompletedResult |
Solo salida. Es el resultado de la evaluación más reciente para esta evaluación. |
invalid |
Solo salida. Indica si la evaluación no es válida. Esto puede suceder si una evaluación hace referencia a una herramienta, un conjunto de herramientas o un agente que se borró. |
lastTenResults[] |
Solo salida. Son los últimos 10 resultados de la evaluación. Este campo solo se completa si include_last_ten_results se establece como verdadero en ListEvaluationsRequest o GetEvaluationRequest. |
Campo de unión inputs. Las entradas para la evaluación inputs solo pueden ser una de las siguientes: |
|
golden |
Es opcional. Son los pasos de referencia que se evaluarán. |
scenario |
Es opcional. Es la configuración de una situación. |
Golden
| Representación JSON |
|---|
{
"turns": [
{
object ( |
| Campos | |
|---|---|
turns[] |
Obligatorio. Son los turnos de oro necesarios para reproducir una conversación de oro. |
evaluationExpectations[] |
Es opcional. Son las expectativas de evaluación con las que se evalúa la conversación reproducida. Formato: |
GoldenTurn
| Representación JSON |
|---|
{ "steps": [ { object ( |
| Campos | |
|---|---|
steps[] |
Obligatorio. Son los pasos necesarios para reproducir una conversación de referencia. |
rootSpan |
Es opcional. Es el intervalo raíz del turno dorado para procesar y mantener la información de audio. |
Paso
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión step. Paso que se debe realizar. step puede ser solo uno de los parámetros siguientes: |
|
userInput |
Es opcional. Es la entrada del usuario para la conversación. |
agentTransfer |
Es opcional. Transferir la conversación a otro agente |
expectation |
Es opcional. Ejecuta una expectativa en el turno actual. |
SessionInput
| Representación JSON |
|---|
{ "willContinue": boolean, // Union field |
| Campos | |
|---|---|
willContinue |
Es opcional. Es una marca que indica si el mensaje actual es un fragmento de una entrada más grande en la sesión de transmisión bidireccional. Cuando se establece en NOTA: Este campo no se aplica a las entradas de audio y DTMF, ya que siempre se procesan automáticamente según la señal de finalización. |
Campo de unión input_type. Es el tipo de entrada. input_type puede ser solo uno de los parámetros siguientes: |
|
text |
Es opcional. Son los datos de texto del usuario final. |
dtmf |
Es opcional. Dígitos de DTMF del usuario final. |
audio |
Es opcional. Son los datos de audio del usuario final. Es una cadena codificada en Base64. |
toolResponses |
Es opcional. Son los resultados de la ejecución de las llamadas a herramientas del cliente. |
image |
Es opcional. Son los datos de imagen del usuario final. |
blob |
Es opcional. Son los datos de BLOB del usuario final. |
variables |
Es opcional. Son las variables contextuales de la sesión, con la clave establecida por el nombre. El agente de CES solo usará las variables declaradas en la app. Las variables no reconocidas se seguirán enviando al [agente de Dialogflow][Agent.RemoteDialogflowAgent] como parámetros de sesión adicionales. |
event |
Es opcional. Es la entrada del evento. |
ToolResponses
| Representación JSON |
|---|
{
"toolResponses": [
{
object ( |
| Campos | |
|---|---|
toolResponses[] |
Es opcional. Es la lista de resultados de la ejecución de la herramienta. |
ToolResponse
| Representación JSON |
|---|
{ "id": string, "displayName": string, "response": { object }, // Union field |
| Campos | |
|---|---|
id |
Es opcional. Es el ID para coincidencias del |
displayName |
Solo salida. Nombre visible de la herramienta. |
response |
Obligatorio. Es el resultado de la ejecución de la herramienta en formato de objeto JSON. Usa la clave "output" para especificar la respuesta de la herramienta y la clave "error" para especificar los detalles del error (si hay alguno). Si no se especifican las claves "output" y "error", toda la "response" se trata como resultado de la ejecución de la herramienta. |
Campo de unión tool_identifier. Es el identificador de la herramienta que se ejecutó. Puede ser una herramienta persistente o una herramienta de un conjunto de herramientas. tool_identifier puede ser solo uno de los parámetros siguientes: |
|
tool |
Es opcional. Es el nombre de la herramienta que se ejecutará. Formato: |
toolsetTool |
Es opcional. Es la herramienta del conjunto de herramientas que se ejecutó. |
ToolsetTool
| Representación JSON |
|---|
{ "toolset": string, "toolId": string } |
| Campos | |
|---|---|
toolset |
Obligatorio. Es el nombre del recurso del conjunto de herramientas del que se deriva esta herramienta. Formato: |
toolId |
Es opcional. Es el ID de la herramienta para filtrar las herramientas y recuperar el esquema. |
Struct
| Representación JSON |
|---|
{ "fields": { string: value, ... } } |
| Campos | |
|---|---|
fields |
Es un mapa no ordenado de valores escritos de forma dinámica. Un objeto que contiene una lista de pares |
FieldsEntry
| Representación JSON |
|---|
{ "key": string, "value": value } |
| Campos | |
|---|---|
key |
|
value |
|
Valor
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión kind. Es el tipo de valor. kind puede ser solo uno de los parámetros siguientes: |
|
nullValue |
Representa un valor nulo. |
numberValue |
Representa un valor doble. |
stringValue |
Representa un valor de cadena. |
boolValue |
Representa un valor booleano. |
structValue |
Representa un valor estructurado. |
listValue |
Representa un |
ListValue
| Representación JSON |
|---|
{ "values": [ value ] } |
| Campos | |
|---|---|
values[] |
Es un campo repetido de valores escritos de forma dinámica. |
Imagen
| Representación JSON |
|---|
{ "mimeType": string, "data": string } |
| Campos | |
|---|---|
mimeType |
Obligatorio. Es el tipo de MIME estándar de IANA de los datos de origen. Los tipos de imágenes admitidos incluyen los siguientes: * image/png * image/jpeg * image/webp |
data |
Obligatorio. Son los bytes sin procesar de la imagen. Es una cadena codificada en Base64. |
BLOB
| Representación JSON |
|---|
{ "mimeType": string, "data": string } |
| Campos | |
|---|---|
mimeType |
Obligatorio. Es el tipo de MIME estándar de IANA de los datos de origen. |
data |
Obligatorio. Son los bytes sin procesar del BLOB. Es una cadena codificada en Base64. |
Evento
| Representación JSON |
|---|
{ "event": string } |
| Campos | |
|---|---|
event |
Obligatorio. Es el nombre del evento. |
AgentTransfer
| Representación JSON |
|---|
{ "targetAgent": string, "displayName": string } |
| Campos | |
|---|---|
targetAgent |
Obligatorio. Es el agente al que se transfiere la conversación. El agente se encargará de la conversación a partir de este punto. Formato: |
displayName |
Solo salida. Es el nombre visible del agente. |
GoldenExpectation
| Representación JSON |
|---|
{ "note": string, // Union field |
| Campos | |
|---|---|
note |
Es opcional. Es una nota para este requisito, útil para informar cuando fallan verificaciones específicas. P. ej., "Check_Payment_Tool_Called". |
Campo de unión condition. Es la verificación real que se realizará. condition puede ser solo uno de los parámetros siguientes: |
|
toolCall |
Es opcional. Verifica que se haya llamado a una herramienta específica con los parámetros. |
toolResponse |
Es opcional. Verifica que una herramienta específica haya tenido la respuesta esperada. |
agentResponse |
Es opcional. Verifica que el agente haya respondido con la respuesta correcta. Se da por sentado el rol de "agente". |
agentTransfer |
Es opcional. Comprueba que el agente haya transferido la conversación a otro agente. |
updatedVariables |
Es opcional. Verifica que el agente haya actualizado las variables de sesión a los valores esperados. También se usa para capturar actualizaciones de variables del agente para las evaluaciones doradas. |
mockToolResponse |
Es opcional. Es la respuesta de la herramienta que se simulará, con los parámetros de interés especificados. El LLM alucinará los parámetros que no se especifiquen. |
ToolCall
| Representación JSON |
|---|
{ "id": string, "displayName": string, "args": { object }, // Union field |
| Campos | |
|---|---|
id |
Es opcional. Es el identificador único de la llamada a la herramienta. Si se completa, el cliente debe devolver el resultado de la ejecución con el ID para coincidencias en |
displayName |
Solo salida. Nombre visible de la herramienta. |
args |
Es opcional. Son los parámetros y valores de entrada de la herramienta en formato de objeto JSON. |
Campo de unión tool_identifier. Es el identificador de la herramienta que se ejecutará. Puede ser una herramienta persistente o una herramienta de un conjunto de herramientas. tool_identifier puede ser solo uno de los parámetros siguientes: |
|
tool |
Es opcional. Es el nombre de la herramienta que se ejecutará. Formato: |
toolsetTool |
Es opcional. Es la herramienta del conjunto de herramientas que se ejecutará. |
Mensaje
| Representación JSON |
|---|
{
"role": string,
"chunks": [
{
object ( |
| Campos | |
|---|---|
role |
Es opcional. Es el rol dentro de la conversación, p.ej., usuario o agente. |
chunks[] |
Es opcional. Es el contenido del mensaje como una serie de fragmentos. |
eventTime |
Es opcional. Es la marca de tiempo del momento en que se envió o recibió el mensaje. No se debe usar si el mensaje forma parte de un Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
Fragmento
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión data. Datos de fragmentos data puede ser solo uno de los parámetros siguientes: |
|
text |
Es opcional. Datos de texto. |
transcript |
Es opcional. Es la transcripción asociada al audio. |
blob |
Es opcional. Son los datos del BLOB. |
payload |
Es opcional. Son los datos de carga útil personalizados. |
image |
Es opcional. Son los datos de la imagen. |
toolCall |
Es opcional. Es la solicitud de ejecución de la herramienta. |
toolResponse |
Es opcional. Es la respuesta de la ejecución de la herramienta. |
agentTransfer |
Es opcional. Es el evento de transferencia del agente. |
updatedVariables |
Un struct representa las variables que se actualizaron en la conversación, con claves según los nombres de las variables. |
defaultVariables |
Un struct representa las variables predeterminadas al comienzo de la conversación, con claves según los nombres de las variables. |
Marca de tiempo
| Representación JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Representa los segundos de la hora UTC desde la época de Unix 1970-01-01T00:00:00Z. Debe estar entre -62135596800 y 253402300799 inclusive (lo que corresponde a 0001-01-01T00:00:00Z y 9999-12-31T23:59:59Z). |
nanos |
Fracciones no negativas de un segundo a una resolución de nanosegundos. Este campo es la parte de la duración en nanosegundos, no una alternativa a los segundos. Los valores de segundos negativos con fracciones deben tener valores nanos no negativos que se cuentan hacia adelante en el tiempo. Debe ser un valor entre 0 y 999,999,999, inclusive. |
Intervalo
| Representación JSON |
|---|
{
"name": string,
"startTime": string,
"endTime": string,
"duration": string,
"attributes": {
object
},
"childSpans": [
{
object ( |
| Campos | |
|---|---|
name |
Solo salida. Es el nombre del intervalo. |
startTime |
Solo salida. Es la hora de inicio del período. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
endTime |
Solo salida. Es la hora de finalización del período. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
duration |
Solo salida. Es la duración del intervalo. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
attributes |
Solo salida. Son los atributos clave-valor asociados con el intervalo. |
childSpans[] |
Solo salida. Son los intervalos secundarios anidados en este intervalo. |
Duración
| Representación JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Son los segundos firmados del período. Debe estar entre -315,576,000,000 y +315,576,000,000, inclusive. Nota: Estos límites se calculan de la siguiente manera: 60 s/min * 60 min/h * 24 h/día * 365.25 días/año * 10,000 años |
nanos |
Fracciones firmadas de un segundo con una resolución de nanosegundos del período. Las duraciones inferiores a un segundo se representan con un campo |
Situación
| Representación JSON |
|---|
{ "task": string, "userFacts": [ { object ( |
| Campos | |
|---|---|
task |
Obligatorio. Es la tarea a la que se orientará el caso de uso. |
userFacts[] |
Es opcional. Son los datos del usuario que se usarán en la situación. |
maxTurns |
Es opcional. Es la cantidad máxima de turnos que se simularán. Si no se especifica, la simulación continuará hasta que se complete la tarea. |
rubrics[] |
Obligatorio. Son las rúbricas con las que se calificará la situación. |
scenarioExpectations[] |
Obligatorio. Es el objeto ScenarioExpectations para evaluar la conversación que produce la simulación del usuario. |
variableOverrides |
Es opcional. Variables o parámetros de sesión como contexto de la sesión, con claves según los nombres de las variables. Los miembros de esta estructura anularán cualquier valor predeterminado establecido por el sistema. Ten en cuenta que son diferentes de los hechos del usuario, que son hechos que el usuario conoce. Las variables son parámetros que conoce el agente, es decir, el MDN (número de teléfono) que pasa el sistema de telefonía. |
taskCompletionBehavior |
Es opcional. Obsoleto. En su lugar, usa user_goal_behavior. |
userGoalBehavior |
Es opcional. Es el comportamiento esperado del objetivo del usuario. |
evaluationExpectations[] |
Es opcional. Son las expectativas de evaluación con las que se evalúa la conversación producida por la simulación. Formato: |
UserFact
| Representación JSON |
|---|
{ "name": string, "value": string } |
| Campos | |
|---|---|
name |
Obligatorio. Es el nombre del hecho del usuario. |
value |
Obligatorio. Es el valor del hecho del usuario. |
ScenarioExpectation
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión expectation. Es la expectativa para evaluar la conversación que produce la simulación. expectation puede ser solo uno de los parámetros siguientes: |
|
toolExpectation |
Es opcional. Es el par de llamada a la herramienta y respuesta que se evaluará. |
agentResponse |
Es opcional. Es la respuesta del agente que se evaluará. |
ToolExpectation
| Representación JSON |
|---|
{ "expectedToolCall": { object ( |
| Campos | |
|---|---|
expectedToolCall |
Obligatorio. Es la llamada a la herramienta esperada, con los parámetros de interés especificados. El LLM alucinará los parámetros que no se especifiquen. |
mockToolResponse |
Obligatorio. Es la respuesta de la herramienta que se simulará, con los parámetros de interés especificados. El LLM alucinará los parámetros que no se especifiquen. |
AggregatedMetrics
| Representación JSON |
|---|
{
"metricsByAppVersion": [
{
object ( |
| Campos | |
|---|---|
metricsByAppVersion[] |
Solo salida. Son las métricas agregadas, agrupadas por el ID de versión de la app. |
MetricsByAppVersion
| Representación JSON |
|---|
{ "appVersionId": string, "toolMetrics": [ { object ( |
| Campos | |
|---|---|
appVersionId |
Solo salida. Es el ID de la versión de la app. |
toolMetrics[] |
Solo salida. Son las métricas de cada herramienta dentro de esta versión de la app. |
semanticSimilarityMetrics[] |
Solo salida. Son las métricas de similitud semántica dentro de esta versión de la app. |
hallucinationMetrics[] |
Solo salida. Son las métricas de alucinación dentro de esta versión de la app. |
toolCallLatencyMetrics[] |
Solo salida. Son las métricas de latencia de la llamada a la herramienta dentro de esta versión de la app. |
turnLatencyMetrics[] |
Solo salida. Son las métricas de latencia de turnos dentro de esta versión de la app. |
passCount |
Solo salida. Es la cantidad de veces que se aprobó la evaluación. |
failCount |
Solo salida. Es la cantidad de veces que falló la evaluación. |
metricsByTurn[] |
Solo salida. Son las métricas agregadas por turno dentro de esta versión de la app. |
ToolMetrics
| Representación JSON |
|---|
{ "tool": string, "passCount": integer, "failCount": integer } |
| Campos | |
|---|---|
tool |
Solo salida. Es el nombre de la herramienta. |
passCount |
Solo salida. Es la cantidad de veces que la herramienta pasó la prueba. |
failCount |
Solo salida. Es la cantidad de veces que falló la herramienta. |
SemanticSimilarityMetrics
| Representación JSON |
|---|
{ "score": number } |
| Campos | |
|---|---|
score |
Solo salida. Es la puntuación promedio de similitud semántica (de 0 a 4). |
HallucinationMetrics
| Representación JSON |
|---|
{ "score": number } |
| Campos | |
|---|---|
score |
Solo salida. Es la puntuación promedio de alucinación (de 0 a 1). |
ToolCallLatencyMetrics
| Representación JSON |
|---|
{ "tool": string, "averageLatency": string } |
| Campos | |
|---|---|
tool |
Solo salida. Es el nombre de la herramienta. |
averageLatency |
Solo salida. Es la latencia promedio de las llamadas a herramientas. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
TurnLatencyMetrics
| Representación JSON |
|---|
{ "averageLatency": string } |
| Campos | |
|---|---|
averageLatency |
Solo salida. Es la latencia promedio de los turnos. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
MetricsByTurn
| Representación JSON |
|---|
{ "turnIndex": integer, "toolMetrics": [ { object ( |
| Campos | |
|---|---|
turnIndex |
Solo salida. Índice de turno (basado en 0). |
toolMetrics[] |
Solo salida. Son las métricas de cada herramienta en este turno. |
semanticSimilarityMetrics[] |
Solo salida. Son las métricas de similitud semántica dentro de este turno. |
hallucinationMetrics[] |
Solo salida. Son las métricas de alucinación dentro de este turno. |
toolCallLatencyMetrics[] |
Solo salida. Son las métricas de latencia de la llamada a la herramienta dentro de este turno. |
turnLatencyMetrics[] |
Solo salida. Son las métricas de latencia del turno dentro de este turno. |
EvaluationResult
| Representación JSON |
|---|
{ "name": string, "displayName": string, "createTime": string, "evaluationStatus": enum ( |
| Campos | |
|---|---|
name |
Es el identificador. Es el identificador único del resultado de la evaluación. Formato: |
displayName |
Obligatorio. Es el nombre visible del resultado de la evaluación. Es único dentro de una evaluación. De forma predeterminada, tiene el siguiente formato: " |
createTime |
Solo salida. Es la marca de tiempo de cuando se creó el resultado de la evaluación. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
evaluationStatus |
Solo salida. Es el resultado de la evaluación. Solo se propaga si execution_state es COMPLETE. |
evaluationRun |
Solo salida. Es la ejecución de la evaluación que produjo este resultado. Formato: |
persona |
Solo salida. Es el arquetipo que se usó para generar la conversación del resultado de la evaluación. |
errorInfo |
Solo salida. Es la información del error del resultado de la evaluación. |
error |
Solo salida. Obsoleto: Usa |
initiatedBy |
Solo salida. Es el usuario que inició la ejecución de la evaluación que generó este resultado. |
appVersion |
Solo salida. Es la versión de la app que se usó para generar la conversación que produjo este resultado. Formato: |
appVersionDisplayName |
Solo salida. Es el nombre visible del |
changelog |
Solo salida. Registro de cambios de la versión de la app con la que se ejecutó la evaluación. Se completa si el usuario ejecuta la evaluación en la versión más reciente o en el borrador. |
changelogCreateTime |
Solo salida. Es la fecha y hora de creación del registro de cambios de la versión de la app con la que se ejecutó la evaluación. Se completa si el usuario ejecuta la evaluación en la versión más reciente o en el borrador. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
executionState |
Solo salida. Es el estado de la ejecución del resultado de la evaluación. |
evaluationMetricsThresholds |
Solo salida. Son los umbrales de evaluación del resultado. |
config |
Solo salida. Es la configuración que se usó en la ejecución de la evaluación que generó este resultado. |
goldenRunMethod |
Solo salida. Es el método que se usa para ejecutar la evaluación de referencia. |
Campo de unión result. Es el resultado de la evaluación. Solo se propaga cuando execution_state es COMPLETED. result puede ser solo uno de los parámetros siguientes: |
|
goldenResult |
Solo salida. Es el resultado de una evaluación de datos de referencia. |
scenarioResult |
Solo salida. Es el resultado de la evaluación de un caso. |
GoldenResult
| Representación JSON |
|---|
{ "turnReplayResults": [ { object ( |
| Campos | |
|---|---|
turnReplayResults[] |
Solo salida. Es el resultado de ejecutar cada turno de la conversación de referencia. |
evaluationExpectationResults[] |
Solo salida. Son los resultados esperados de la evaluación. |
TurnReplayResult
| Representación JSON |
|---|
{ "conversation": string, "expectationOutcome": [ { object ( |
| Campos | |
|---|---|
conversation |
Solo salida. Es la conversación que se generó para este turno. |
expectationOutcome[] |
Solo salida. Es el resultado de cada expectativa. |
hallucinationResult |
Solo salida. Es el resultado de la verificación de alucinaciones. |
toolInvocationScore |
Solo salida. Obsoleto. En su lugar, usa OverallToolInvocationResult. |
turnLatency |
Solo salida. Es la duración del turno. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
toolCallLatencies[] |
Solo salida. Es la latencia de cada llamada a herramienta en el turno. |
semanticSimilarityResult |
Solo salida. Es el resultado de la verificación de similitud semántica. |
overallToolInvocationResult |
Solo salida. Es el resultado de la verificación general de la invocación de la herramienta. |
errorInfo |
Solo salida. Es información sobre el error que ocurrió durante este turno. |
spanLatencies[] |
Solo salida. Es la latencia de los intervalos en el turno. |
Campo de unión
|
|
toolOrderedInvocationScore |
Solo salida. Es la puntuación general de invocación ordenada de la herramienta para este turno. Indica el porcentaje general de herramientas del turno esperado que se invocaron realmente en el orden esperado. |
GoldenExpectationOutcome
| Representación JSON |
|---|
{ "expectation": { object ( |
| Campos | |
|---|---|
expectation |
Solo salida. Es la expectativa que se evaluó. |
outcome |
Solo salida. Es el resultado de la expectativa. |
semanticSimilarityResult |
Solo salida. Es el resultado de la verificación de similitud semántica. |
toolInvocationResult |
Solo salida. Es el resultado de la verificación de la invocación de la herramienta. |
Campo de unión result. Es el resultado de la expectativa. result puede ser solo uno de los parámetros siguientes: |
|
observedToolCall |
Solo salida. Es el resultado de la expectativa de llamada a herramienta. |
observedToolResponse |
Solo salida. Es el resultado de la expectativa de respuesta de la herramienta. |
observedAgentResponse |
Solo salida. Es el resultado de la expectativa de respuesta del agente. |
observedAgentTransfer |
Solo salida. Es el resultado de la expectativa de transferencia del agente. |
SemanticSimilarityResult
| Representación JSON |
|---|
{ "label": string, "explanation": string, "outcome": enum ( |
| Campos | |
|---|---|
label |
Solo salida. Es la etiqueta asociada a cada puntuación. Puntuación 4: Completamente coherente Puntuación 3: Mayormente coherente Puntuación 2: Parcialmente coherente (omisiones menores) Puntuación 1: Mayormente incoherente (omisiones importantes) Puntuación 0: Completamente incoherente o contradictorio |
explanation |
Solo salida. Es la explicación de la puntuación de similitud semántica. |
outcome |
Solo salida. Es el resultado de la verificación de similitud semántica. Esto se determina comparando la puntuación con semantic_similarity_success_threshold. Si la puntuación es igual o superior al umbral, el resultado será APROBADO. De lo contrario, el resultado será FAIL. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de similitud semántica. Puede ser 0, 1, 2, 3 o 4. |
ToolInvocationResult
| Representación JSON |
|---|
{ "outcome": enum ( |
| Campos | |
|---|---|
outcome |
Solo salida. Es el resultado de la verificación de la invocación de la herramienta. Esto se determina comparando el parámetro parameter_correctness_score con el umbral. Si la puntuación es igual o superior al umbral, el resultado será APROBADO. De lo contrario, el resultado será FAIL. |
explanation |
Solo salida. Es una explicación de texto libre sobre el resultado de la invocación de la herramienta. |
Campo de unión
|
|
parameterCorrectnessScore |
Solo salida. Es la puntuación de corrección del parámetro de invocación de la herramienta. Indica el porcentaje de parámetros de la llamada a la herramienta esperada que también estuvieron presentes en la llamada a la herramienta real. |
HallucinationResult
| Representación JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Solo salida. Es la etiqueta asociada a cada puntuación. Puntuación 1: Puntuación justificada 0: Puntuación no justificada -1: No hay reclamo para evaluar |
explanation |
Solo salida. Es la explicación de la puntuación de alucinación. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de alucinación. Puede ser -1, 0 o 1. |
ToolCallLatency
| Representación JSON |
|---|
{ "tool": string, "displayName": string, "startTime": string, "endTime": string, "executionLatency": string } |
| Campos | |
|---|---|
tool |
Solo salida. Es el nombre de la herramienta que se ejecutó. Formato: |
displayName |
Solo salida. Es el nombre visible de la herramienta. |
startTime |
Solo salida. Es la hora de inicio de la ejecución de la llamada a la herramienta. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
endTime |
Solo salida. Es la hora de finalización de la ejecución de la llamada a la herramienta. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
executionLatency |
Solo salida. Es la latencia de la ejecución de la llamada a la herramienta. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
OverallToolInvocationResult
| Representación JSON |
|---|
{ "outcome": enum ( |
| Campos | |
|---|---|
outcome |
Solo salida. Es el resultado de la verificación de la invocación de la herramienta. Esto se determina comparando tool_invocation_score con overall_tool_invocation_correctness_threshold. Si la puntuación es igual o superior al umbral, el resultado será APROBADO. De lo contrario, el resultado será FAIL. |
Campo de unión
|
|
toolInvocationScore |
Es la puntuación general de invocación de la herramienta para este turno. Indica el porcentaje general de herramientas del turno esperado que se invocaron realmente. |
EvaluationErrorInfo
| Representación JSON |
|---|
{
"errorType": enum ( |
| Campos | |
|---|---|
errorType |
Solo salida. Es el tipo de error. |
errorMessage |
Solo salida. Mensaje de error. |
sessionId |
Solo salida. Es el ID de la sesión de la conversación que causó el error. |
SpanLatency
| Representación JSON |
|---|
{ "type": enum ( |
| Campos | |
|---|---|
type |
Solo salida. Es el tipo de intervalo. |
displayName |
Solo salida. Es el nombre visible del intervalo. Se aplica a los tramos de herramientas y protecciones. |
startTime |
Solo salida. Es la hora de inicio del período. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
endTime |
Solo salida. Es la hora de finalización del período. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
executionLatency |
Solo salida. Es la latencia del intervalo. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
Campo de unión identifier. Es el identificador del elemento específico según su tipo. identifier puede ser solo uno de los parámetros siguientes: |
|
resource |
Solo salida. Es el nombre del recurso de los tramos de la herramienta o la protección. |
toolset |
Solo salida. Es el identificador de la herramienta del conjunto de herramientas. |
model |
Solo salida. Es el nombre del intervalo del LLM. |
callback |
Solo salida. Es el nombre del intervalo de devolución de llamada del usuario. |
EvaluationExpectationResult
| Representación JSON |
|---|
{
"evaluationExpectation": string,
"prompt": string,
"outcome": enum ( |
| Campos | |
|---|---|
evaluationExpectation |
Solo salida. Es la expectativa de evaluación. Formato: |
prompt |
Solo salida. Es la instrucción que se usó para la evaluación. |
outcome |
Solo salida. Es el resultado esperado de la evaluación. |
explanation |
Solo salida. Es la explicación del resultado. |
ScenarioResult
| Representación JSON |
|---|
{ "conversation": string, "task": string, "userFacts": [ { object ( |
| Campos | |
|---|---|
conversation |
Solo salida. Es la conversación que se generó en la situación. |
task |
Solo salida. Es la tarea que se usó cuando se ejecutó la situación para este resultado. |
userFacts[] |
Solo salida. Son los datos del usuario que el escenario usó para este resultado. |
expectationOutcomes[] |
Solo salida. Es el resultado de cada expectativa. |
rubricOutcomes[] |
Solo salida. Es el resultado de la rúbrica. |
hallucinationResult[] |
Solo salida. Es el resultado de la verificación de alucinaciones. Habrá un resultado de alucinación por cada turno de la conversación. |
taskCompletionResult |
Solo salida. Es el resultado de la verificación de finalización de la tarea. |
toolCallLatencies[] |
Solo salida. Es la latencia de cada ejecución de llamada a herramienta en la conversación. |
userGoalSatisfactionResult |
Solo salida. Es el resultado de la verificación de satisfacción del objetivo del usuario. |
spanLatencies[] |
Solo salida. Es la latencia de los tramos en la conversación. |
evaluationExpectationResults[] |
Solo salida. Son los resultados de las expectativas de evaluación. |
Campo de unión
|
|
allExpectationsSatisfied |
Solo salida. Indica si se cumplieron todas las expectativas para este turno. |
Campo de unión
|
|
taskCompleted |
Solo salida. Indica si la tarea se completó en este turno. Es una combinación de todas las expectativas satisfechas, la ausencia de alucinaciones y la satisfacción del objetivo del usuario. |
ScenarioExpectationOutcome
| Representación JSON |
|---|
{ "expectation": { object ( |
| Campos | |
|---|---|
expectation |
Solo salida. Es la expectativa que se evaluó. |
outcome |
Solo salida. Es el resultado de ScenarioExpectation. |
Campo de unión result. Es el resultado de la expectativa. result puede ser solo uno de los parámetros siguientes: |
|
observedToolCall |
Solo salida. Es la llamada a la herramienta observada. |
observedAgentResponse |
Solo salida. Es la respuesta observada del agente. |
ObservedToolCall
| Representación JSON |
|---|
{ "toolCall": { object ( |
| Campos | |
|---|---|
toolCall |
Solo salida. Es la llamada a la herramienta observada. |
toolResponse |
Solo salida. Es la respuesta observada de la herramienta. |
ScenarioRubricOutcome
| Representación JSON |
|---|
{ "rubric": string, "scoreExplanation": string, // Union field |
| Campos | |
|---|---|
rubric |
Solo salida. Es la rúbrica que se usó para evaluar la conversación. |
scoreExplanation |
Solo salida. Es la respuesta del evaluador a la rúbrica. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de la conversación según la rúbrica. |
TaskCompletionResult
| Representación JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Solo salida. Es la etiqueta asociada a cada puntuación. Puntuación 1: Tarea completada Puntuación 0: Tarea no completada Puntuación -1: Objetivo del usuario no definido |
explanation |
Solo salida. Es la explicación de la puntuación de finalización de la tarea. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de finalización de la tarea. Puede ser -1, 0 o 1. |
UserGoalSatisfactionResult
| Representación JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Solo salida. Es la etiqueta asociada a cada puntuación. Puntuación 1: Tarea del usuario satisfecha. Puntuación 0: Tarea del usuario no satisfecha. Puntuación -1: Tarea del usuario no especificada. |
explanation |
Solo salida. Es la explicación de la puntuación de satisfacción de la tarea del usuario. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de satisfacción con la tarea del usuario. Puede ser -1, 0 o 1. |
EvaluationPersona
| Representación JSON |
|---|
{
"name": string,
"description": string,
"displayName": string,
"personality": string,
"speechConfig": {
object ( |
| Campos | |
|---|---|
name |
Obligatorio. Es el identificador único del arquetipo. Formato: |
description |
Es opcional. Es la descripción del arquetipo. |
displayName |
Obligatorio. Es el nombre visible del arquetipo. Es único dentro de una app. |
personality |
Obligatorio. Es una instrucción para el agente sobre cómo comportarse en la evaluación. |
speechConfig |
Es opcional. Es la configuración de cómo suena la persona (parámetros de configuración de TTS). |
SpeechConfig
| Representación JSON |
|---|
{
"speakingRate": number,
"environment": enum ( |
| Campos | |
|---|---|
speakingRate |
Es opcional. Es la velocidad de habla. 1.0 es normal. Cuanto más bajo, más lento (p.ej., 0.8), cuanto más alto sea el valor, más rápido será (p.ej., 1.5). Es útil para probar cómo el agente maneja a las personas que hablan rápido. |
environment |
Es opcional. Es el entorno de audio simulado. |
voiceId |
Es opcional. Es el identificador o acento de voz específico que se usará. Ejemplo: "es-MX-Wavenet-D" o "es-ES-Standard-A" |
Estado
| Representación JSON |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| Campos | |
|---|---|
code |
El código de estado, que debe ser un valor enum de |
message |
Un mensaje de error dirigido al desarrollador, que debe estar en inglés. Cualquier mensaje de error dirigido al usuario debe localizarse y enviarse al campo |
details[] |
Una lista de mensajes que contienen los detalles del error. Hay un conjunto común de tipos de mensajes para que usen las API. Un objeto que contiene campos de un tipo arbitrario. Un campo adicional |
Cualquiera
| Representación JSON |
|---|
{ "typeUrl": string, "value": string } |
| Campos | |
|---|---|
typeUrl |
Identifica el tipo del mensaje serializado de Protobuf con una referencia de URI que consta de un prefijo que termina en una barra y el nombre del tipo completamente calificado. Ejemplo: type.googleapis.com/google.protobuf.StringValue Esta cadena debe contener al menos un carácter El prefijo es arbitrario, y se espera que las implementaciones de Protobuf simplemente quiten todo hasta el último Todas las cadenas de URL de tipo deben ser referencias URI legales con la restricción adicional (para el formato de texto) de que el contenido de la referencia solo debe constar de caracteres alfanuméricos, escapes codificados como porcentaje y caracteres del siguiente conjunto (sin incluir las comillas invertidas externas): En el diseño original de |
value |
Contiene una serialización de Protobuf del tipo que describe type_url. Es una cadena codificada en Base64. |
EvaluationMetricsThresholds
| Representación JSON |
|---|
{ "goldenEvaluationMetricsThresholds": { object ( |
| Campos | |
|---|---|
goldenEvaluationMetricsThresholds |
Es opcional. Son los umbrales de las métricas de evaluación de referencia. |
hallucinationMetricBehavior |
Es opcional. Obsoleto: Usa |
goldenHallucinationMetricBehavior |
Es opcional. Es el comportamiento de la métrica de alucinación para las evaluaciones de referencia. |
scenarioHallucinationMetricBehavior |
Es opcional. Es el comportamiento de la métrica de alucinación para las evaluaciones de situaciones. |
GoldenEvaluationMetricsThresholds
| Representación JSON |
|---|
{ "turnLevelMetricsThresholds": { object ( |
| Campos | |
|---|---|
turnLevelMetricsThresholds |
Es opcional. Son los umbrales de las métricas a nivel del turno. |
expectationLevelMetricsThresholds |
Es opcional. Son los umbrales de las métricas del nivel de expectativa. |
toolMatchingSettings |
Es opcional. Es la configuración de la herramienta de correlación. Una llamada a herramienta adicional es una llamada a herramienta que está presente en la ejecución, pero no coincide con ninguna llamada a herramienta en la expectativa ideal. |
TurnLevelMetricsThresholds
| Representación JSON |
|---|
{ "semanticSimilarityChannel": enum ( |
| Campos | |
|---|---|
semanticSimilarityChannel |
Es opcional. Es el canal de similitud semántica que se usará para la evaluación. |
Campo de unión
|
|
semanticSimilaritySuccessThreshold |
Es opcional. Es el umbral de éxito para la similitud semántica. Debe ser un número entero entre 0 y 4. El valor predeterminado es >= 3. |
Campo de unión
|
|
overallToolInvocationCorrectnessThreshold |
Es opcional. Es el umbral de éxito para la corrección general de la invocación de la herramienta. Debe ser un número de punto flotante entre 0 y 1. El valor predeterminado es 1.0. |
ExpectationLevelMetricsThresholds
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión
|
|
toolInvocationParameterCorrectnessThreshold |
Es opcional. Es el umbral de éxito para la corrección de parámetros de invocación de herramientas individuales. Debe ser un número de punto flotante entre 0 y 1. El valor predeterminado es 1.0. |
ToolMatchingSettings
| Representación JSON |
|---|
{
"extraToolCallBehavior": enum ( |
| Campos | |
|---|---|
extraToolCallBehavior |
Es opcional. Comportamiento para las llamadas a herramientas adicionales. La configuración predeterminada es FAIL. |
EvaluationConfig
| Representación JSON |
|---|
{ "inputAudioConfig": { object ( |
| Campos | |
|---|---|
inputAudioConfig |
Es opcional. Es la configuración para procesar el audio de entrada. |
outputAudioConfig |
Es opcional. Es la configuración para generar el audio de salida. |
evaluationChannel |
Es opcional. Es el canal que se evaluará. |
toolCallBehaviour |
Es opcional. Especifica si la evaluación debe usar llamadas a herramientas reales o herramientas simuladas. |
InputAudioConfig
| Representación JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obligatorio. Es la codificación de los datos de audio de entrada. |
sampleRateHertz |
Obligatorio. Es la tasa de muestreo (en hercios) de los datos de audio de entrada. |
noiseSuppressionLevel |
Es opcional. Indica si se debe habilitar la supresión de ruido en el audio de entrada. Los valores disponibles son "low", "moderate", "high" y "very_high". |
OutputAudioConfig
| Representación JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obligatorio. Es la codificación de los datos de audio de salida. |
sampleRateHertz |
Obligatorio. Es la tasa de muestreo (en hercios) de los datos de audio de salida. |
FieldMask
| Representación JSON |
|---|
{ "paths": [ string ] } |
| Campos | |
|---|---|
paths[] |
Es el conjunto de rutas de máscara de campo. |
Esquema de salida
Una evaluación representa toda la información necesaria para simular y evaluar un agente.
Evaluación
| Representación JSON |
|---|
{ "name": string, "displayName": string, "description": string, "tags": [ string ], "evaluationDatasets": [ string ], "createTime": string, "createdBy": string, "updateTime": string, "lastUpdatedBy": string, "evaluationRuns": [ string ], "etag": string, "aggregatedMetrics": { object ( |
| Campos | |
|---|---|
name |
Es el identificador. Es el identificador único de esta evaluación. Formato: |
displayName |
Obligatorio. Es el nombre visible de la evaluación definido por el usuario. Es único dentro de una app. |
description |
Es opcional. Es la descripción de la evaluación definida por el usuario. |
tags[] |
Es opcional. Son etiquetas definidas por el usuario para categorizar la evaluación. |
evaluationDatasets[] |
Solo salida. Es la lista de conjuntos de datos de evaluación a los que pertenece la evaluación. Formato: |
createTime |
Solo salida. Es la marca de tiempo de cuando se creó la evaluación. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
createdBy |
Solo salida. Es el usuario que creó la evaluación. |
updateTime |
Solo salida. Marca de tiempo de la última actualización de la evaluación. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
lastUpdatedBy |
Solo salida. Es el usuario que actualizó la evaluación por última vez. |
evaluationRuns[] |
Solo salida. Son los EvaluationRuns con los que se asocia esta Evaluación. |
etag |
Solo salida. Es el ETag que se usa para garantizar que el objeto no haya cambiado durante una operación de lectura, modificación y escritura. Si el ETag está vacío, la actualización reemplazará cualquier cambio simultáneo. |
aggregatedMetrics |
Solo salida. Son las métricas agregadas de esta evaluación en todas las ejecuciones. |
lastCompletedResult |
Solo salida. Es el resultado de la evaluación más reciente para esta evaluación. |
invalid |
Solo salida. Indica si la evaluación no es válida. Esto puede suceder si una evaluación hace referencia a una herramienta, un conjunto de herramientas o un agente que se borró. |
lastTenResults[] |
Solo salida. Son los últimos 10 resultados de la evaluación. Este campo solo se completa si include_last_ten_results se establece como verdadero en ListEvaluationsRequest o GetEvaluationRequest. |
Campo de unión inputs. Las entradas para la evaluación inputs solo pueden ser una de las siguientes: |
|
golden |
Es opcional. Son los pasos de referencia que se evaluarán. |
scenario |
Es opcional. Es la configuración de una situación. |
Golden
| Representación JSON |
|---|
{
"turns": [
{
object ( |
| Campos | |
|---|---|
turns[] |
Obligatorio. Son los turnos de oro necesarios para reproducir una conversación de oro. |
evaluationExpectations[] |
Es opcional. Son las expectativas de evaluación con las que se evalúa la conversación reproducida. Formato: |
GoldenTurn
| Representación JSON |
|---|
{ "steps": [ { object ( |
| Campos | |
|---|---|
steps[] |
Obligatorio. Son los pasos necesarios para reproducir una conversación de referencia. |
rootSpan |
Es opcional. Es el intervalo raíz del turno dorado para procesar y mantener la información de audio. |
Paso
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión step. Paso que se debe realizar. step puede ser solo uno de los parámetros siguientes: |
|
userInput |
Es opcional. Es la entrada del usuario para la conversación. |
agentTransfer |
Es opcional. Transferir la conversación a otro agente |
expectation |
Es opcional. Ejecuta una expectativa en el turno actual. |
SessionInput
| Representación JSON |
|---|
{ "willContinue": boolean, // Union field |
| Campos | |
|---|---|
willContinue |
Es opcional. Es una marca que indica si el mensaje actual es un fragmento de una entrada más grande en la sesión de transmisión bidireccional. Cuando se establece en NOTA: Este campo no se aplica a las entradas de audio y DTMF, ya que siempre se procesan automáticamente según la señal de finalización. |
Campo de unión input_type. Es el tipo de entrada. input_type puede ser solo uno de los parámetros siguientes: |
|
text |
Es opcional. Son los datos de texto del usuario final. |
dtmf |
Es opcional. Dígitos de DTMF del usuario final. |
audio |
Es opcional. Son los datos de audio del usuario final. Es una cadena codificada en Base64. |
toolResponses |
Es opcional. Son los resultados de la ejecución de las llamadas a herramientas del cliente. |
image |
Es opcional. Son los datos de imagen del usuario final. |
blob |
Es opcional. Son los datos de BLOB del usuario final. |
variables |
Es opcional. Son las variables contextuales de la sesión, con la clave establecida por el nombre. El agente de CES solo usará las variables declaradas en la app. Las variables no reconocidas se seguirán enviando al [agente de Dialogflow][Agent.RemoteDialogflowAgent] como parámetros de sesión adicionales. |
event |
Es opcional. Es la entrada del evento. |
ToolResponses
| Representación JSON |
|---|
{
"toolResponses": [
{
object ( |
| Campos | |
|---|---|
toolResponses[] |
Es opcional. Es la lista de resultados de la ejecución de la herramienta. |
ToolResponse
| Representación JSON |
|---|
{ "id": string, "displayName": string, "response": { object }, // Union field |
| Campos | |
|---|---|
id |
Es opcional. Es el ID para coincidencias del |
displayName |
Solo salida. Nombre visible de la herramienta. |
response |
Obligatorio. Es el resultado de la ejecución de la herramienta en formato de objeto JSON. Usa la clave "output" para especificar la respuesta de la herramienta y la clave "error" para especificar los detalles del error (si hay alguno). Si no se especifican las claves "output" y "error", toda la "response" se trata como resultado de la ejecución de la herramienta. |
Campo de unión tool_identifier. Es el identificador de la herramienta que se ejecutó. Puede ser una herramienta persistente o una herramienta de un conjunto de herramientas. tool_identifier puede ser solo uno de los parámetros siguientes: |
|
tool |
Es opcional. Es el nombre de la herramienta que se ejecutará. Formato: |
toolsetTool |
Es opcional. Es la herramienta del conjunto de herramientas que se ejecutó. |
ToolsetTool
| Representación JSON |
|---|
{ "toolset": string, "toolId": string } |
| Campos | |
|---|---|
toolset |
Obligatorio. Es el nombre del recurso del conjunto de herramientas del que se deriva esta herramienta. Formato: |
toolId |
Es opcional. Es el ID de la herramienta para filtrar las herramientas y recuperar el esquema. |
Struct
| Representación JSON |
|---|
{ "fields": { string: value, ... } } |
| Campos | |
|---|---|
fields |
Es un mapa no ordenado de valores escritos de forma dinámica. Un objeto que contiene una lista de pares |
FieldsEntry
| Representación JSON |
|---|
{ "key": string, "value": value } |
| Campos | |
|---|---|
key |
|
value |
|
Valor
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión kind. Es el tipo de valor. kind puede ser solo uno de los parámetros siguientes: |
|
nullValue |
Representa un valor nulo. |
numberValue |
Representa un valor doble. |
stringValue |
Representa un valor de cadena. |
boolValue |
Representa un valor booleano. |
structValue |
Representa un valor estructurado. |
listValue |
Representa un |
ListValue
| Representación JSON |
|---|
{ "values": [ value ] } |
| Campos | |
|---|---|
values[] |
Es un campo repetido de valores escritos de forma dinámica. |
Imagen
| Representación JSON |
|---|
{ "mimeType": string, "data": string } |
| Campos | |
|---|---|
mimeType |
Obligatorio. Es el tipo de MIME estándar de IANA de los datos de origen. Los tipos de imágenes admitidos incluyen los siguientes: * image/png * image/jpeg * image/webp |
data |
Obligatorio. Son los bytes sin procesar de la imagen. Es una cadena codificada en Base64. |
BLOB
| Representación JSON |
|---|
{ "mimeType": string, "data": string } |
| Campos | |
|---|---|
mimeType |
Obligatorio. Es el tipo de MIME estándar de IANA de los datos de origen. |
data |
Obligatorio. Son los bytes sin procesar del BLOB. Es una cadena codificada en Base64. |
Evento
| Representación JSON |
|---|
{ "event": string } |
| Campos | |
|---|---|
event |
Obligatorio. Es el nombre del evento. |
AgentTransfer
| Representación JSON |
|---|
{ "targetAgent": string, "displayName": string } |
| Campos | |
|---|---|
targetAgent |
Obligatorio. Es el agente al que se transfiere la conversación. El agente se encargará de la conversación a partir de este punto. Formato: |
displayName |
Solo salida. Es el nombre visible del agente. |
GoldenExpectation
| Representación JSON |
|---|
{ "note": string, // Union field |
| Campos | |
|---|---|
note |
Es opcional. Es una nota para este requisito, útil para informar cuando fallan verificaciones específicas. P. ej., "Check_Payment_Tool_Called". |
Campo de unión condition. Es la verificación real que se realizará. condition puede ser solo uno de los parámetros siguientes: |
|
toolCall |
Es opcional. Verifica que se haya llamado a una herramienta específica con los parámetros. |
toolResponse |
Es opcional. Verifica que una herramienta específica haya tenido la respuesta esperada. |
agentResponse |
Es opcional. Verifica que el agente haya respondido con la respuesta correcta. Se da por sentado el rol de "agente". |
agentTransfer |
Es opcional. Comprueba que el agente haya transferido la conversación a otro agente. |
updatedVariables |
Es opcional. Verifica que el agente haya actualizado las variables de sesión a los valores esperados. También se usa para capturar actualizaciones de variables del agente para las evaluaciones doradas. |
mockToolResponse |
Es opcional. Es la respuesta de la herramienta que se simulará, con los parámetros de interés especificados. El LLM alucinará los parámetros que no se especifiquen. |
ToolCall
| Representación JSON |
|---|
{ "id": string, "displayName": string, "args": { object }, // Union field |
| Campos | |
|---|---|
id |
Es opcional. Es el identificador único de la llamada a la herramienta. Si se completa, el cliente debe devolver el resultado de la ejecución con el ID para coincidencias en |
displayName |
Solo salida. Nombre visible de la herramienta. |
args |
Es opcional. Son los parámetros y valores de entrada de la herramienta en formato de objeto JSON. |
Campo de unión tool_identifier. Es el identificador de la herramienta que se ejecutará. Puede ser una herramienta persistente o una herramienta de un conjunto de herramientas. tool_identifier puede ser solo uno de los parámetros siguientes: |
|
tool |
Es opcional. Es el nombre de la herramienta que se ejecutará. Formato: |
toolsetTool |
Es opcional. Es la herramienta del conjunto de herramientas que se ejecutará. |
Mensaje
| Representación JSON |
|---|
{
"role": string,
"chunks": [
{
object ( |
| Campos | |
|---|---|
role |
Es opcional. Es el rol dentro de la conversación, p.ej., usuario o agente. |
chunks[] |
Es opcional. Es el contenido del mensaje como una serie de fragmentos. |
eventTime |
Es opcional. Es la marca de tiempo del momento en que se envió o recibió el mensaje. No se debe usar si el mensaje forma parte de un Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
Fragmento
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión data. Datos de fragmentos data puede ser solo uno de los parámetros siguientes: |
|
text |
Es opcional. Datos de texto. |
transcript |
Es opcional. Es la transcripción asociada al audio. |
blob |
Es opcional. Son los datos del BLOB. |
payload |
Es opcional. Son los datos de carga útil personalizados. |
image |
Es opcional. Son los datos de la imagen. |
toolCall |
Es opcional. Es la solicitud de ejecución de la herramienta. |
toolResponse |
Es opcional. Es la respuesta de la ejecución de la herramienta. |
agentTransfer |
Es opcional. Es el evento de transferencia del agente. |
updatedVariables |
Un struct representa las variables que se actualizaron en la conversación, con claves según los nombres de las variables. |
defaultVariables |
Un struct representa las variables predeterminadas al comienzo de la conversación, con claves según los nombres de las variables. |
Marca de tiempo
| Representación JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Representa los segundos de la hora UTC desde la época de Unix 1970-01-01T00:00:00Z. Debe estar entre -62135596800 y 253402300799 inclusive (lo que corresponde a 0001-01-01T00:00:00Z y 9999-12-31T23:59:59Z). |
nanos |
Fracciones no negativas de un segundo a una resolución de nanosegundos. Este campo es la parte de la duración en nanosegundos, no una alternativa a los segundos. Los valores de segundos negativos con fracciones deben tener valores nanos no negativos que se cuentan hacia adelante en el tiempo. Debe ser un valor entre 0 y 999,999,999, inclusive. |
Intervalo
| Representación JSON |
|---|
{
"name": string,
"startTime": string,
"endTime": string,
"duration": string,
"attributes": {
object
},
"childSpans": [
{
object ( |
| Campos | |
|---|---|
name |
Solo salida. Es el nombre del intervalo. |
startTime |
Solo salida. Es la hora de inicio del período. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
endTime |
Solo salida. Es la hora de finalización del período. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
duration |
Solo salida. Es la duración del intervalo. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
attributes |
Solo salida. Son los atributos clave-valor asociados con el intervalo. |
childSpans[] |
Solo salida. Son los intervalos secundarios anidados en este intervalo. |
Duración
| Representación JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Son los segundos firmados del período. Debe estar entre -315,576,000,000 y +315,576,000,000, inclusive. Nota: Estos límites se calculan de la siguiente manera: 60 s/min * 60 min/h * 24 h/día * 365.25 días/año * 10,000 años |
nanos |
Fracciones firmadas de un segundo con una resolución de nanosegundos del período. Las duraciones inferiores a un segundo se representan con un campo |
Situación
| Representación JSON |
|---|
{ "task": string, "userFacts": [ { object ( |
| Campos | |
|---|---|
task |
Obligatorio. Es la tarea a la que se orientará el caso de uso. |
userFacts[] |
Es opcional. Son los datos del usuario que se usarán en la situación. |
maxTurns |
Es opcional. Es la cantidad máxima de turnos que se simularán. Si no se especifica, la simulación continuará hasta que se complete la tarea. |
rubrics[] |
Obligatorio. Son las rúbricas con las que se calificará la situación. |
scenarioExpectations[] |
Obligatorio. Es el objeto ScenarioExpectations para evaluar la conversación que produce la simulación del usuario. |
variableOverrides |
Es opcional. Variables o parámetros de sesión como contexto de la sesión, con claves según los nombres de las variables. Los miembros de esta estructura anularán cualquier valor predeterminado establecido por el sistema. Ten en cuenta que son diferentes de los hechos del usuario, que son hechos que el usuario conoce. Las variables son parámetros que conoce el agente, es decir, el MDN (número de teléfono) que pasa el sistema de telefonía. |
taskCompletionBehavior |
Es opcional. Obsoleto. En su lugar, usa user_goal_behavior. |
userGoalBehavior |
Es opcional. Es el comportamiento esperado del objetivo del usuario. |
evaluationExpectations[] |
Es opcional. Son las expectativas de evaluación con las que se evalúa la conversación producida por la simulación. Formato: |
UserFact
| Representación JSON |
|---|
{ "name": string, "value": string } |
| Campos | |
|---|---|
name |
Obligatorio. Es el nombre del hecho del usuario. |
value |
Obligatorio. Es el valor del hecho del usuario. |
ScenarioExpectation
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión expectation. Es la expectativa para evaluar la conversación que produce la simulación. expectation puede ser solo uno de los parámetros siguientes: |
|
toolExpectation |
Es opcional. Es el par de llamada a la herramienta y respuesta que se evaluará. |
agentResponse |
Es opcional. Es la respuesta del agente que se evaluará. |
ToolExpectation
| Representación JSON |
|---|
{ "expectedToolCall": { object ( |
| Campos | |
|---|---|
expectedToolCall |
Obligatorio. Es la llamada a la herramienta esperada, con los parámetros de interés especificados. El LLM alucinará los parámetros que no se especifiquen. |
mockToolResponse |
Obligatorio. Es la respuesta de la herramienta que se simulará, con los parámetros de interés especificados. El LLM alucinará los parámetros que no se especifiquen. |
AggregatedMetrics
| Representación JSON |
|---|
{
"metricsByAppVersion": [
{
object ( |
| Campos | |
|---|---|
metricsByAppVersion[] |
Solo salida. Son las métricas agregadas, agrupadas por el ID de versión de la app. |
MetricsByAppVersion
| Representación JSON |
|---|
{ "appVersionId": string, "toolMetrics": [ { object ( |
| Campos | |
|---|---|
appVersionId |
Solo salida. Es el ID de la versión de la app. |
toolMetrics[] |
Solo salida. Son las métricas de cada herramienta dentro de esta versión de la app. |
semanticSimilarityMetrics[] |
Solo salida. Son las métricas de similitud semántica dentro de esta versión de la app. |
hallucinationMetrics[] |
Solo salida. Son las métricas de alucinación dentro de esta versión de la app. |
toolCallLatencyMetrics[] |
Solo salida. Son las métricas de latencia de la llamada a la herramienta dentro de esta versión de la app. |
turnLatencyMetrics[] |
Solo salida. Son las métricas de latencia de turnos dentro de esta versión de la app. |
passCount |
Solo salida. Es la cantidad de veces que se aprobó la evaluación. |
failCount |
Solo salida. Es la cantidad de veces que falló la evaluación. |
metricsByTurn[] |
Solo salida. Son las métricas agregadas por turno dentro de esta versión de la app. |
ToolMetrics
| Representación JSON |
|---|
{ "tool": string, "passCount": integer, "failCount": integer } |
| Campos | |
|---|---|
tool |
Solo salida. Es el nombre de la herramienta. |
passCount |
Solo salida. Es la cantidad de veces que la herramienta pasó la prueba. |
failCount |
Solo salida. Es la cantidad de veces que falló la herramienta. |
SemanticSimilarityMetrics
| Representación JSON |
|---|
{ "score": number } |
| Campos | |
|---|---|
score |
Solo salida. Es la puntuación promedio de similitud semántica (de 0 a 4). |
HallucinationMetrics
| Representación JSON |
|---|
{ "score": number } |
| Campos | |
|---|---|
score |
Solo salida. Es la puntuación promedio de alucinación (de 0 a 1). |
ToolCallLatencyMetrics
| Representación JSON |
|---|
{ "tool": string, "averageLatency": string } |
| Campos | |
|---|---|
tool |
Solo salida. Es el nombre de la herramienta. |
averageLatency |
Solo salida. Es la latencia promedio de las llamadas a herramientas. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
TurnLatencyMetrics
| Representación JSON |
|---|
{ "averageLatency": string } |
| Campos | |
|---|---|
averageLatency |
Solo salida. Es la latencia promedio de los turnos. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
MetricsByTurn
| Representación JSON |
|---|
{ "turnIndex": integer, "toolMetrics": [ { object ( |
| Campos | |
|---|---|
turnIndex |
Solo salida. Índice de turno (basado en 0). |
toolMetrics[] |
Solo salida. Son las métricas de cada herramienta en este turno. |
semanticSimilarityMetrics[] |
Solo salida. Son las métricas de similitud semántica dentro de este turno. |
hallucinationMetrics[] |
Solo salida. Son las métricas de alucinación dentro de este turno. |
toolCallLatencyMetrics[] |
Solo salida. Son las métricas de latencia de la llamada a la herramienta dentro de este turno. |
turnLatencyMetrics[] |
Solo salida. Son las métricas de latencia del turno dentro de este turno. |
EvaluationResult
| Representación JSON |
|---|
{ "name": string, "displayName": string, "createTime": string, "evaluationStatus": enum ( |
| Campos | |
|---|---|
name |
Es el identificador. Es el identificador único del resultado de la evaluación. Formato: |
displayName |
Obligatorio. Es el nombre visible del resultado de la evaluación. Es único dentro de una evaluación. De forma predeterminada, tiene el siguiente formato: " |
createTime |
Solo salida. Es la marca de tiempo de cuando se creó el resultado de la evaluación. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
evaluationStatus |
Solo salida. Es el resultado de la evaluación. Solo se propaga si execution_state es COMPLETE. |
evaluationRun |
Solo salida. Es la ejecución de la evaluación que produjo este resultado. Formato: |
persona |
Solo salida. Es el arquetipo que se usó para generar la conversación del resultado de la evaluación. |
errorInfo |
Solo salida. Es la información del error del resultado de la evaluación. |
error |
Solo salida. Obsoleto: Usa |
initiatedBy |
Solo salida. Es el usuario que inició la ejecución de la evaluación que generó este resultado. |
appVersion |
Solo salida. Es la versión de la app que se usó para generar la conversación que produjo este resultado. Formato: |
appVersionDisplayName |
Solo salida. Es el nombre visible del |
changelog |
Solo salida. Registro de cambios de la versión de la app con la que se ejecutó la evaluación. Se completa si el usuario ejecuta la evaluación en la versión más reciente o en el borrador. |
changelogCreateTime |
Solo salida. Es la fecha y hora de creación del registro de cambios de la versión de la app con la que se ejecutó la evaluación. Se completa si el usuario ejecuta la evaluación en la versión más reciente o en el borrador. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
executionState |
Solo salida. Es el estado de la ejecución del resultado de la evaluación. |
evaluationMetricsThresholds |
Solo salida. Son los umbrales de evaluación del resultado. |
config |
Solo salida. Es la configuración que se usó en la ejecución de la evaluación que generó este resultado. |
goldenRunMethod |
Solo salida. Es el método que se usa para ejecutar la evaluación de referencia. |
Campo de unión result. Es el resultado de la evaluación. Solo se propaga cuando execution_state es COMPLETED. result puede ser solo uno de los parámetros siguientes: |
|
goldenResult |
Solo salida. Es el resultado de una evaluación de datos de referencia. |
scenarioResult |
Solo salida. Es el resultado de la evaluación de un caso. |
GoldenResult
| Representación JSON |
|---|
{ "turnReplayResults": [ { object ( |
| Campos | |
|---|---|
turnReplayResults[] |
Solo salida. Es el resultado de ejecutar cada turno de la conversación de referencia. |
evaluationExpectationResults[] |
Solo salida. Son los resultados esperados de la evaluación. |
TurnReplayResult
| Representación JSON |
|---|
{ "conversation": string, "expectationOutcome": [ { object ( |
| Campos | |
|---|---|
conversation |
Solo salida. Es la conversación que se generó para este turno. |
expectationOutcome[] |
Solo salida. Es el resultado de cada expectativa. |
hallucinationResult |
Solo salida. Es el resultado de la verificación de alucinaciones. |
toolInvocationScore |
Solo salida. Obsoleto. En su lugar, usa OverallToolInvocationResult. |
turnLatency |
Solo salida. Es la duración del turno. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
toolCallLatencies[] |
Solo salida. Es la latencia de cada llamada a herramienta en el turno. |
semanticSimilarityResult |
Solo salida. Es el resultado de la verificación de similitud semántica. |
overallToolInvocationResult |
Solo salida. Es el resultado de la verificación general de la invocación de la herramienta. |
errorInfo |
Solo salida. Es información sobre el error que ocurrió durante este turno. |
spanLatencies[] |
Solo salida. Es la latencia de los intervalos en el turno. |
Campo de unión
|
|
toolOrderedInvocationScore |
Solo salida. Es la puntuación general de invocación ordenada de la herramienta para este turno. Indica el porcentaje general de herramientas del turno esperado que se invocaron realmente en el orden esperado. |
GoldenExpectationOutcome
| Representación JSON |
|---|
{ "expectation": { object ( |
| Campos | |
|---|---|
expectation |
Solo salida. Es la expectativa que se evaluó. |
outcome |
Solo salida. Es el resultado de la expectativa. |
semanticSimilarityResult |
Solo salida. Es el resultado de la verificación de similitud semántica. |
toolInvocationResult |
Solo salida. Es el resultado de la verificación de la invocación de la herramienta. |
Campo de unión result. Es el resultado de la expectativa. result puede ser solo uno de los parámetros siguientes: |
|
observedToolCall |
Solo salida. Es el resultado de la expectativa de llamada a herramienta. |
observedToolResponse |
Solo salida. Es el resultado de la expectativa de respuesta de la herramienta. |
observedAgentResponse |
Solo salida. Es el resultado de la expectativa de respuesta del agente. |
observedAgentTransfer |
Solo salida. Es el resultado de la expectativa de transferencia del agente. |
SemanticSimilarityResult
| Representación JSON |
|---|
{ "label": string, "explanation": string, "outcome": enum ( |
| Campos | |
|---|---|
label |
Solo salida. Es la etiqueta asociada a cada puntuación. Puntuación 4: Completamente coherente Puntuación 3: Mayormente coherente Puntuación 2: Parcialmente coherente (omisiones menores) Puntuación 1: Mayormente incoherente (omisiones importantes) Puntuación 0: Completamente incoherente o contradictorio |
explanation |
Solo salida. Es la explicación de la puntuación de similitud semántica. |
outcome |
Solo salida. Es el resultado de la verificación de similitud semántica. Esto se determina comparando la puntuación con semantic_similarity_success_threshold. Si la puntuación es igual o superior al umbral, el resultado será APROBADO. De lo contrario, el resultado será FAIL. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de similitud semántica. Puede ser 0, 1, 2, 3 o 4. |
ToolInvocationResult
| Representación JSON |
|---|
{ "outcome": enum ( |
| Campos | |
|---|---|
outcome |
Solo salida. Es el resultado de la verificación de la invocación de la herramienta. Esto se determina comparando el parámetro parameter_correctness_score con el umbral. Si la puntuación es igual o superior al umbral, el resultado será APROBADO. De lo contrario, el resultado será FAIL. |
explanation |
Solo salida. Es una explicación de texto libre sobre el resultado de la invocación de la herramienta. |
Campo de unión
|
|
parameterCorrectnessScore |
Solo salida. Es la puntuación de corrección del parámetro de invocación de la herramienta. Indica el porcentaje de parámetros de la llamada a la herramienta esperada que también estuvieron presentes en la llamada a la herramienta real. |
HallucinationResult
| Representación JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Solo salida. Es la etiqueta asociada a cada puntuación. Puntuación 1: Puntuación justificada 0: Puntuación no justificada -1: No hay reclamo para evaluar |
explanation |
Solo salida. Es la explicación de la puntuación de alucinación. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de alucinación. Puede ser -1, 0 o 1. |
ToolCallLatency
| Representación JSON |
|---|
{ "tool": string, "displayName": string, "startTime": string, "endTime": string, "executionLatency": string } |
| Campos | |
|---|---|
tool |
Solo salida. Es el nombre de la herramienta que se ejecutó. Formato: |
displayName |
Solo salida. Es el nombre visible de la herramienta. |
startTime |
Solo salida. Es la hora de inicio de la ejecución de la llamada a la herramienta. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
endTime |
Solo salida. Es la hora de finalización de la ejecución de la llamada a la herramienta. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
executionLatency |
Solo salida. Es la latencia de la ejecución de la llamada a la herramienta. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
OverallToolInvocationResult
| Representación JSON |
|---|
{ "outcome": enum ( |
| Campos | |
|---|---|
outcome |
Solo salida. Es el resultado de la verificación de la invocación de la herramienta. Esto se determina comparando tool_invocation_score con overall_tool_invocation_correctness_threshold. Si la puntuación es igual o superior al umbral, el resultado será APROBADO. De lo contrario, el resultado será FAIL. |
Campo de unión
|
|
toolInvocationScore |
Es la puntuación general de invocación de la herramienta para este turno. Indica el porcentaje general de herramientas del turno esperado que se invocaron realmente. |
EvaluationErrorInfo
| Representación JSON |
|---|
{
"errorType": enum ( |
| Campos | |
|---|---|
errorType |
Solo salida. Es el tipo de error. |
errorMessage |
Solo salida. Mensaje de error. |
sessionId |
Solo salida. Es el ID de la sesión de la conversación que causó el error. |
SpanLatency
| Representación JSON |
|---|
{ "type": enum ( |
| Campos | |
|---|---|
type |
Solo salida. Es el tipo de intervalo. |
displayName |
Solo salida. Es el nombre visible del intervalo. Se aplica a los tramos de herramientas y protecciones. |
startTime |
Solo salida. Es la hora de inicio del período. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
endTime |
Solo salida. Es la hora de finalización del período. Usa el formato RFC 3339, en el que el resultado generado siempre usará la normalización Z y los dígitos fraccionarios 0, 3, 6 o 9. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
executionLatency |
Solo salida. Es la latencia del intervalo. Una duración en segundos con hasta nueve dígitos decimales, que terminan en “ |
Campo de unión identifier. Es el identificador del elemento específico según su tipo. identifier puede ser solo uno de los parámetros siguientes: |
|
resource |
Solo salida. Es el nombre del recurso de los tramos de la herramienta o la protección. |
toolset |
Solo salida. Es el identificador de la herramienta del conjunto de herramientas. |
model |
Solo salida. Es el nombre del intervalo del LLM. |
callback |
Solo salida. Es el nombre del intervalo de devolución de llamada del usuario. |
EvaluationExpectationResult
| Representación JSON |
|---|
{
"evaluationExpectation": string,
"prompt": string,
"outcome": enum ( |
| Campos | |
|---|---|
evaluationExpectation |
Solo salida. Es la expectativa de evaluación. Formato: |
prompt |
Solo salida. Es la instrucción que se usó para la evaluación. |
outcome |
Solo salida. Es el resultado esperado de la evaluación. |
explanation |
Solo salida. Es la explicación del resultado. |
ScenarioResult
| Representación JSON |
|---|
{ "conversation": string, "task": string, "userFacts": [ { object ( |
| Campos | |
|---|---|
conversation |
Solo salida. Es la conversación que se generó en la situación. |
task |
Solo salida. Es la tarea que se usó cuando se ejecutó la situación para este resultado. |
userFacts[] |
Solo salida. Son los datos del usuario que el escenario usó para este resultado. |
expectationOutcomes[] |
Solo salida. Es el resultado de cada expectativa. |
rubricOutcomes[] |
Solo salida. Es el resultado de la rúbrica. |
hallucinationResult[] |
Solo salida. Es el resultado de la verificación de alucinaciones. Habrá un resultado de alucinación por cada turno de la conversación. |
taskCompletionResult |
Solo salida. Es el resultado de la verificación de finalización de la tarea. |
toolCallLatencies[] |
Solo salida. Es la latencia de cada ejecución de llamada a herramienta en la conversación. |
userGoalSatisfactionResult |
Solo salida. Es el resultado de la verificación de satisfacción del objetivo del usuario. |
spanLatencies[] |
Solo salida. Es la latencia de los tramos en la conversación. |
evaluationExpectationResults[] |
Solo salida. Son los resultados de las expectativas de evaluación. |
Campo de unión
|
|
allExpectationsSatisfied |
Solo salida. Indica si se cumplieron todas las expectativas para este turno. |
Campo de unión
|
|
taskCompleted |
Solo salida. Indica si la tarea se completó en este turno. Es una combinación de todas las expectativas satisfechas, la ausencia de alucinaciones y la satisfacción del objetivo del usuario. |
ScenarioExpectationOutcome
| Representación JSON |
|---|
{ "expectation": { object ( |
| Campos | |
|---|---|
expectation |
Solo salida. Es la expectativa que se evaluó. |
outcome |
Solo salida. Es el resultado de ScenarioExpectation. |
Campo de unión result. Es el resultado de la expectativa. result puede ser solo uno de los parámetros siguientes: |
|
observedToolCall |
Solo salida. Es la llamada a la herramienta observada. |
observedAgentResponse |
Solo salida. Es la respuesta observada del agente. |
ObservedToolCall
| Representación JSON |
|---|
{ "toolCall": { object ( |
| Campos | |
|---|---|
toolCall |
Solo salida. Es la llamada a la herramienta observada. |
toolResponse |
Solo salida. Es la respuesta observada de la herramienta. |
ScenarioRubricOutcome
| Representación JSON |
|---|
{ "rubric": string, "scoreExplanation": string, // Union field |
| Campos | |
|---|---|
rubric |
Solo salida. Es la rúbrica que se usó para evaluar la conversación. |
scoreExplanation |
Solo salida. Es la respuesta del evaluador a la rúbrica. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de la conversación según la rúbrica. |
TaskCompletionResult
| Representación JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Solo salida. Es la etiqueta asociada a cada puntuación. Puntuación 1: Tarea completada Puntuación 0: Tarea no completada Puntuación -1: Objetivo del usuario no definido |
explanation |
Solo salida. Es la explicación de la puntuación de finalización de la tarea. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de finalización de la tarea. Puede ser -1, 0 o 1. |
UserGoalSatisfactionResult
| Representación JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Solo salida. Es la etiqueta asociada a cada puntuación. Puntuación 1: Tarea del usuario satisfecha. Puntuación 0: Tarea del usuario no satisfecha. Puntuación -1: Tarea del usuario no especificada. |
explanation |
Solo salida. Es la explicación de la puntuación de satisfacción de la tarea del usuario. |
Campo de unión
|
|
score |
Solo salida. Es la puntuación de satisfacción con la tarea del usuario. Puede ser -1, 0 o 1. |
EvaluationPersona
| Representación JSON |
|---|
{
"name": string,
"description": string,
"displayName": string,
"personality": string,
"speechConfig": {
object ( |
| Campos | |
|---|---|
name |
Obligatorio. Es el identificador único del arquetipo. Formato: |
description |
Es opcional. Es la descripción del arquetipo. |
displayName |
Obligatorio. Es el nombre visible del arquetipo. Es único dentro de una app. |
personality |
Obligatorio. Es una instrucción para el agente sobre cómo comportarse en la evaluación. |
speechConfig |
Es opcional. Es la configuración de cómo suena la persona (parámetros de configuración de TTS). |
SpeechConfig
| Representación JSON |
|---|
{
"speakingRate": number,
"environment": enum ( |
| Campos | |
|---|---|
speakingRate |
Es opcional. Es la velocidad de habla. 1.0 es normal. Cuanto más bajo, más lento (p.ej., 0.8), cuanto más alto sea el valor, más rápido será (p.ej., 1.5). Es útil para probar cómo el agente maneja a las personas que hablan rápido. |
environment |
Es opcional. Es el entorno de audio simulado. |
voiceId |
Es opcional. Es el identificador o acento de voz específico que se usará. Ejemplo: "es-MX-Wavenet-D" o "es-ES-Standard-A" |
Estado
| Representación JSON |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| Campos | |
|---|---|
code |
El código de estado, que debe ser un valor enum de |
message |
Un mensaje de error dirigido al desarrollador, que debe estar en inglés. Cualquier mensaje de error dirigido al usuario debe localizarse y enviarse al campo |
details[] |
Una lista de mensajes que contienen los detalles del error. Hay un conjunto común de tipos de mensajes para que usen las API. Un objeto que contiene campos de un tipo arbitrario. Un campo adicional |
Cualquiera
| Representación JSON |
|---|
{ "typeUrl": string, "value": string } |
| Campos | |
|---|---|
typeUrl |
Identifica el tipo del mensaje serializado de Protobuf con una referencia de URI que consta de un prefijo que termina en una barra y el nombre del tipo completamente calificado. Ejemplo: type.googleapis.com/google.protobuf.StringValue Esta cadena debe contener al menos un carácter El prefijo es arbitrario, y se espera que las implementaciones de Protobuf simplemente quiten todo hasta el último Todas las cadenas de URL de tipo deben ser referencias URI legales con la restricción adicional (para el formato de texto) de que el contenido de la referencia solo debe constar de caracteres alfanuméricos, escapes codificados como porcentaje y caracteres del siguiente conjunto (sin incluir las comillas invertidas externas): En el diseño original de |
value |
Contiene una serialización de Protobuf del tipo que describe type_url. Es una cadena codificada en Base64. |
EvaluationMetricsThresholds
| Representación JSON |
|---|
{ "goldenEvaluationMetricsThresholds": { object ( |
| Campos | |
|---|---|
goldenEvaluationMetricsThresholds |
Es opcional. Son los umbrales de las métricas de evaluación de referencia. |
hallucinationMetricBehavior |
Es opcional. Obsoleto: Usa |
goldenHallucinationMetricBehavior |
Es opcional. Es el comportamiento de la métrica de alucinación para las evaluaciones de referencia. |
scenarioHallucinationMetricBehavior |
Es opcional. Es el comportamiento de la métrica de alucinación para las evaluaciones de situaciones. |
GoldenEvaluationMetricsThresholds
| Representación JSON |
|---|
{ "turnLevelMetricsThresholds": { object ( |
| Campos | |
|---|---|
turnLevelMetricsThresholds |
Es opcional. Son los umbrales de las métricas a nivel del turno. |
expectationLevelMetricsThresholds |
Es opcional. Son los umbrales de las métricas del nivel de expectativa. |
toolMatchingSettings |
Es opcional. Es la configuración de la herramienta de correlación. Una llamada a herramienta adicional es una llamada a herramienta que está presente en la ejecución, pero no coincide con ninguna llamada a herramienta en la expectativa ideal. |
TurnLevelMetricsThresholds
| Representación JSON |
|---|
{ "semanticSimilarityChannel": enum ( |
| Campos | |
|---|---|
semanticSimilarityChannel |
Es opcional. Es el canal de similitud semántica que se usará para la evaluación. |
Campo de unión
|
|
semanticSimilaritySuccessThreshold |
Es opcional. Es el umbral de éxito para la similitud semántica. Debe ser un número entero entre 0 y 4. El valor predeterminado es >= 3. |
Campo de unión
|
|
overallToolInvocationCorrectnessThreshold |
Es opcional. Es el umbral de éxito para la corrección general de la invocación de la herramienta. Debe ser un número de punto flotante entre 0 y 1. El valor predeterminado es 1.0. |
ExpectationLevelMetricsThresholds
| Representación JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de unión
|
|
toolInvocationParameterCorrectnessThreshold |
Es opcional. Es el umbral de éxito para la corrección de parámetros de invocación de herramientas individuales. Debe ser un número de punto flotante entre 0 y 1. El valor predeterminado es 1.0. |
ToolMatchingSettings
| Representación JSON |
|---|
{
"extraToolCallBehavior": enum ( |
| Campos | |
|---|---|
extraToolCallBehavior |
Es opcional. Comportamiento para las llamadas a herramientas adicionales. La configuración predeterminada es FAIL. |
EvaluationConfig
| Representación JSON |
|---|
{ "inputAudioConfig": { object ( |
| Campos | |
|---|---|
inputAudioConfig |
Es opcional. Es la configuración para procesar el audio de entrada. |
outputAudioConfig |
Es opcional. Es la configuración para generar el audio de salida. |
evaluationChannel |
Es opcional. Es el canal que se evaluará. |
toolCallBehaviour |
Es opcional. Especifica si la evaluación debe usar llamadas a herramientas reales o herramientas simuladas. |
InputAudioConfig
| Representación JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obligatorio. Es la codificación de los datos de audio de entrada. |
sampleRateHertz |
Obligatorio. Es la tasa de muestreo (en hercios) de los datos de audio de entrada. |
noiseSuppressionLevel |
Es opcional. Indica si se debe habilitar la supresión de ruido en el audio de entrada. Los valores disponibles son "low", "moderate", "high" y "very_high". |
OutputAudioConfig
| Representación JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obligatorio. Es la codificación de los datos de audio de salida. |
sampleRateHertz |
Obligatorio. Es la tasa de muestreo (en hercios) de los datos de audio de salida. |
Anotaciones de herramientas
Pista destructiva: ❌ | Pista idempotente: ❌ | Pista de solo lectura: ❌ | Pista de mundo abierto: ❌