MCP Tools Reference: ces.googleapis.com

Strumento: `create_evaluation`

Crea una nuova valutazione.

Il seguente esempio mostra come utilizzare curl per richiamare lo strumento MCP create_evaluation.

Curl Request
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "create_evaluation", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }'

Curl Request

                  
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \
--header 'content-type: application/json' \
--header 'accept: application/json, text/event-stream' \
--data '{
  "method": "tools/call",
  "params": {
    "name": "create_evaluation",
    "arguments": {
      // provide these details according to the tool's MCP specification
    }
  },
  "jsonrpc": "2.0",
  "id": 1
}'

Schema di input

Messaggio di richiesta per EvaluationService.CreateEvaluation.

CreateEvaluationRequest

Rappresentazione JSON
{ "parent": string, "evaluationId": string, "evaluation": { object (`Evaluation`) } }

Campi

Campi
`parent`	`string` Obbligatorio. L'app per cui creare la valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}`
`evaluationId`	`string` Facoltativo. L'ID da utilizzare per la valutazione, che diventerà il componente finale del nome della risorsa della valutazione. Se non viene fornito, verrà assegnato automaticamente un ID univoco per la valutazione.
`evaluation`	`object (Evaluation)` Obbligatorio. La valutazione da creare.

parent

string

Obbligatorio. L'app per cui creare la valutazione. Formato: projects/{project}/locations/{location}/apps/{app}

evaluationId

string

Facoltativo. L'ID da utilizzare per la valutazione, che diventerà il componente finale del nome della risorsa della valutazione. Se non viene fornito, verrà assegnato automaticamente un ID univoco per la valutazione.

evaluation

object (Evaluation)

Obbligatorio. La valutazione da creare.

Valutazione

Rappresentazione JSON

Rappresentazione JSON
{ "name": string, "displayName": string, "description": string, "tags": [ string ], "evaluationDatasets": [ string ], "createTime": string, "createdBy": string, "updateTime": string, "lastUpdatedBy": string, "evaluationRuns": [ string ], "etag": string, "aggregatedMetrics": { object (`AggregatedMetrics`) }, "lastCompletedResult": { object (`EvaluationResult`) }, "invalid": boolean, "lastTenResults": [ { object (`EvaluationResult`) } ], // Union field `inputs` can be only one of the following: "golden": { object (`Golden`) }, "scenario": { object (`Scenario`) } // End of list of possible types for union field `inputs`. }

{
  "name": string,
  "displayName": string,
  "description": string,
  "tags": [
    string
  ],
  "evaluationDatasets": [
    string
  ],
  "createTime": string,
  "createdBy": string,
  "updateTime": string,
  "lastUpdatedBy": string,
  "evaluationRuns": [
    string
  ],
  "etag": string,
  "aggregatedMetrics": {
    object (AggregatedMetrics)
  },
  "lastCompletedResult": {
    object (EvaluationResult)
  },
  "invalid": boolean,
  "lastTenResults": [
    {
      object (EvaluationResult)
    }
  ],

  // Union field inputs can be only one of the following:
  "golden": {
    object (Golden)
  },
  "scenario": {
    object (Scenario)
  }
  // End of list of possible types for union field inputs.
}

Campi
`name`	`string` Identificatore. L'identificatore univoco di questa valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluations/{evaluation}`
`displayName`	`string` Obbligatorio. Nome visualizzato definito dall'utente della valutazione. Unico all'interno di un'app.
`description`	`string` Facoltativo. Descrizione definita dall'utente della valutazione.
`tags[]`	`string` Facoltativo. Tag definiti dall'utente per classificare la valutazione.
`evaluationDatasets[]`	`string` Solo output. Elenco dei set di dati di valutazione a cui appartiene la valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationDatasets/{evaluationDataset}`
`createTime`	`string (Timestamp format)` Solo output. Timestamp di creazione della valutazione. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`createdBy`	`string` Solo output. L'utente che ha creato la valutazione.
`updateTime`	`string (Timestamp format)` Solo output. Timestamp dell'ultimo aggiornamento della valutazione. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`lastUpdatedBy`	`string` Solo output. L'utente che ha aggiornato per ultimo la valutazione.
`evaluationRuns[]`	`string` Solo output. Le EvaluationRuns a cui è associata questa valutazione.
`etag`	`string` Solo output. Etag utilizzato per garantire che l'oggetto non sia stato modificato durante un'operazione di lettura, modifica e scrittura. Se l'etag è vuoto, l'aggiornamento sovrascriverà eventuali modifiche simultanee.
`aggregatedMetrics`	`object (AggregatedMetrics)` Solo output. Le metriche aggregate per questa valutazione in tutte le esecuzioni.
`lastCompletedResult`	`object (EvaluationResult)` Solo output. Il risultato dell'ultima valutazione.
`invalid`	`boolean` Solo output. Indica se la valutazione non è valida. Ciò può accadere se una valutazione fa riferimento a uno strumento, a un insieme di strumenti o a un agente che è stato eliminato.
`lastTenResults[]`	`object (EvaluationResult)` Solo output. Gli ultimi 10 risultati della valutazione. Questo campo viene compilato solo se include_last_ten_results è impostato su true in ListEvaluationsRequest o GetEvaluationRequest.
Campo unione `inputs`. Gli input per la valutazione `inputs` possono essere solo uno dei seguenti:
`golden`	`object (Golden)` Facoltativo. I passaggi dorati da valutare.
`scenario`	`object (Scenario)` Facoltativo. La configurazione di uno scenario.

Golden

Rappresentazione JSON
{ "turns": [ { object (`GoldenTurn`) } ], "evaluationExpectations": [ string ] }

Campi

Campi
`turns[]`	`object (GoldenTurn)` Obbligatorio. Le svolte d'oro necessarie per riprodurre una conversazione d'oro.
`evaluationExpectations[]`	`string` Facoltativo. Le aspettative di valutazione in base alle quali valutare la conversazione riprodotta. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationExpectations/{evaluationExpectation}`

turns[]

object (GoldenTurn)

Obbligatorio. Le svolte d'oro necessarie per riprodurre una conversazione d'oro.

evaluationExpectations[]

string

Facoltativo. Le aspettative di valutazione in base alle quali valutare la conversazione riprodotta. Formato: projects/{project}/locations/{location}/apps/{app}/evaluationExpectations/{evaluationExpectation}

GoldenTurn

Rappresentazione JSON
{ "steps": [ { object (`Step`) } ], "rootSpan": { object (`Span`) } }

Campi

Campi
`steps[]`	`object (Step)` Obbligatorio. I passaggi necessari per riprodurre una conversazione di riferimento.
`rootSpan`	`object (Span)` Facoltativo. Lo span radice della svolta d'oro per l'elaborazione e la manutenzione delle informazioni audio.

steps[]

object (Step)

Obbligatorio. I passaggi necessari per riprodurre una conversazione di riferimento.

rootSpan

object (Span)

Facoltativo. Lo span radice della svolta d'oro per l'elaborazione e la manutenzione delle informazioni audio.

Passaggio

Rappresentazione JSON

Rappresentazione JSON
{ // Union field `step` can be only one of the following: "userInput": { object (`SessionInput`) }, "agentTransfer": { object (`AgentTransfer`) }, "expectation": { object (`GoldenExpectation`) } // End of list of possible types for union field `step`. }

{

  // Union field step can be only one of the following:
  "userInput": {
    object (SessionInput)
  },
  "agentTransfer": {
    object (AgentTransfer)
  },
  "expectation": {
    object (GoldenExpectation)
  }
  // End of list of possible types for union field step.
}

Campi
Campo unione `step`. Il passaggio da eseguire. `step` può essere solo uno dei seguenti tipi:
`userInput`	`object (SessionInput)` Facoltativo. Input utente per la conversazione.
`agentTransfer`	`object (AgentTransfer)` Facoltativo. Trasferire la conversazione a un altro agente.
`expectation`	`object (GoldenExpectation)` Facoltativo. Esegue un'aspettativa nel turno corrente.

SessionInput

Rappresentazione JSON

Rappresentazione JSON
{ "willContinue": boolean, // Union field `input_type` can be only one of the following: "text": string, "dtmf": string, "audio": string, "toolResponses": { object (`ToolResponses`) }, "image": { object (`Image`) }, "blob": { object (`Blob`) }, "variables": { object }, "event": { object (`Event`) } // End of list of possible types for union field `input_type`. }

{
  "willContinue": boolean,

  // Union field input_type can be only one of the following:
  "text": string,
  "dtmf": string,
  "audio": string,
  "toolResponses": {
    object (ToolResponses)
  },
  "image": {
    object (Image)
  },
  "blob": {
    object (Blob)
  },
  "variables": {
    object
  },
  "event": {
    object (Event)
  }
  // End of list of possible types for union field input_type.
}

Campi
`willContinue`	`boolean` Facoltativo. Un flag che indica se il messaggio corrente è un frammento di un input più grande nella sessione di streaming bidirezionale. Se impostato su `true`, l'agente posticipa l'elaborazione fino a quando non riceve un messaggio successivo in cui `will_continue` è `false` o fino a quando il sistema non rileva un endpoint nell'input audio. NOTA: questo campo non si applica agli input audio e DTMF, in quanto vengono sempre elaborati automaticamente in base al segnale di fine.
Campo unione `input_type`. Il tipo di input. `input_type` può essere solo uno dei seguenti tipi:
`text`	`string` Facoltativo. Dati di testo dell'utente finale.
`dtmf`	`string` Facoltativo. Cifre DTMF dell'utente finale.
`audio`	`string (bytes format)` Facoltativo. Dati audio dell'utente finale. Una stringa con codifica in base64.
`toolResponses`	`object (ToolResponses)` Facoltativo. Risultati dell'esecuzione per le chiamate di strumenti dal client.
`image`	`object (Image)` Facoltativo. Dati delle immagini dell'utente finale.
`blob`	`object (Blob)` Facoltativo. Dati blob dell'utente finale.
`variables`	`object (Struct format)` Facoltativo. Variabili contestuali per la sessione, identificate per nome. L'agente CES utilizzerà solo le variabili dichiarate nell'app. Le variabili non riconosciute verranno comunque inviate all'[agente Dialogflow][Agent.RemoteDialogflowAgent] come parametri di sessione aggiuntivi.
`event`	`object (Event)` Facoltativo. Input evento.

ToolResponses

Rappresentazione JSON
{ "toolResponses": [ { object (`ToolResponse`) } ] }

Campi

Campi
`toolResponses[]`	`object (ToolResponse)` Facoltativo. L'elenco dei risultati dell'esecuzione dello strumento.

toolResponses[]

object (ToolResponse)

Facoltativo. L'elenco dei risultati dell'esecuzione dello strumento.

ToolResponse

Rappresentazione JSON

Rappresentazione JSON
{ "id": string, "displayName": string, "response": { object }, // Union field `tool_identifier` can be only one of the following: "tool": string, "toolsetTool": { object (`ToolsetTool`) } // End of list of possible types for union field `tool_identifier`. }

{
  "id": string,
  "displayName": string,
  "response": {
    object
  },

  // Union field tool_identifier can be only one of the following:
  "tool": string,
  "toolsetTool": {
    object (ToolsetTool)
  }
  // End of list of possible types for union field tool_identifier.
}

Campi
`id`	`string` Facoltativo. L'ID corrispondente di `tool call` a cui si riferisce la risposta.
`displayName`	`string` Solo output. Nome visualizzato dello strumento.
`response`	`object (Struct format)` Obbligatorio. Il risultato dell'esecuzione dello strumento in formato oggetto JSON. Utilizza la chiave "output" per specificare la risposta dello strumento e la chiave "error" per specificare i dettagli dell'errore (se presenti). Se le chiavi "output" ed "error" non sono specificate, l'intera "response" viene trattata come risultato dell'esecuzione dello strumento.
Campo unione `tool_identifier`. L'identificatore dello strumento eseguito. Può trattarsi di uno strumento persistente o di uno strumento di un insieme di strumenti. `tool_identifier` può essere solo uno dei seguenti tipi:
`tool`	`string` Facoltativo. Il nome dello strumento da eseguire. Formato: `projects/{project}/locations/{location}/apps/{app}/tools/{tool}`
`toolsetTool`	`object (ToolsetTool)` Facoltativo. Lo strumento del toolset che è stato eseguito.

ToolsetTool

Rappresentazione JSON
{ "toolset": string, "toolId": string }

Campi

Campi
`toolset`	`string` Obbligatorio. Il nome della risorsa del Toolset da cui deriva questo strumento. Formato: `projects/{project}/locations/{location}/apps/{app}/toolsets/{toolset}`
`toolId`	`string` Facoltativo. L'ID dello strumento per filtrare gli strumenti per cui recuperare lo schema.

toolset

string

Obbligatorio. Il nome della risorsa del Toolset da cui deriva questo strumento. Formato: projects/{project}/locations/{location}/apps/{app}/toolsets/{toolset}

toolId

string

Facoltativo. L'ID dello strumento per filtrare gli strumenti per cui recuperare lo schema.

Struct

Rappresentazione JSON
{ "fields": { string: value, ... } }

Campi

Campi
`fields`	`map (key: string, value: value (Value format))` Mappa non ordinata di valori con tipo dinamico. Un oggetto contenente un elenco di coppie `"key": value`. Esempio: `{ "name": "wrench", "mass": "1.3kg", "count": "3" }`.

fields

map (key: string, value: value (Value format))

Mappa non ordinata di valori con tipo dinamico.

Un oggetto contenente un elenco di coppie "key": value. Esempio: { "name": "wrench", "mass": "1.3kg", "count": "3" }.

FieldsEntry

Rappresentazione JSON
{ "key": string, "value": value }

Campi
`key`	`string`
`value`	`value (Value format)`

Valore

Rappresentazione JSON

Rappresentazione JSON
{ // Union field `kind` can be only one of the following: "nullValue": null, "numberValue": number, "stringValue": string, "boolValue": boolean, "structValue": { object }, "listValue": array // End of list of possible types for union field `kind`. }

{

  // Union field kind can be only one of the following:
  "nullValue": null,
  "numberValue": number,
  "stringValue": string,
  "boolValue": boolean,
  "structValue": {
    object
  },
  "listValue": array
  // End of list of possible types for union field kind.
}

Campi
Campo unione `kind`. Il tipo di valore. `kind` può essere solo uno dei seguenti tipi:
`nullValue`	`null` Rappresenta un valore null.
`numberValue`	`number` Rappresenta un valore double.
`stringValue`	`string` Rappresenta un valore stringa.
`boolValue`	`boolean` Rappresenta un valore booleano.
`structValue`	`object (Struct format)` Rappresenta un valore strutturato.
`listValue`	`array (ListValue format)` Rappresenta un `Value` ripetuto.

ListValue

Rappresentazione JSON
{ "values": [ value ] }

Campi

Campi
`values[]`	`value (Value format)` Campo ripetuto di valori con tipo dinamico.

values[]

value (Value format)

Campo ripetuto di valori con tipo dinamico.

Immagine

Rappresentazione JSON
{ "mimeType": string, "data": string }

Campi

Campi
`mimeType`	`string` Obbligatorio. Il tipo MIME standard IANA dei dati di origine. I tipi di immagini supportati includono: * image/png * image/jpeg * image/webp
`data`	`string (bytes format)` Obbligatorio. Byte non elaborati dell'immagine. Una stringa con codifica in base64.

mimeType

string

Obbligatorio. Il tipo MIME standard IANA dei dati di origine. I tipi di immagini supportati includono: * image/png * image/jpeg * image/webp

data

string (bytes format)

Obbligatorio. Byte non elaborati dell'immagine.

Una stringa con codifica in base64.

Blob

Rappresentazione JSON
{ "mimeType": string, "data": string }

Campi

Campi
`mimeType`	`string` Obbligatorio. Il tipo MIME standard IANA dei dati di origine.
`data`	`string (bytes format)` Obbligatorio. Byte non elaborati del blob. Una stringa con codifica in base64.

mimeType

string

Obbligatorio. Il tipo MIME standard IANA dei dati di origine.

data

string (bytes format)

Obbligatorio. Byte non elaborati del blob.

Una stringa con codifica in base64.

Evento

Rappresentazione JSON
{ "event": string }

Campi

Campi
`event`	`string` Obbligatorio. Il nome dell'evento.

event

string

Obbligatorio. Il nome dell'evento.

AgentTransfer

Rappresentazione JSON
{ "targetAgent": string, "displayName": string }

Campi

Campi
`targetAgent`	`string` Obbligatorio. L'agente a cui viene trasferita la conversazione. L'agente gestirà la conversazione da questo punto in poi. Formato: `projects/{project}/locations/{location}/apps/{app}/agents/{agent}`
`displayName`	`string` Solo output. Il nome visualizzato dell'agente.

targetAgent

string

Obbligatorio. L'agente a cui viene trasferita la conversazione. L'agente gestirà la conversazione da questo punto in poi. Formato: projects/{project}/locations/{location}/apps/{app}/agents/{agent}

displayName

string

Solo output. Il nome visualizzato dell'agente.

GoldenExpectation

Rappresentazione JSON

Rappresentazione JSON
{ "note": string, // Union field `condition` can be only one of the following: "toolCall": { object (`ToolCall`) }, "toolResponse": { object (`ToolResponse`) }, "agentResponse": { object (`Message`) }, "agentTransfer": { object (`AgentTransfer`) }, "updatedVariables": { object }, "mockToolResponse": { object (`ToolResponse`) } // End of list of possible types for union field `condition`. }

{
  "note": string,

  // Union field condition can be only one of the following:
  "toolCall": {
    object (ToolCall)
  },
  "toolResponse": {
    object (ToolResponse)
  },
  "agentResponse": {
    object (Message)
  },
  "agentTransfer": {
    object (AgentTransfer)
  },
  "updatedVariables": {
    object
  },
  "mockToolResponse": {
    object (ToolResponse)
  }
  // End of list of possible types for union field condition.
}

Campi
`note`	`string` Facoltativo. Una nota per questo requisito, utile per la generazione di report quando controlli specifici non vanno a buon fine. Ad esempio, "Check_Payment_Tool_Called".
Campo unione `condition`. Il controllo effettivo da eseguire. `condition` può essere solo uno dei seguenti tipi:
`toolCall`	`object (ToolCall)` Facoltativo. Verifica che sia stato chiamato uno strumento specifico con i parametri.
`toolResponse`	`object (ToolResponse)` Facoltativo. Controlla che uno strumento specifico abbia dato la risposta prevista.
`agentResponse`	`object (Message)` Facoltativo. Controlla che l'agente abbia risposto con la risposta corretta. Il ruolo "agente" è implicito.
`agentTransfer`	`object (AgentTransfer)` Facoltativo. Controlla che l'agente abbia trasferito la conversazione a un altro agente.
`updatedVariables`	`object (Struct format)` Facoltativo. Verifica che l'agente abbia aggiornato le variabili di sessione ai valori previsti. Utilizzato anche per acquisire gli aggiornamenti delle variabili dell'agente per le valutazioni di riferimento.
`mockToolResponse`	`object (ToolResponse)` Facoltativo. La risposta dello strumento alla simulazione, con i parametri di interesse specificati. Eventuali parametri non specificati verranno inventati dal LLM.

ToolCall

Rappresentazione JSON

Rappresentazione JSON
{ "id": string, "displayName": string, "args": { object }, // Union field `tool_identifier` can be only one of the following: "tool": string, "toolsetTool": { object (`ToolsetTool`) } // End of list of possible types for union field `tool_identifier`. }

{
  "id": string,
  "displayName": string,
  "args": {
    object
  },

  // Union field tool_identifier can be only one of the following:
  "tool": string,
  "toolsetTool": {
    object (ToolsetTool)
  }
  // End of list of possible types for union field tool_identifier.
}

Campi
`id`	`string` Facoltativo. L'identificatore univoco della chiamata allo strumento. Se compilato, il client deve restituire il risultato dell'esecuzione con l'ID corrispondenza in `ToolResponse`.
`displayName`	`string` Solo output. Nome visualizzato dello strumento.
`args`	`object (Struct format)` Facoltativo. I parametri e i valori di input per lo strumento in formato oggetto JSON.
Campo unione `tool_identifier`. L'identificatore dello strumento da eseguire. Può trattarsi di uno strumento persistente o di uno strumento di un insieme di strumenti. `tool_identifier` può essere solo uno dei seguenti tipi:
`tool`	`string` Facoltativo. Il nome dello strumento da eseguire. Formato: `projects/{project}/locations/{location}/apps/{app}/tools/{tool}`
`toolsetTool`	`object (ToolsetTool)` Facoltativo. Lo strumento del toolset da eseguire.

Messaggio

Rappresentazione JSON
{ "role": string, "chunks": [ { object (`Chunk`) } ], "eventTime": string }

Campi

Campi
`role`	`string` Facoltativo. Il ruolo all'interno della conversazione, ad esempio utente, agente.
`chunks[]`	`object (Chunk)` Facoltativo. Contenuto del messaggio come una serie di blocchi.
`eventTime`	`string (Timestamp format)` Facoltativo. Timestamp di invio o ricezione del messaggio. Non deve essere utilizzato se il messaggio fa parte di un `example`. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.

role

string

Facoltativo. Il ruolo all'interno della conversazione, ad esempio utente, agente.

chunks[]

object (Chunk)

Facoltativo. Contenuto del messaggio come una serie di blocchi.

eventTime

string (Timestamp format)

Facoltativo. Timestamp di invio o ricezione del messaggio. Non deve essere utilizzato se il messaggio fa parte di un example.

Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" o "2014-10-02T15:01:23+05:30".

Chunk

Rappresentazione JSON

Rappresentazione JSON
{ // Union field `data` can be only one of the following: "text": string, "transcript": string, "blob": { object (`Blob`) }, "payload": { object }, "image": { object (`Image`) }, "toolCall": { object (`ToolCall`) }, "toolResponse": { object (`ToolResponse`) }, "agentTransfer": { object (`AgentTransfer`) }, "updatedVariables": { object }, "defaultVariables": { object } // End of list of possible types for union field `data`. }

{

  // Union field data can be only one of the following:
  "text": string,
  "transcript": string,
  "blob": {
    object (Blob)
  },
  "payload": {
    object
  },
  "image": {
    object (Image)
  },
  "toolCall": {
    object (ToolCall)
  },
  "toolResponse": {
    object (ToolResponse)
  },
  "agentTransfer": {
    object (AgentTransfer)
  },
  "updatedVariables": {
    object
  },
  "defaultVariables": {
    object
  }
  // End of list of possible types for union field data.
}

Campi
Campo unione `data`. Dividi i dati in blocchi. `data` può essere solo uno dei seguenti tipi:
`text`	`string` Facoltativo. Dati di testo.
`transcript`	`string` Facoltativo. Trascrizione associata all'audio.
`blob`	`object (Blob)` Facoltativo. Dati blob.
`payload`	`object (Struct format)` Facoltativo. Dati di payload personalizzati.
`image`	`object (Image)` Facoltativo. Dati immagine.
`toolCall`	`object (ToolCall)` Facoltativo. Richiesta di esecuzione dello strumento.
`toolResponse`	`object (ToolResponse)` Facoltativo. Risposta all'esecuzione dello strumento.
`agentTransfer`	`object (AgentTransfer)` Facoltativo. Evento di trasferimento dell'agente.
`updatedVariables`	`object (Struct format)` Una struct rappresenta le variabili aggiornate nella conversazione, identificate dai nomi delle variabili.
`defaultVariables`	`object (Struct format)` Una struct rappresenta le variabili predefinite all'inizio della conversazione, identificate dai nomi delle variabili.

Timestamp

Rappresentazione JSON
{ "seconds": string, "nanos": integer }

Campi

Campi
`seconds`	`string (int64 format)` Rappresenta i secondi di tempo UTC a partire dall'epoca Unix 1970-01-01T00:00:00Z. Deve essere compreso tra -62135596800 e 253402300799 inclusi (corrispondenti a 0001-01-01T00:00:00Z e 9999-12-31T23:59:59Z).
`nanos`	`integer` Frazioni di secondo non negative con risoluzione in nanosecondi. Questo campo è la parte in nanosecondi della durata, non un'alternativa ai secondi. I valori negativi dei secondi con frazioni devono comunque avere valori non negativi dei nanosecondi che vengono conteggiati in avanti nel tempo. Deve essere compreso tra 0 e 999.999.999 inclusi.

seconds

string (int64 format)

Rappresenta i secondi di tempo UTC a partire dall'epoca Unix 1970-01-01T00:00:00Z. Deve essere compreso tra -62135596800 e 253402300799 inclusi (corrispondenti a 0001-01-01T00:00:00Z e 9999-12-31T23:59:59Z).

nanos

integer

Frazioni di secondo non negative con risoluzione in nanosecondi. Questo campo è la parte in nanosecondi della durata, non un'alternativa ai secondi. I valori negativi dei secondi con frazioni devono comunque avere valori non negativi dei nanosecondi che vengono conteggiati in avanti nel tempo. Deve essere compreso tra 0 e 999.999.999 inclusi.

Intervallo

Rappresentazione JSON
{ "name": string, "startTime": string, "endTime": string, "duration": string, "attributes": { object }, "childSpans": [ { object (`Span`) } ] }

Campi
`name`	`string` Solo output. Il nome dello span.
`startTime`	`string (Timestamp format)` Solo output. L'ora di inizio dell'intervallo. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`endTime`	`string (Timestamp format)` Solo output. L'ora di fine dell'intervallo. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`duration`	`string (Duration format)` Solo output. La durata dell'intervallo. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "`s`". Esempio: `"3.5s"`.
`attributes`	`object (Struct format)` Solo output. Attributi chiave-valore associati allo span.
`childSpans[]`	`object (Span)` Solo output. Gli intervalli secondari nidificati in questo intervallo.

Durata

Rappresentazione JSON
{ "seconds": string, "nanos": integer }

Campi

Campi
`seconds`	`string (int64 format)` Secondi firmati dell'intervallo di tempo. Deve essere compreso tra -315.576.000.000 e +315.576.000.000 inclusi. Nota: questi limiti vengono calcolati in base a: 60 sec/min * 60 min/ora * 24 ore/giorno * 365,25 giorni/anno * 10.000 anni
`nanos`	`integer` Frazioni di secondo con segno con risoluzione in nanosecondi dell'intervallo di tempo. Le durate inferiori a un secondo sono rappresentate con un campo `seconds` pari a 0 e un campo `nanos` positivo o negativo. Per durate di un secondo o più, un valore diverso da zero per il campo `nanos` deve avere lo stesso segno del campo `seconds`. Deve essere compreso tra -999.999.999 e +999.999.999 inclusi.

seconds

string (int64 format)

Secondi firmati dell'intervallo di tempo. Deve essere compreso tra -315.576.000.000 e +315.576.000.000 inclusi. Nota: questi limiti vengono calcolati in base a: 60 sec/min * 60 min/ora * 24 ore/giorno * 365,25 giorni/anno * 10.000 anni

nanos

integer

Frazioni di secondo con segno con risoluzione in nanosecondi dell'intervallo di tempo. Le durate inferiori a un secondo sono rappresentate con un campo seconds pari a 0 e un campo nanos positivo o negativo. Per durate di un secondo o più, un valore diverso da zero per il campo nanos deve avere lo stesso segno del campo seconds. Deve essere compreso tra -999.999.999 e +999.999.999 inclusi.

Scenario

Rappresentazione JSON

Rappresentazione JSON
{ "task": string, "userFacts": [ { object (`UserFact`) } ], "maxTurns": integer, "rubrics": [ string ], "scenarioExpectations": [ { object (`ScenarioExpectation`) } ], "variableOverrides": { object }, "taskCompletionBehavior": enum (`TaskCompletionBehavior`), "userGoalBehavior": enum (`UserGoalBehavior`), "evaluationExpectations": [ string ] }

{
  "task": string,
  "userFacts": [
    {
      object (UserFact)
    }
  ],
  "maxTurns": integer,
  "rubrics": [
    string
  ],
  "scenarioExpectations": [
    {
      object (ScenarioExpectation)
    }
  ],
  "variableOverrides": {
    object
  },
  "taskCompletionBehavior": enum (TaskCompletionBehavior),
  "userGoalBehavior": enum (UserGoalBehavior),
  "evaluationExpectations": [
    string
  ]
}

Campi
`task`	`string` Obbligatorio. L'attività da prendere di mira nello scenario.
`userFacts[]`	`object (UserFact)` Facoltativo. I fatti dell'utente da utilizzare nello scenario.
`maxTurns`	`integer` Facoltativo. Il numero massimo di turni da simulare. Se non specificata, la simulazione continuerà fino al completamento dell'attività.
`rubrics[]`	`string` Obbligatorio. I criteri di valutazione in base ai quali valutare lo scenario.
`scenarioExpectations[]`	`object (ScenarioExpectation)` Obbligatorio. ScenarioExpectations per valutare la conversazione prodotta dalla simulazione dell'utente.
`variableOverrides`	`object (Struct format)` Facoltativo. Variabili / parametri di sessione come contesto per la sessione, con chiave in base ai nomi delle variabili. I membri di questa struttura sostituiranno tutti i valori predefiniti impostati dal sistema. Tieni presente che questi sono diversi dai fatti dell'utente, ovvero i fatti noti all'utente. Le variabili sono parametri noti all'agente, ad esempio l'MDN (numero di telefono) trasmesso dal sistema di telefonia.
`taskCompletionBehavior (deprecated)`	`enum (TaskCompletionBehavior)` Questo elemento è deprecato. Facoltativo. Deprecato. Utilizza invece user_goal_behavior.
`userGoalBehavior`	`enum (UserGoalBehavior)` Facoltativo. Il comportamento previsto dell'obiettivo utente.
`evaluationExpectations[]`	`string` Facoltativo. Le aspettative di valutazione in base alle quali valutare la conversazione prodotta dalla simulazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationExpectations/{evaluationExpectation}`

UserFact

Rappresentazione JSON
{ "name": string, "value": string }

Campi

name

string

Obbligatorio. Il nome del fatto relativo all'utente.

value

string

Obbligatorio. Il valore del fatto utente.

ScenarioExpectation

Rappresentazione JSON

{

  // Union field expectation can be only one of the following:
  "toolExpectation": {
    object (ToolExpectation)
  },
  "agentResponse": {
    object (Message)
  }
  // End of list of possible types for union field expectation.
}

Campi

Campo unione expectation. L'aspettativa di valutare la conversazione prodotta dalla simulazione. expectation può essere solo uno dei seguenti tipi:

toolExpectation

object (ToolExpectation)

Facoltativo. La coppia di chiamata allo strumento e risposta da valutare.

agentResponse

object (Message)

Facoltativo. La risposta dell'agente da valutare.

ToolExpectation

Rappresentazione JSON
{ "expectedToolCall": { object (`ToolCall`) }, "mockToolResponse": { object (`ToolResponse`) } }

Campi

expectedToolCall

object (ToolCall)

Obbligatorio. La chiamata allo strumento prevista, con i parametri di interesse specificati. Eventuali parametri non specificati verranno inventati dal LLM.

mockToolResponse

object (ToolResponse)

Obbligatorio. La risposta dello strumento alla simulazione, con i parametri di interesse specificati. Eventuali parametri non specificati verranno inventati dal LLM.

AggregatedMetrics

Rappresentazione JSON
{ "metricsByAppVersion": [ { object (`MetricsByAppVersion`) } ] }

Campi

metricsByAppVersion[]

object (MetricsByAppVersion)

Solo output. Metriche aggregate, raggruppate per ID versione dell'app.

MetricsByAppVersion

Rappresentazione JSON

{
  "appVersionId": string,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ],
  "passCount": integer,
  "failCount": integer,
  "metricsByTurn": [
    {
      object (MetricsByTurn)
    }
  ]
}

Campi
`appVersionId`	`string` Solo output. L'ID versione dell'app.
`toolMetrics[]`	`object (ToolMetrics)` Solo output. Metriche per ogni strumento all'interno di questa versione dell'app.
`semanticSimilarityMetrics[]`	`object (SemanticSimilarityMetrics)` Solo output. Metriche per la somiglianza semantica all'interno di questa versione dell'app.
`hallucinationMetrics[]`	`object (HallucinationMetrics)` Solo output. Metriche per le allucinazioni all'interno di questa versione dell'app.
`toolCallLatencyMetrics[]`	`object (ToolCallLatencyMetrics)` Solo output. Metriche per la latenza delle chiamate agli strumenti all'interno di questa versione dell'app.
`turnLatencyMetrics[]`	`object (TurnLatencyMetrics)` Solo output. Metriche per la latenza del turno all'interno di questa versione dell'app.
`passCount`	`integer` Solo output. Il numero di volte in cui la valutazione è stata superata.
`failCount`	`integer` Solo output. Il numero di volte in cui la valutazione non è riuscita.
`metricsByTurn[]`	`object (MetricsByTurn)` Solo output. Metriche aggregate per turno all'interno di questa versione dell'app.

ToolMetrics

Rappresentazione JSON
{ "tool": string, "passCount": integer, "failCount": integer }

Campi

tool

string

Solo output. Il nome dello strumento.

passCount

integer

Solo output. Il numero di volte in cui lo strumento è stato superato.

failCount

integer

Solo output. Il numero di volte in cui lo strumento non ha funzionato.

SemanticSimilarityMetrics

Rappresentazione JSON
{ "score": number }

Campi

score

number

Solo output. Il punteggio medio di similarità semantica (0-4).

HallucinationMetrics

Rappresentazione JSON
{ "score": number }

Campi

score

number

Solo output. Il punteggio medio di allucinazione (da 0 a 1).

ToolCallLatencyMetrics

Rappresentazione JSON
{ "tool": string, "averageLatency": string }

Campi

tool

string

Solo output. Il nome dello strumento.

averageLatency

string (Duration format)

Solo output. La latenza media delle chiamate agli strumenti.

Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "s". Esempio: "3.5s".

TurnLatencyMetrics

Rappresentazione JSON
{ "averageLatency": string }

Campi

averageLatency

string (Duration format)

Solo output. La latenza media dei turni.

Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "s". Esempio: "3.5s".

MetricsByTurn

Rappresentazione JSON

{
  "turnIndex": integer,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ]
}

Campi
`turnIndex`	`integer` Solo output. L'indice del turno (a base 0).
`toolMetrics[]`	`object (ToolMetrics)` Solo output. Metriche per ogni strumento all'interno di questo turno.
`semanticSimilarityMetrics[]`	`object (SemanticSimilarityMetrics)` Solo output. Metriche per la similarità semantica all'interno di questo turno.
`hallucinationMetrics[]`	`object (HallucinationMetrics)` Solo output. Metriche per le allucinazioni in questo turno.
`toolCallLatencyMetrics[]`	`object (ToolCallLatencyMetrics)` Solo output. Metriche per la latenza della chiamata allo strumento all'interno di questo turno.
`turnLatencyMetrics[]`	`object (TurnLatencyMetrics)` Solo output. Metriche per la latenza del turno all'interno di questo turno.

EvaluationResult

Rappresentazione JSON

{
  "name": string,
  "displayName": string,
  "createTime": string,
  "evaluationStatus": enum (Outcome),
  "evaluationRun": string,
  "persona": {
    object (EvaluationPersona)
  },
  "errorInfo": {
    object (EvaluationErrorInfo)
  },
  "error": {
    object (Status)
  },
  "initiatedBy": string,
  "appVersion": string,
  "appVersionDisplayName": string,
  "changelog": string,
  "changelogCreateTime": string,
  "executionState": enum (ExecutionState),
  "evaluationMetricsThresholds": {
    object (EvaluationMetricsThresholds)
  },
  "config": {
    object (EvaluationConfig)
  },
  "goldenRunMethod": enum (GoldenRunMethod),

  // Union field result can be only one of the following:
  "goldenResult": {
    object (GoldenResult)
  },
  "scenarioResult": {
    object (ScenarioResult)
  }
  // End of list of possible types for union field result.
}

Campi
`name`	`string` Identificatore. L'identificatore univoco del risultato della valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluations/{evaluation}/results/{result}`
`displayName`	`string` Obbligatorio. Nome visualizzato del risultato della valutazione. Unico all'interno di una valutazione. Per impostazione predefinita, ha il seguente formato: " risultato - ".
`createTime`	`string (Timestamp format)` Solo output. Timestamp di creazione del risultato della valutazione. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`evaluationStatus`	`enum (Outcome)` Solo output. L'esito della valutazione. Compilato solo se execution_state è COMPLETE.
`evaluationRun`	`string` Solo output. L'esecuzione della valutazione che ha prodotto questo risultato. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationRuns/{evaluationRun}`
`persona`	`object (EvaluationPersona)` Solo output. La persona utilizzata per generare la conversazione per il risultato della valutazione.
`errorInfo`	`object (EvaluationErrorInfo)` Solo output. Informazioni sull'errore per il risultato della valutazione.
`error (deprecated)`	`object (Status)` Questo elemento è deprecato. Solo output. Deprecato: utilizza `error_info`. Errori rilevati durante l'esecuzione.
`initiatedBy`	`string` Solo output. L'utente che ha avviato l'esecuzione della valutazione che ha generato questo risultato.
`appVersion`	`string` Solo output. La versione dell'app utilizzata per generare la conversazione che ha prodotto questo risultato. Formato: `projects/{project}/locations/{location}/apps/{app}/versions/{version}`
`appVersionDisplayName`	`string` Solo output. Il nome visualizzato del `app_version` rispetto al quale è stata eseguita la valutazione.
`changelog`	`string` Solo output. Il log delle modifiche della versione dell'app su cui è stata eseguita la valutazione. Questo campo viene compilato se l'utente esegue la valutazione sull'ultima versione/bozza.
`changelogCreateTime`	`string (Timestamp format)` Solo output. L'ora di creazione del log delle modifiche della versione dell'app su cui è stata eseguita la valutazione. Questo campo viene compilato se l'utente esegue la valutazione sull'ultima versione/bozza. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`executionState`	`enum (ExecutionState)` Solo output. Lo stato di esecuzione del risultato della valutazione.
`evaluationMetricsThresholds`	`object (EvaluationMetricsThresholds)` Solo output. Le soglie di valutazione per il risultato.
`config`	`object (EvaluationConfig)` Solo output. La configurazione utilizzata nell'esecuzione della valutazione che ha generato questo risultato.
`goldenRunMethod`	`enum (GoldenRunMethod)` Solo output. Il metodo utilizzato per eseguire la valutazione golden.
Campo unione `result`. Il risultato della valutazione. Viene compilato solo quando execution_state è COMPLETED. `result` può essere solo uno dei seguenti tipi:
`goldenResult`	`object (GoldenResult)` Solo output. Il risultato di una valutazione di riferimento.
`scenarioResult`	`object (ScenarioResult)` Solo output. Il risultato di una valutazione dello scenario.

GoldenResult

Rappresentazione JSON
{ "turnReplayResults": [ { object (`TurnReplayResult`) } ], "evaluationExpectationResults": [ { object (`EvaluationExpectationResult`) } ] }

Campi

turnReplayResults[]

object (TurnReplayResult)

Solo output. Il risultato dell'esecuzione di ogni turno della conversazione di riferimento.

evaluationExpectationResults[]

object (EvaluationExpectationResult)

Solo output. I risultati delle aspettative di valutazione.

TurnReplayResult

Rappresentazione JSON

{
  "conversation": string,
  "expectationOutcome": [
    {
      object (GoldenExpectationOutcome)
    }
  ],
  "hallucinationResult": {
    object (HallucinationResult)
  },
  "toolInvocationScore": number,
  "turnLatency": string,
  "toolCallLatencies": [
    {
      object (ToolCallLatency)
    }
  ],
  "semanticSimilarityResult": {
    object (SemanticSimilarityResult)
  },
  "overallToolInvocationResult": {
    object (OverallToolInvocationResult)
  },
  "errorInfo": {
    object (EvaluationErrorInfo)
  },
  "spanLatencies": [
    {
      object (SpanLatency)
    }
  ],

  // Union field _tool_ordered_invocation_score can be only one of the following:
  "toolOrderedInvocationScore": number
  // End of list of possible types for union field
  // _tool_ordered_invocation_score.
}

Campi
`conversation`	`string` Solo output. La conversazione generata per questo turno.
`expectationOutcome[]`	`object (GoldenExpectationOutcome)` Solo output. Il risultato di ogni aspettativa.
`hallucinationResult`	`object (HallucinationResult)` Solo output. Il risultato del controllo delle allucinazioni.
`toolInvocationScore (deprecated)`	`number` Questo elemento è deprecato. Solo output. Deprecato. Utilizza OverallToolInvocationResult.
`turnLatency`	`string (Duration format)` Solo output. Durata del turno. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "`s`". Esempio: `"3.5s"`.
`toolCallLatencies[]`	`object (ToolCallLatency)` Solo output. La latenza di ogni chiamata allo strumento nel turno.
`semanticSimilarityResult`	`object (SemanticSimilarityResult)` Solo output. Il risultato del controllo della somiglianza semantica.
`overallToolInvocationResult`	`object (OverallToolInvocationResult)` Solo output. Il risultato del controllo complessivo dell'invocazione dello strumento.
`errorInfo`	`object (EvaluationErrorInfo)` Solo output. Informazioni sull'errore che si è verificato durante questo turno.
`spanLatencies[]`	`object (SpanLatency)` Solo output. La latenza degli span nel turno.
Campo unione `_tool_ordered_invocation_score`. `_tool_ordered_invocation_score` può essere solo uno dei seguenti tipi:
`toolOrderedInvocationScore`	`number` Solo output. Il punteggio complessivo di chiamata dello strumento ordinato per questo turno. Indica la percentuale complessiva di strumenti della svolta prevista che sono stati effettivamente richiamati nell'ordine previsto.

GoldenExpectationOutcome

Rappresentazione JSON

{
  "expectation": {
    object (GoldenExpectation)
  },
  "outcome": enum (Outcome),
  "semanticSimilarityResult": {
    object (SemanticSimilarityResult)
  },
  "toolInvocationResult": {
    object (ToolInvocationResult)
  },

  // Union field result can be only one of the following:
  "observedToolCall": {
    object (ToolCall)
  },
  "observedToolResponse": {
    object (ToolResponse)
  },
  "observedAgentResponse": {
    object (Message)
  },
  "observedAgentTransfer": {
    object (AgentTransfer)
  }
  // End of list of possible types for union field result.
}

Campi
`expectation`	`object (GoldenExpectation)` Solo output. L'aspettativa che è stata valutata.
`outcome`	`enum (Outcome)` Solo output. Il risultato dell'aspettativa.
`semanticSimilarityResult (deprecated)`	`object (SemanticSimilarityResult)` Questo elemento è deprecato. Solo output. Il risultato del controllo della somiglianza semantica.
`toolInvocationResult`	`object (ToolInvocationResult)` Solo output. Il risultato del controllo di chiamata dello strumento.
Campo unione `result`. Il risultato dell'aspettativa. `result` può essere solo uno dei seguenti tipi:
`observedToolCall`	`object (ToolCall)` Solo output. Il risultato dell'aspettativa di chiamata allo strumento.
`observedToolResponse`	`object (ToolResponse)` Solo output. Il risultato dell'aspettativa di risposta dello strumento.
`observedAgentResponse`	`object (Message)` Solo output. Il risultato dell'aspettativa di risposta dell'agente.
`observedAgentTransfer`	`object (AgentTransfer)` Solo output. Il risultato dell'aspettativa di trasferimento dell'agente.

SemanticSimilarityResult

Rappresentazione JSON

{
  "label": string,
  "explanation": string,
  "outcome": enum (Outcome),

  // Union field _score can be only one of the following:
  "score": integer
  // End of list of possible types for union field _score.
}

Campi
`label`	`string` Solo output. L'etichetta associata a ogni punteggio. Punteggio 4: completamente coerente Punteggio 3: per lo più coerente Punteggio 2: parzialmente coerente (omissioni minori) Punteggio 1: in gran parte incoerente (omissioni maggiori) Punteggio 0: completamente incoerente / contraddittorio
`explanation`	`string` Solo output. La spiegazione del punteggio di similarità semantica.
`outcome`	`enum (Outcome)` Solo output. Il risultato del controllo della somiglianza semantica. Questo valore viene determinato confrontando il punteggio con semantic_similarity_success_threshold. Se il punteggio è uguale o superiore alla soglia, il risultato sarà PASS. In caso contrario, il risultato sarà FAIL.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`integer` Solo output. Il punteggio di similarità semantica. Può essere 0, 1, 2, 3 o 4.

ToolInvocationResult

Rappresentazione JSON

{
  "outcome": enum (Outcome),
  "explanation": string,

  // Union field _parameter_correctness_score can be only one of the following:
  "parameterCorrectnessScore": number
  // End of list of possible types for union field _parameter_correctness_score.
}

Campi
`outcome`	`enum (Outcome)` Solo output. Il risultato del controllo di chiamata dello strumento. Questo valore viene determinato confrontando il punteggio di correttezza dei parametri con la soglia. Se il punteggio è uguale o superiore alla soglia, il risultato sarà PASS. In caso contrario, il risultato sarà FAIL.
`explanation`	`string` Solo output. Una spiegazione in formato libero del risultato dell'invocazione dello strumento.
Campo unione `_parameter_correctness_score`. `_parameter_correctness_score` può essere solo uno dei seguenti tipi:
`parameterCorrectnessScore`	`number` Solo output. Il punteggio di correttezza del parametro di chiamata dello strumento. Indica la percentuale di parametri della chiamata allo strumento prevista che erano presenti anche nella chiamata allo strumento effettiva.

HallucinationResult

Rappresentazione JSON
{ "label": string, "explanation": string, // Union field `_score` can be only one of the following: "score": integer // End of list of possible types for union field `_score`. }

Campi
`label`	`string` Solo output. L'etichetta associata a ogni punteggio. Punteggio 1: Punteggio giustificato Punteggio 0: Punteggio non giustificato Punteggio -1: Nessuna rivendicazione da valutare
`explanation`	`string` Solo output. La spiegazione del punteggio di allucinazione.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`integer` Solo output. Il punteggio di allucinazione. Può essere -1, 0, 1.

ToolCallLatency

Rappresentazione JSON
{ "tool": string, "displayName": string, "startTime": string, "endTime": string, "executionLatency": string }

Campi
`tool`	`string` Solo output. Il nome dello strumento eseguito. Formato: `projects/{project}/locations/{location}/apps/{app}/tools/{tool}`.
`displayName`	`string` Solo output. Il nome visualizzato dello strumento.
`startTime`	`string (Timestamp format)` Solo output. L'ora di inizio dell'esecuzione della chiamata allo strumento. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`endTime`	`string (Timestamp format)` Solo output. L'ora di fine dell'esecuzione della chiamata allo strumento. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`executionLatency`	`string (Duration format)` Solo output. La latenza dell'esecuzione della chiamata di funzione. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "`s`". Esempio: `"3.5s"`.

OverallToolInvocationResult

Rappresentazione JSON

{
  "outcome": enum (Outcome),

  // Union field _tool_invocation_score can be only one of the following:
  "toolInvocationScore": number
  // End of list of possible types for union field _tool_invocation_score.
}

Campi

outcome

enum (Outcome)

Solo output. Il risultato del controllo di chiamata dello strumento. Questo valore viene determinato confrontando tool_invocation_score con overall_tool_invocation_correctness_threshold. Se il punteggio è uguale o superiore alla soglia, il risultato sarà PASS. In caso contrario, il risultato sarà FAIL.

Campo unione _tool_invocation_score.

_tool_invocation_score può essere solo uno dei seguenti tipi:

toolInvocationScore

number

Il punteggio complessivo di invocazione dello strumento per questo turno. Indica la percentuale complessiva di strumenti dell'azione prevista che sono stati effettivamente richiamati.

EvaluationErrorInfo

Rappresentazione JSON
{ "errorType": enum (`ErrorType`), "errorMessage": string, "sessionId": string }

Campi

errorType

enum (ErrorType)

Solo output. Il tipo di errore.

errorMessage

string

Solo output. Il messaggio di errore.

sessionId

string

Solo output. L'ID sessione della conversazione che ha causato l'errore.

SpanLatency

Rappresentazione JSON

{
  "type": enum (Type),
  "displayName": string,
  "startTime": string,
  "endTime": string,
  "executionLatency": string,

  // Union field identifier can be only one of the following:
  "resource": string,
  "toolset": {
    object (ToolsetTool)
  },
  "model": string,
  "callback": string
  // End of list of possible types for union field identifier.
}

Campi
`type`	`enum (Type)` Solo output. Il tipo di intervallo.
`displayName`	`string` Solo output. Il nome visualizzato dello span. Valido per gli intervalli di strumenti e sistemi di protezione.
`startTime`	`string (Timestamp format)` Solo output. L'ora di inizio dell'intervallo. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`endTime`	`string (Timestamp format)` Solo output. L'ora di fine dell'intervallo. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`executionLatency`	`string (Duration format)` Solo output. La latenza dello span. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "`s`". Esempio: `"3.5s"`.
Campo unione `identifier`. L'identificatore dell'elemento specifico in base al suo tipo. `identifier` può essere solo uno dei seguenti tipi:
`resource`	`string` Solo output. Il nome della risorsa degli intervalli di guardrail o strumenti.
`toolset`	`object (ToolsetTool)` Solo output. L'identificatore dello strumento del toolset.
`model`	`string` Solo output. Il nome dello span LLM.
`callback`	`string` Solo output. Il nome dello span di callback dell'utente.

EvaluationExpectationResult

Rappresentazione JSON
{ "evaluationExpectation": string, "prompt": string, "outcome": enum (`Outcome`), "explanation": string }

Campi
`evaluationExpectation`	`string` Solo output. L'aspettativa di valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationExpectations/{evaluation_expectation}`
`prompt`	`string` Solo output. Il prompt utilizzato per la valutazione.
`outcome`	`enum (Outcome)` Solo output. Il risultato dell'aspettativa di valutazione.
`explanation`	`string` Solo output. La spiegazione del risultato.

ScenarioResult

Rappresentazione JSON

{
  "conversation": string,
  "task": string,
  "userFacts": [
    {
      object (UserFact)
    }
  ],
  "expectationOutcomes": [
    {
      object (ScenarioExpectationOutcome)
    }
  ],
  "rubricOutcomes": [
    {
      object (ScenarioRubricOutcome)
    }
  ],
  "hallucinationResult": [
    {
      object (HallucinationResult)
    }
  ],
  "taskCompletionResult": {
    object (TaskCompletionResult)
  },
  "toolCallLatencies": [
    {
      object (ToolCallLatency)
    }
  ],
  "userGoalSatisfactionResult": {
    object (UserGoalSatisfactionResult)
  },
  "spanLatencies": [
    {
      object (SpanLatency)
    }
  ],
  "evaluationExpectationResults": [
    {
      object (EvaluationExpectationResult)
    }
  ],

  // Union field _all_expectations_satisfied can be only one of the following:
  "allExpectationsSatisfied": boolean
  // End of list of possible types for union field _all_expectations_satisfied.

  // Union field _task_completed can be only one of the following:
  "taskCompleted": boolean
  // End of list of possible types for union field _task_completed.
}

Campi

conversation

string

Solo output. La conversazione generata nello scenario.

task

string

Solo output. L'attività utilizzata durante l'esecuzione dello scenario per questo risultato.

userFacts[]

object (UserFact)

Solo output. I fatti sull'utente utilizzati dallo scenario per questo risultato.

expectationOutcomes[]

object (ScenarioExpectationOutcome)

Solo output. Il risultato di ogni aspettativa.

rubricOutcomes[]

object (ScenarioRubricOutcome)

Solo output. Il risultato della griglia.

hallucinationResult[]

object (HallucinationResult)

Solo output. Il risultato del controllo delle allucinazioni. Verrà visualizzato un risultato di allucinazione per ogni turno della conversazione.

taskCompletionResult
(deprecated)

object (TaskCompletionResult)

Solo output. Il risultato del controllo del completamento dell'attività.

toolCallLatencies[]

object (ToolCallLatency)

Solo output. La latenza di ogni esecuzione della chiamata allo strumento nella conversazione.

userGoalSatisfactionResult

object (UserGoalSatisfactionResult)

Solo output. Il risultato del controllo della soddisfazione dell'obiettivo dell'utente.

spanLatencies[]

object (SpanLatency)

Solo output. La latenza degli intervalli nella conversazione.

evaluationExpectationResults[]

object (EvaluationExpectationResult)

Solo output. I risultati delle aspettative di valutazione.

Campo unione _all_expectations_satisfied.

_all_expectations_satisfied può essere solo uno dei seguenti tipi:

allExpectationsSatisfied

boolean

Solo output. Indica se tutte le aspettative sono state soddisfatte per questo turno.

Campo unione _task_completed.

_task_completed può essere solo uno dei seguenti tipi:

taskCompleted

boolean

Solo output. Se l'attività è stata completata per questo turno. Si tratta di un insieme di tutte le aspettative soddisfatte, senza allucinazioni e con la soddisfazione dell'obiettivo dell'utente.

ScenarioExpectationOutcome

Rappresentazione JSON

{
  "expectation": {
    object (ScenarioExpectation)
  },
  "outcome": enum (Outcome),

  // Union field result can be only one of the following:
  "observedToolCall": {
    object (ObservedToolCall)
  },
  "observedAgentResponse": {
    object (Message)
  }
  // End of list of possible types for union field result.
}

Campi
`expectation`	`object (ScenarioExpectation)` Solo output. L'aspettativa che è stata valutata.
`outcome`	`enum (Outcome)` Solo output. Il risultato di ScenarioExpectation.
Campo unione `result`. Il risultato dell'aspettativa. `result` può essere solo uno dei seguenti tipi:
`observedToolCall`	`object (ObservedToolCall)` Solo output. La chiamata allo strumento osservata.
`observedAgentResponse`	`object (Message)` Solo output. La risposta dell'agente osservata.

ObservedToolCall

Rappresentazione JSON
{ "toolCall": { object (`ToolCall`) }, "toolResponse": { object (`ToolResponse`) } }

Campi

toolCall

object (ToolCall)

Solo output. La chiamata allo strumento osservata.

toolResponse

object (ToolResponse)

Solo output. La risposta dello strumento osservata.

ScenarioRubricOutcome

Rappresentazione JSON
{ "rubric": string, "scoreExplanation": string, // Union field `_score` can be only one of the following: "score": number // End of list of possible types for union field `_score`. }

Campi
`rubric`	`string` Solo output. La rubrica utilizzata per valutare la conversazione.
`scoreExplanation`	`string` Solo output. La risposta del valutatore alla rubrica.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`number` Solo output. Il punteggio della conversazione rispetto alla griglia.

TaskCompletionResult

Rappresentazione JSON
{ "label": string, "explanation": string, // Union field `_score` can be only one of the following: "score": integer // End of list of possible types for union field `_score`. }

Campi
`label`	`string` Solo output. L'etichetta associata a ogni punteggio. Punteggio 1: attività completata. Punteggio 0: attività non completata. Punteggio -1: obiettivo utente non definito.
`explanation`	`string` Solo output. La spiegazione del punteggio di completamento dell'attività.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`integer` Solo output. Il punteggio di completamento dell'attività. Può essere -1, 0, 1

UserGoalSatisfactionResult

Rappresentazione JSON
{ "label": string, "explanation": string, // Union field `_score` can be only one of the following: "score": integer // End of list of possible types for union field `_score`. }

Campi
`label`	`string` Solo output. L'etichetta associata a ogni punteggio. Punteggio 1: attività utente soddisfatta Punteggio 0: attività utente non soddisfatta Punteggio -1: attività utente non specificata
`explanation`	`string` Solo output. La spiegazione del punteggio di soddisfazione dell'attività dell'utente.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`integer` Solo output. Il punteggio di soddisfazione dell'attività dell'utente. Può essere -1, 0, 1.

EvaluationPersona

Rappresentazione JSON
{ "name": string, "description": string, "displayName": string, "personality": string, "speechConfig": { object (`SpeechConfig`) } }

Campi
`name`	`string` Obbligatorio. L'identificatore univoco della persona. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationPersonas/{evaluationPersona}`
`description`	`string` Facoltativo. La descrizione della persona.
`displayName`	`string` Obbligatorio. Il nome visualizzato della persona. Unico all'interno di un'app.
`personality`	`string` Obbligatorio. Un'istruzione per l'agente su come comportarsi nella valutazione.
`speechConfig`	`object (SpeechConfig)` Facoltativo. Configurazione del suono della persona (impostazioni TTS).

SpeechConfig

Rappresentazione JSON
{ "speakingRate": number, "environment": enum (`BackgroundEnvironment`), "voiceId": string }

Campi

speakingRate

number

Facoltativo. La velocità del parlato. 1,0 è il valore normale. I valori più bassi sono più lenti (ad es. 0,8), più alto è il valore, più veloce è la risposta (ad es. 1.5). Utile per testare il modo in cui l'agente gestisce le persone che parlano velocemente.

environment

enum (BackgroundEnvironment)

Facoltativo. L'ambiente audio simulato.

voiceId

string

Facoltativo. L'identificatore/l'accento della voce specifico da utilizzare. Esempio: "en-US-Wavenet-D" o "en-GB-Standard-A"

Stato

Rappresentazione JSON
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] }

Campi

code

integer

Il codice di stato, che deve essere un valore enum di google.rpc.Code.

message

string

Un messaggio di errore rivolto agli sviluppatori, che deve essere in inglese. Qualsiasi messaggio di errore rivolto agli utenti deve essere localizzato e inviato nel campo google.rpc.Status.details o localizzato dal client.

details[]

object

Un elenco di messaggi contenenti i dettagli dell'errore. Esiste un insieme comune di tipi di messaggi da utilizzare per le API.

Un oggetto contenente campi di tipo arbitrario. Un campo aggiuntivo "@type" contenente un URI che identifica il tipo. Esempio: { "id": 1234, "@type": "types.example.com/standard/id" }.

Qualsiasi

Rappresentazione JSON
{ "typeUrl": string, "value": string }

Campi

typeUrl

string

Identifica il tipo di messaggio Protobuf serializzato con un riferimento URI costituito da un prefisso che termina con una barra e il nome del tipo completo.

Esempio: type.googleapis.com/google.protobuf.StringValue

Questa stringa deve contenere almeno un carattere / e il contenuto dopo l'ultimo / deve essere il nome completo del tipo in forma canonica, senza un punto iniziale. Non scrivere uno schema su questi riferimenti URI in modo che i client non tentino di contattarli.

Il prefisso è arbitrario e le implementazioni di Protobuf devono semplicemente rimuovere tutto fino all'ultimo / incluso per identificare il tipo. type.googleapis.com/ è un prefisso predefinito comune richiesto da alcune implementazioni legacy. Questo prefisso non indica l'origine del tipo e non è previsto che gli URI che lo contengono rispondano a richieste.

Tutte le stringhe URL di tipo devono essere riferimenti URI validi con l'ulteriore limitazione (per il formato di testo) che il contenuto del riferimento deve essere costituito solo da caratteri alfanumerici, sequenze di escape codificate in percentuale e caratteri del seguente insieme (esclusi i backtick esterni): /-.~_!$&()*+,;=. Nonostante consentiamo le codifiche in percentuale, le implementazioni non devono eseguirne l'escape per evitare confusione con i parser esistenti. Ad esempio, type.googleapis.com%2FFoo deve essere rifiutato.

Nella progettazione originale di Any, è stata presa in considerazione la possibilità di avviare un servizio di risoluzione dei tipi in questi URL di tipo, ma Protobuf non ne ha mai implementato uno e considera il contatto con questi URL problematico e un potenziale problema di sicurezza. Non tentare di contattare gli URL dei tipi.

value

string (bytes format)

Contiene una serializzazione Protobuf del tipo descritto da type_url.

Una stringa con codifica in base64.

EvaluationMetricsThresholds

Rappresentazione JSON

{
  "goldenEvaluationMetricsThresholds": {
    object (GoldenEvaluationMetricsThresholds)
  },
  "hallucinationMetricBehavior": enum (HallucinationMetricBehavior),
  "goldenHallucinationMetricBehavior": enum (HallucinationMetricBehavior),
  "scenarioHallucinationMetricBehavior": enum (HallucinationMetricBehavior)
}

Campi
`goldenEvaluationMetricsThresholds`	`object (GoldenEvaluationMetricsThresholds)` Facoltativo. Le soglie delle metriche di valutazione secondo regole d'oro.
`hallucinationMetricBehavior (deprecated)`	`enum (HallucinationMetricBehavior)` Questo elemento è deprecato. Facoltativo. Deprecato: utilizza `golden_hallucination_metric_behavior`. Il comportamento della metrica di allucinazione viene attualmente utilizzato per le valutazioni dorate.
`goldenHallucinationMetricBehavior`	`enum (HallucinationMetricBehavior)` Facoltativo. Il comportamento della metrica delle allucinazioni per le valutazioni di riferimento.
`scenarioHallucinationMetricBehavior`	`enum (HallucinationMetricBehavior)` Facoltativo. Il comportamento della metrica di allucinazione per le valutazioni degli scenari.

GoldenEvaluationMetricsThresholds

Rappresentazione JSON

{
  "turnLevelMetricsThresholds": {
    object (TurnLevelMetricsThresholds)
  },
  "expectationLevelMetricsThresholds": {
    object (ExpectationLevelMetricsThresholds)
  },
  "toolMatchingSettings": {
    object (ToolMatchingSettings)
  }
}

Campi

turnLevelMetricsThresholds

object (TurnLevelMetricsThresholds)

Facoltativo. Le soglie delle metriche a livello di turno.

expectationLevelMetricsThresholds

object (ExpectationLevelMetricsThresholds)

Facoltativo. Le soglie delle metriche del livello di aspettativa.

toolMatchingSettings

object (ToolMatchingSettings)

Facoltativo. Le impostazioni di corrispondenza dello strumento. Una chiamata allo strumento aggiuntiva è una chiamata allo strumento presente nell'esecuzione, ma che non corrisponde ad alcuna chiamata allo strumento nell'aspettativa di riferimento.

TurnLevelMetricsThresholds

Rappresentazione JSON

{
  "semanticSimilarityChannel": enum (SemanticSimilarityChannel),

  // Union field _semantic_similarity_success_threshold can be only one of the
  // following:
  "semanticSimilaritySuccessThreshold": integer
  // End of list of possible types for union field
  // _semantic_similarity_success_threshold.

  // Union field _overall_tool_invocation_correctness_threshold can be only one
  // of the following:
  "overallToolInvocationCorrectnessThreshold": number
  // End of list of possible types for union field
  // _overall_tool_invocation_correctness_threshold.
}

Campi

semanticSimilarityChannel

enum (SemanticSimilarityChannel)

Facoltativo. Il canale di similarità semantica da utilizzare per la valutazione.

Campo unione _semantic_similarity_success_threshold.

_semantic_similarity_success_threshold può essere solo uno dei seguenti tipi:

semanticSimilaritySuccessThreshold

integer

Facoltativo. La soglia di successo per la somiglianza semantica. Deve essere un numero intero compreso tra 0 e 4. Il valore predefinito è >= 3.

Campo unione _overall_tool_invocation_correctness_threshold.

_overall_tool_invocation_correctness_threshold può essere solo uno dei seguenti tipi:

overallToolInvocationCorrectnessThreshold

number

Facoltativo. La soglia di successo per la correttezza complessiva dell'invocazione dello strumento. Deve essere un numero in virgola mobile compreso tra 0 e 1. Il valore predefinito è 1.0.

ExpectationLevelMetricsThresholds

Rappresentazione JSON

{

  // Union field _tool_invocation_parameter_correctness_threshold can be only one
  // of the following:
  "toolInvocationParameterCorrectnessThreshold": number
  // End of list of possible types for union field
  // _tool_invocation_parameter_correctness_threshold.
}

Campi

Campo unione _tool_invocation_parameter_correctness_threshold.

_tool_invocation_parameter_correctness_threshold può essere solo uno dei seguenti tipi:

toolInvocationParameterCorrectnessThreshold

number

Facoltativo. La soglia di successo per la correttezza dei parametri di chiamata dei singoli strumenti. Deve essere un numero in virgola mobile compreso tra 0 e 1. Il valore predefinito è 1.0.

ToolMatchingSettings

Rappresentazione JSON
{ "extraToolCallBehavior": enum (`ExtraToolCallBehavior`) }

Campi

extraToolCallBehavior

enum (ExtraToolCallBehavior)

Facoltativo. Comportamento per le chiamate di strumenti aggiuntivi. Il valore predefinito è FAIL.

EvaluationConfig

Rappresentazione JSON

{
  "inputAudioConfig": {
    object (InputAudioConfig)
  },
  "outputAudioConfig": {
    object (OutputAudioConfig)
  },
  "evaluationChannel": enum (EvaluationChannel),
  "toolCallBehaviour": enum (EvaluationToolCallBehaviour)
}

Campi
`inputAudioConfig (deprecated)`	`object (InputAudioConfig)` Questo elemento è deprecato. Facoltativo. Configurazione per l'elaborazione dell'audio di input.
`outputAudioConfig (deprecated)`	`object (OutputAudioConfig)` Questo elemento è deprecato. Facoltativo. Configurazione per la generazione dell'audio di output.
`evaluationChannel`	`enum (EvaluationChannel)` Facoltativo. Il canale da valutare.
`toolCallBehaviour`	`enum (EvaluationToolCallBehaviour)` Facoltativo. Specifica se la valutazione deve utilizzare chiamate di strumenti reali o fittizi.

InputAudioConfig

Rappresentazione JSON
{ "audioEncoding": enum (`AudioEncoding`), "sampleRateHertz": integer, "noiseSuppressionLevel": string }

Campi

audioEncoding

enum (AudioEncoding)

Obbligatorio. La codifica dei dati audio di input.

sampleRateHertz

integer

Obbligatorio. La frequenza di campionamento (in hertz) dei dati audio di input.

noiseSuppressionLevel

string

Facoltativo. Indica se attivare la soppressione del rumore nell'audio di input. I valori disponibili sono "low", "moderate", "high", "very_high".

OutputAudioConfig

Rappresentazione JSON
{ "audioEncoding": enum (`AudioEncoding`), "sampleRateHertz": integer }

Campi

audioEncoding

enum (AudioEncoding)

Obbligatorio. La codifica dei dati audio di output.

sampleRateHertz

integer

Obbligatorio. La frequenza di campionamento (in hertz) dei dati audio di output.

Schema di output

Una valutazione rappresenta tutte le informazioni necessarie per simulare e valutare un agente.

Valutazione

Rappresentazione JSON

{
  "name": string,
  "displayName": string,
  "description": string,
  "tags": [
    string
  ],
  "evaluationDatasets": [
    string
  ],
  "createTime": string,
  "createdBy": string,
  "updateTime": string,
  "lastUpdatedBy": string,
  "evaluationRuns": [
    string
  ],
  "etag": string,
  "aggregatedMetrics": {
    object (AggregatedMetrics)
  },
  "lastCompletedResult": {
    object (EvaluationResult)
  },
  "invalid": boolean,
  "lastTenResults": [
    {
      object (EvaluationResult)
    }
  ],

  // Union field inputs can be only one of the following:
  "golden": {
    object (Golden)
  },
  "scenario": {
    object (Scenario)
  }
  // End of list of possible types for union field inputs.
}

Campi
`name`	`string` Identificatore. L'identificatore univoco di questa valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluations/{evaluation}`
`displayName`	`string` Obbligatorio. Nome visualizzato definito dall'utente della valutazione. Unico all'interno di un'app.
`description`	`string` Facoltativo. Descrizione definita dall'utente della valutazione.
`tags[]`	`string` Facoltativo. Tag definiti dall'utente per classificare la valutazione.
`evaluationDatasets[]`	`string` Solo output. Elenco dei set di dati di valutazione a cui appartiene la valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationDatasets/{evaluationDataset}`
`createTime`	`string (Timestamp format)` Solo output. Timestamp di creazione della valutazione. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`createdBy`	`string` Solo output. L'utente che ha creato la valutazione.
`updateTime`	`string (Timestamp format)` Solo output. Timestamp dell'ultimo aggiornamento della valutazione. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`lastUpdatedBy`	`string` Solo output. L'utente che ha aggiornato per ultimo la valutazione.
`evaluationRuns[]`	`string` Solo output. Le EvaluationRuns a cui è associata questa valutazione.
`etag`	`string` Solo output. Etag utilizzato per garantire che l'oggetto non sia stato modificato durante un'operazione di lettura, modifica e scrittura. Se l'etag è vuoto, l'aggiornamento sovrascriverà eventuali modifiche simultanee.
`aggregatedMetrics`	`object (AggregatedMetrics)` Solo output. Le metriche aggregate per questa valutazione in tutte le esecuzioni.
`lastCompletedResult`	`object (EvaluationResult)` Solo output. Il risultato dell'ultima valutazione.
`invalid`	`boolean` Solo output. Indica se la valutazione non è valida. Ciò può accadere se una valutazione fa riferimento a uno strumento, a un insieme di strumenti o a un agente che è stato eliminato.
`lastTenResults[]`	`object (EvaluationResult)` Solo output. Gli ultimi 10 risultati della valutazione. Questo campo viene compilato solo se include_last_ten_results è impostato su true in ListEvaluationsRequest o GetEvaluationRequest.
Campo unione `inputs`. Gli input per la valutazione `inputs` possono essere solo uno dei seguenti:
`golden`	`object (Golden)` Facoltativo. I passaggi dorati da valutare.
`scenario`	`object (Scenario)` Facoltativo. La configurazione di uno scenario.

Golden

Rappresentazione JSON
{ "turns": [ { object (`GoldenTurn`) } ], "evaluationExpectations": [ string ] }

Campi

turns[]

object (GoldenTurn)

Obbligatorio. Le svolte d'oro necessarie per riprodurre una conversazione d'oro.

evaluationExpectations[]

string

GoldenTurn

Rappresentazione JSON
{ "steps": [ { object (`Step`) } ], "rootSpan": { object (`Span`) } }

Campi

steps[]

object (Step)

Obbligatorio. I passaggi necessari per riprodurre una conversazione di riferimento.

rootSpan

object (Span)

Facoltativo. Lo span radice della svolta d'oro per l'elaborazione e la manutenzione delle informazioni audio.

Passaggio

Rappresentazione JSON

{

  // Union field step can be only one of the following:
  "userInput": {
    object (SessionInput)
  },
  "agentTransfer": {
    object (AgentTransfer)
  },
  "expectation": {
    object (GoldenExpectation)
  }
  // End of list of possible types for union field step.
}

Campi
Campo unione `step`. Il passaggio da eseguire. `step` può essere solo uno dei seguenti tipi:
`userInput`	`object (SessionInput)` Facoltativo. Input utente per la conversazione.
`agentTransfer`	`object (AgentTransfer)` Facoltativo. Trasferire la conversazione a un altro agente.
`expectation`	`object (GoldenExpectation)` Facoltativo. Esegue un'aspettativa nel turno corrente.

SessionInput

Rappresentazione JSON

{
  "willContinue": boolean,

  // Union field input_type can be only one of the following:
  "text": string,
  "dtmf": string,
  "audio": string,
  "toolResponses": {
    object (ToolResponses)
  },
  "image": {
    object (Image)
  },
  "blob": {
    object (Blob)
  },
  "variables": {
    object
  },
  "event": {
    object (Event)
  }
  // End of list of possible types for union field input_type.
}

Campi
`willContinue`	`boolean` Facoltativo. Un flag che indica se il messaggio corrente è un frammento di un input più grande nella sessione di streaming bidirezionale. Se impostato su `true`, l'agente posticipa l'elaborazione fino a quando non riceve un messaggio successivo in cui `will_continue` è `false` o fino a quando il sistema non rileva un endpoint nell'input audio. NOTA: questo campo non si applica agli input audio e DTMF, in quanto vengono sempre elaborati automaticamente in base al segnale di fine.
Campo unione `input_type`. Il tipo di input. `input_type` può essere solo uno dei seguenti tipi:
`text`	`string` Facoltativo. Dati di testo dell'utente finale.
`dtmf`	`string` Facoltativo. Cifre DTMF dell'utente finale.
`audio`	`string (bytes format)` Facoltativo. Dati audio dell'utente finale. Una stringa con codifica in base64.
`toolResponses`	`object (ToolResponses)` Facoltativo. Risultati dell'esecuzione per le chiamate di strumenti dal client.
`image`	`object (Image)` Facoltativo. Dati delle immagini dell'utente finale.
`blob`	`object (Blob)` Facoltativo. Dati blob dell'utente finale.
`variables`	`object (Struct format)` Facoltativo. Variabili contestuali per la sessione, identificate per nome. L'agente CES utilizzerà solo le variabili dichiarate nell'app. Le variabili non riconosciute verranno comunque inviate all'[agente Dialogflow][Agent.RemoteDialogflowAgent] come parametri di sessione aggiuntivi.
`event`	`object (Event)` Facoltativo. Input evento.

ToolResponses

Rappresentazione JSON
{ "toolResponses": [ { object (`ToolResponse`) } ] }

Campi

toolResponses[]

object (ToolResponse)

Facoltativo. L'elenco dei risultati dell'esecuzione dello strumento.

ToolResponse

Rappresentazione JSON

{
  "id": string,
  "displayName": string,
  "response": {
    object
  },

  // Union field tool_identifier can be only one of the following:
  "tool": string,
  "toolsetTool": {
    object (ToolsetTool)
  }
  // End of list of possible types for union field tool_identifier.
}

Campi
`id`	`string` Facoltativo. L'ID corrispondente di `tool call` a cui si riferisce la risposta.
`displayName`	`string` Solo output. Nome visualizzato dello strumento.
`response`	`object (Struct format)` Obbligatorio. Il risultato dell'esecuzione dello strumento in formato oggetto JSON. Utilizza la chiave "output" per specificare la risposta dello strumento e la chiave "error" per specificare i dettagli dell'errore (se presenti). Se le chiavi "output" ed "error" non sono specificate, l'intera "response" viene trattata come risultato dell'esecuzione dello strumento.
Campo unione `tool_identifier`. L'identificatore dello strumento eseguito. Può trattarsi di uno strumento persistente o di uno strumento di un insieme di strumenti. `tool_identifier` può essere solo uno dei seguenti tipi:
`tool`	`string` Facoltativo. Il nome dello strumento da eseguire. Formato: `projects/{project}/locations/{location}/apps/{app}/tools/{tool}`
`toolsetTool`	`object (ToolsetTool)` Facoltativo. Lo strumento del toolset che è stato eseguito.

ToolsetTool

Rappresentazione JSON
{ "toolset": string, "toolId": string }

Campi

toolset

string

Obbligatorio. Il nome della risorsa del Toolset da cui deriva questo strumento. Formato: projects/{project}/locations/{location}/apps/{app}/toolsets/{toolset}

toolId

string

Facoltativo. L'ID dello strumento per filtrare gli strumenti per cui recuperare lo schema.

Struct

Rappresentazione JSON
{ "fields": { string: value, ... } }

Campi

fields

map (key: string, value: value (Value format))

Mappa non ordinata di valori con tipo dinamico.

Un oggetto contenente un elenco di coppie "key": value. Esempio: { "name": "wrench", "mass": "1.3kg", "count": "3" }.

FieldsEntry

Rappresentazione JSON
{ "key": string, "value": value }

Campi
`key`	`string`
`value`	`value (Value format)`

Valore

Rappresentazione JSON

{

  // Union field kind can be only one of the following:
  "nullValue": null,
  "numberValue": number,
  "stringValue": string,
  "boolValue": boolean,
  "structValue": {
    object
  },
  "listValue": array
  // End of list of possible types for union field kind.
}

Campi
Campo unione `kind`. Il tipo di valore. `kind` può essere solo uno dei seguenti tipi:
`nullValue`	`null` Rappresenta un valore null.
`numberValue`	`number` Rappresenta un valore double.
`stringValue`	`string` Rappresenta un valore stringa.
`boolValue`	`boolean` Rappresenta un valore booleano.
`structValue`	`object (Struct format)` Rappresenta un valore strutturato.
`listValue`	`array (ListValue format)` Rappresenta un `Value` ripetuto.

ListValue

Rappresentazione JSON
{ "values": [ value ] }

Campi

values[]

value (Value format)

Campo ripetuto di valori con tipo dinamico.

Immagine

Rappresentazione JSON
{ "mimeType": string, "data": string }

Campi

mimeType

string

Obbligatorio. Il tipo MIME standard IANA dei dati di origine. I tipi di immagini supportati includono: * image/png * image/jpeg * image/webp

data

string (bytes format)

Obbligatorio. Byte non elaborati dell'immagine.

Una stringa con codifica in base64.

Blob

Rappresentazione JSON
{ "mimeType": string, "data": string }

Campi

mimeType

string

Obbligatorio. Il tipo MIME standard IANA dei dati di origine.

data

string (bytes format)

Obbligatorio. Byte non elaborati del blob.

Una stringa con codifica in base64.

Evento

Rappresentazione JSON
{ "event": string }

Campi

event

string

Obbligatorio. Il nome dell'evento.

AgentTransfer

Rappresentazione JSON
{ "targetAgent": string, "displayName": string }

Campi

targetAgent

string

Obbligatorio. L'agente a cui viene trasferita la conversazione. L'agente gestirà la conversazione da questo punto in poi. Formato: projects/{project}/locations/{location}/apps/{app}/agents/{agent}

displayName

string

Solo output. Il nome visualizzato dell'agente.

GoldenExpectation

Rappresentazione JSON

{
  "note": string,

  // Union field condition can be only one of the following:
  "toolCall": {
    object (ToolCall)
  },
  "toolResponse": {
    object (ToolResponse)
  },
  "agentResponse": {
    object (Message)
  },
  "agentTransfer": {
    object (AgentTransfer)
  },
  "updatedVariables": {
    object
  },
  "mockToolResponse": {
    object (ToolResponse)
  }
  // End of list of possible types for union field condition.
}

Campi
`note`	`string` Facoltativo. Una nota per questo requisito, utile per la generazione di report quando controlli specifici non vanno a buon fine. Ad esempio, "Check_Payment_Tool_Called".
Campo unione `condition`. Il controllo effettivo da eseguire. `condition` può essere solo uno dei seguenti tipi:
`toolCall`	`object (ToolCall)` Facoltativo. Verifica che sia stato chiamato uno strumento specifico con i parametri.
`toolResponse`	`object (ToolResponse)` Facoltativo. Controlla che uno strumento specifico abbia dato la risposta prevista.
`agentResponse`	`object (Message)` Facoltativo. Controlla che l'agente abbia risposto con la risposta corretta. Il ruolo "agente" è implicito.
`agentTransfer`	`object (AgentTransfer)` Facoltativo. Controlla che l'agente abbia trasferito la conversazione a un altro agente.
`updatedVariables`	`object (Struct format)` Facoltativo. Verifica che l'agente abbia aggiornato le variabili di sessione ai valori previsti. Utilizzato anche per acquisire gli aggiornamenti delle variabili dell'agente per le valutazioni di riferimento.
`mockToolResponse`	`object (ToolResponse)` Facoltativo. La risposta dello strumento alla simulazione, con i parametri di interesse specificati. Eventuali parametri non specificati verranno inventati dal LLM.

ToolCall

Rappresentazione JSON

{
  "id": string,
  "displayName": string,
  "args": {
    object
  },

  // Union field tool_identifier can be only one of the following:
  "tool": string,
  "toolsetTool": {
    object (ToolsetTool)
  }
  // End of list of possible types for union field tool_identifier.
}

Campi
`id`	`string` Facoltativo. L'identificatore univoco della chiamata allo strumento. Se compilato, il client deve restituire il risultato dell'esecuzione con l'ID corrispondenza in `ToolResponse`.
`displayName`	`string` Solo output. Nome visualizzato dello strumento.
`args`	`object (Struct format)` Facoltativo. I parametri e i valori di input per lo strumento in formato oggetto JSON.
Campo unione `tool_identifier`. L'identificatore dello strumento da eseguire. Può trattarsi di uno strumento persistente o di uno strumento di un insieme di strumenti. `tool_identifier` può essere solo uno dei seguenti tipi:
`tool`	`string` Facoltativo. Il nome dello strumento da eseguire. Formato: `projects/{project}/locations/{location}/apps/{app}/tools/{tool}`
`toolsetTool`	`object (ToolsetTool)` Facoltativo. Lo strumento del toolset da eseguire.

Messaggio

Rappresentazione JSON
{ "role": string, "chunks": [ { object (`Chunk`) } ], "eventTime": string }

Campi

role

string

Facoltativo. Il ruolo all'interno della conversazione, ad esempio utente, agente.

chunks[]

object (Chunk)

Facoltativo. Contenuto del messaggio come una serie di blocchi.

eventTime

string (Timestamp format)

Facoltativo. Timestamp di invio o ricezione del messaggio. Non deve essere utilizzato se il messaggio fa parte di un example.

Chunk

Rappresentazione JSON

{

  // Union field data can be only one of the following:
  "text": string,
  "transcript": string,
  "blob": {
    object (Blob)
  },
  "payload": {
    object
  },
  "image": {
    object (Image)
  },
  "toolCall": {
    object (ToolCall)
  },
  "toolResponse": {
    object (ToolResponse)
  },
  "agentTransfer": {
    object (AgentTransfer)
  },
  "updatedVariables": {
    object
  },
  "defaultVariables": {
    object
  }
  // End of list of possible types for union field data.
}

Campi
Campo unione `data`. Dividi i dati in blocchi. `data` può essere solo uno dei seguenti tipi:
`text`	`string` Facoltativo. Dati di testo.
`transcript`	`string` Facoltativo. Trascrizione associata all'audio.
`blob`	`object (Blob)` Facoltativo. Dati blob.
`payload`	`object (Struct format)` Facoltativo. Dati di payload personalizzati.
`image`	`object (Image)` Facoltativo. Dati immagine.
`toolCall`	`object (ToolCall)` Facoltativo. Richiesta di esecuzione dello strumento.
`toolResponse`	`object (ToolResponse)` Facoltativo. Risposta all'esecuzione dello strumento.
`agentTransfer`	`object (AgentTransfer)` Facoltativo. Evento di trasferimento dell'agente.
`updatedVariables`	`object (Struct format)` Una struct rappresenta le variabili aggiornate nella conversazione, identificate dai nomi delle variabili.
`defaultVariables`	`object (Struct format)` Una struct rappresenta le variabili predefinite all'inizio della conversazione, identificate dai nomi delle variabili.

Timestamp

Rappresentazione JSON
{ "seconds": string, "nanos": integer }

Campi

seconds

string (int64 format)

nanos

integer

Intervallo

Rappresentazione JSON
{ "name": string, "startTime": string, "endTime": string, "duration": string, "attributes": { object }, "childSpans": [ { object (`Span`) } ] }

Campi
`name`	`string` Solo output. Il nome dello span.
`startTime`	`string (Timestamp format)` Solo output. L'ora di inizio dell'intervallo. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`endTime`	`string (Timestamp format)` Solo output. L'ora di fine dell'intervallo. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`duration`	`string (Duration format)` Solo output. La durata dell'intervallo. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "`s`". Esempio: `"3.5s"`.
`attributes`	`object (Struct format)` Solo output. Attributi chiave-valore associati allo span.
`childSpans[]`	`object (Span)` Solo output. Gli intervalli secondari nidificati in questo intervallo.

Durata

Rappresentazione JSON
{ "seconds": string, "nanos": integer }

Campi

seconds

string (int64 format)

nanos

integer

Scenario

Rappresentazione JSON

{
  "task": string,
  "userFacts": [
    {
      object (UserFact)
    }
  ],
  "maxTurns": integer,
  "rubrics": [
    string
  ],
  "scenarioExpectations": [
    {
      object (ScenarioExpectation)
    }
  ],
  "variableOverrides": {
    object
  },
  "taskCompletionBehavior": enum (TaskCompletionBehavior),
  "userGoalBehavior": enum (UserGoalBehavior),
  "evaluationExpectations": [
    string
  ]
}

Campi
`task`	`string` Obbligatorio. L'attività da prendere di mira nello scenario.
`userFacts[]`	`object (UserFact)` Facoltativo. I fatti dell'utente da utilizzare nello scenario.
`maxTurns`	`integer` Facoltativo. Il numero massimo di turni da simulare. Se non specificata, la simulazione continuerà fino al completamento dell'attività.
`rubrics[]`	`string` Obbligatorio. I criteri di valutazione in base ai quali valutare lo scenario.
`scenarioExpectations[]`	`object (ScenarioExpectation)` Obbligatorio. ScenarioExpectations per valutare la conversazione prodotta dalla simulazione dell'utente.
`variableOverrides`	`object (Struct format)` Facoltativo. Variabili / parametri di sessione come contesto per la sessione, con chiave in base ai nomi delle variabili. I membri di questa struttura sostituiranno tutti i valori predefiniti impostati dal sistema. Tieni presente che questi sono diversi dai fatti dell'utente, ovvero i fatti noti all'utente. Le variabili sono parametri noti all'agente, ad esempio l'MDN (numero di telefono) trasmesso dal sistema di telefonia.
`taskCompletionBehavior (deprecated)`	`enum (TaskCompletionBehavior)` Questo elemento è deprecato. Facoltativo. Deprecato. Utilizza invece user_goal_behavior.
`userGoalBehavior`	`enum (UserGoalBehavior)` Facoltativo. Il comportamento previsto dell'obiettivo utente.
`evaluationExpectations[]`	`string` Facoltativo. Le aspettative di valutazione in base alle quali valutare la conversazione prodotta dalla simulazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationExpectations/{evaluationExpectation}`

UserFact

Rappresentazione JSON
{ "name": string, "value": string }

Campi

name

string

Obbligatorio. Il nome del fatto relativo all'utente.

value

string

Obbligatorio. Il valore del fatto utente.

ScenarioExpectation

Rappresentazione JSON

{

  // Union field expectation can be only one of the following:
  "toolExpectation": {
    object (ToolExpectation)
  },
  "agentResponse": {
    object (Message)
  }
  // End of list of possible types for union field expectation.
}

Campi

Campo unione expectation. L'aspettativa di valutare la conversazione prodotta dalla simulazione. expectation può essere solo uno dei seguenti tipi:

toolExpectation

object (ToolExpectation)

Facoltativo. La coppia di chiamata allo strumento e risposta da valutare.

agentResponse

object (Message)

Facoltativo. La risposta dell'agente da valutare.

ToolExpectation

Rappresentazione JSON
{ "expectedToolCall": { object (`ToolCall`) }, "mockToolResponse": { object (`ToolResponse`) } }

Campi

expectedToolCall

object (ToolCall)

Obbligatorio. La chiamata allo strumento prevista, con i parametri di interesse specificati. Eventuali parametri non specificati verranno inventati dal LLM.

mockToolResponse

object (ToolResponse)

Obbligatorio. La risposta dello strumento alla simulazione, con i parametri di interesse specificati. Eventuali parametri non specificati verranno inventati dal LLM.

AggregatedMetrics

Rappresentazione JSON
{ "metricsByAppVersion": [ { object (`MetricsByAppVersion`) } ] }

Campi

metricsByAppVersion[]

object (MetricsByAppVersion)

Solo output. Metriche aggregate, raggruppate per ID versione dell'app.

MetricsByAppVersion

Rappresentazione JSON

{
  "appVersionId": string,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ],
  "passCount": integer,
  "failCount": integer,
  "metricsByTurn": [
    {
      object (MetricsByTurn)
    }
  ]
}

Campi
`appVersionId`	`string` Solo output. L'ID versione dell'app.
`toolMetrics[]`	`object (ToolMetrics)` Solo output. Metriche per ogni strumento all'interno di questa versione dell'app.
`semanticSimilarityMetrics[]`	`object (SemanticSimilarityMetrics)` Solo output. Metriche per la somiglianza semantica all'interno di questa versione dell'app.
`hallucinationMetrics[]`	`object (HallucinationMetrics)` Solo output. Metriche per le allucinazioni all'interno di questa versione dell'app.
`toolCallLatencyMetrics[]`	`object (ToolCallLatencyMetrics)` Solo output. Metriche per la latenza delle chiamate agli strumenti all'interno di questa versione dell'app.
`turnLatencyMetrics[]`	`object (TurnLatencyMetrics)` Solo output. Metriche per la latenza del turno all'interno di questa versione dell'app.
`passCount`	`integer` Solo output. Il numero di volte in cui la valutazione è stata superata.
`failCount`	`integer` Solo output. Il numero di volte in cui la valutazione non è riuscita.
`metricsByTurn[]`	`object (MetricsByTurn)` Solo output. Metriche aggregate per turno all'interno di questa versione dell'app.

ToolMetrics

Rappresentazione JSON
{ "tool": string, "passCount": integer, "failCount": integer }

Campi

tool

string

Solo output. Il nome dello strumento.

passCount

integer

Solo output. Il numero di volte in cui lo strumento è stato superato.

failCount

integer

Solo output. Il numero di volte in cui lo strumento non ha funzionato.

SemanticSimilarityMetrics

Rappresentazione JSON
{ "score": number }

Campi

score

number

Solo output. Il punteggio medio di similarità semantica (0-4).

HallucinationMetrics

Rappresentazione JSON
{ "score": number }

Campi

score

number

Solo output. Il punteggio medio di allucinazione (da 0 a 1).

ToolCallLatencyMetrics

Rappresentazione JSON
{ "tool": string, "averageLatency": string }

Campi

tool

string

Solo output. Il nome dello strumento.

averageLatency

string (Duration format)

Solo output. La latenza media delle chiamate agli strumenti.

Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "s". Esempio: "3.5s".

TurnLatencyMetrics

Rappresentazione JSON
{ "averageLatency": string }

Campi

averageLatency

string (Duration format)

Solo output. La latenza media dei turni.

Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "s". Esempio: "3.5s".

MetricsByTurn

Rappresentazione JSON

{
  "turnIndex": integer,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ]
}

Campi
`turnIndex`	`integer` Solo output. L'indice del turno (a base 0).
`toolMetrics[]`	`object (ToolMetrics)` Solo output. Metriche per ogni strumento all'interno di questo turno.
`semanticSimilarityMetrics[]`	`object (SemanticSimilarityMetrics)` Solo output. Metriche per la similarità semantica all'interno di questo turno.
`hallucinationMetrics[]`	`object (HallucinationMetrics)` Solo output. Metriche per le allucinazioni in questo turno.
`toolCallLatencyMetrics[]`	`object (ToolCallLatencyMetrics)` Solo output. Metriche per la latenza della chiamata allo strumento all'interno di questo turno.
`turnLatencyMetrics[]`	`object (TurnLatencyMetrics)` Solo output. Metriche per la latenza del turno all'interno di questo turno.

EvaluationResult

Rappresentazione JSON

{
  "name": string,
  "displayName": string,
  "createTime": string,
  "evaluationStatus": enum (Outcome),
  "evaluationRun": string,
  "persona": {
    object (EvaluationPersona)
  },
  "errorInfo": {
    object (EvaluationErrorInfo)
  },
  "error": {
    object (Status)
  },
  "initiatedBy": string,
  "appVersion": string,
  "appVersionDisplayName": string,
  "changelog": string,
  "changelogCreateTime": string,
  "executionState": enum (ExecutionState),
  "evaluationMetricsThresholds": {
    object (EvaluationMetricsThresholds)
  },
  "config": {
    object (EvaluationConfig)
  },
  "goldenRunMethod": enum (GoldenRunMethod),

  // Union field result can be only one of the following:
  "goldenResult": {
    object (GoldenResult)
  },
  "scenarioResult": {
    object (ScenarioResult)
  }
  // End of list of possible types for union field result.
}

Campi
`name`	`string` Identificatore. L'identificatore univoco del risultato della valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluations/{evaluation}/results/{result}`
`displayName`	`string` Obbligatorio. Nome visualizzato del risultato della valutazione. Unico all'interno di una valutazione. Per impostazione predefinita, ha il seguente formato: " risultato - ".
`createTime`	`string (Timestamp format)` Solo output. Timestamp di creazione del risultato della valutazione. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`evaluationStatus`	`enum (Outcome)` Solo output. L'esito della valutazione. Compilato solo se execution_state è COMPLETE.
`evaluationRun`	`string` Solo output. L'esecuzione della valutazione che ha prodotto questo risultato. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationRuns/{evaluationRun}`
`persona`	`object (EvaluationPersona)` Solo output. La persona utilizzata per generare la conversazione per il risultato della valutazione.
`errorInfo`	`object (EvaluationErrorInfo)` Solo output. Informazioni sull'errore per il risultato della valutazione.
`error (deprecated)`	`object (Status)` Questo elemento è deprecato. Solo output. Deprecato: utilizza `error_info`. Errori rilevati durante l'esecuzione.
`initiatedBy`	`string` Solo output. L'utente che ha avviato l'esecuzione della valutazione che ha generato questo risultato.
`appVersion`	`string` Solo output. La versione dell'app utilizzata per generare la conversazione che ha prodotto questo risultato. Formato: `projects/{project}/locations/{location}/apps/{app}/versions/{version}`
`appVersionDisplayName`	`string` Solo output. Il nome visualizzato del `app_version` rispetto al quale è stata eseguita la valutazione.
`changelog`	`string` Solo output. Il log delle modifiche della versione dell'app su cui è stata eseguita la valutazione. Questo campo viene compilato se l'utente esegue la valutazione sull'ultima versione/bozza.
`changelogCreateTime`	`string (Timestamp format)` Solo output. L'ora di creazione del log delle modifiche della versione dell'app su cui è stata eseguita la valutazione. Questo campo viene compilato se l'utente esegue la valutazione sull'ultima versione/bozza. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`executionState`	`enum (ExecutionState)` Solo output. Lo stato di esecuzione del risultato della valutazione.
`evaluationMetricsThresholds`	`object (EvaluationMetricsThresholds)` Solo output. Le soglie di valutazione per il risultato.
`config`	`object (EvaluationConfig)` Solo output. La configurazione utilizzata nell'esecuzione della valutazione che ha generato questo risultato.
`goldenRunMethod`	`enum (GoldenRunMethod)` Solo output. Il metodo utilizzato per eseguire la valutazione golden.
Campo unione `result`. Il risultato della valutazione. Viene compilato solo quando execution_state è COMPLETED. `result` può essere solo uno dei seguenti tipi:
`goldenResult`	`object (GoldenResult)` Solo output. Il risultato di una valutazione di riferimento.
`scenarioResult`	`object (ScenarioResult)` Solo output. Il risultato di una valutazione dello scenario.

GoldenResult

Rappresentazione JSON
{ "turnReplayResults": [ { object (`TurnReplayResult`) } ], "evaluationExpectationResults": [ { object (`EvaluationExpectationResult`) } ] }

Campi

turnReplayResults[]

object (TurnReplayResult)

Solo output. Il risultato dell'esecuzione di ogni turno della conversazione di riferimento.

evaluationExpectationResults[]

object (EvaluationExpectationResult)

Solo output. I risultati delle aspettative di valutazione.

TurnReplayResult

Rappresentazione JSON

{
  "conversation": string,
  "expectationOutcome": [
    {
      object (GoldenExpectationOutcome)
    }
  ],
  "hallucinationResult": {
    object (HallucinationResult)
  },
  "toolInvocationScore": number,
  "turnLatency": string,
  "toolCallLatencies": [
    {
      object (ToolCallLatency)
    }
  ],
  "semanticSimilarityResult": {
    object (SemanticSimilarityResult)
  },
  "overallToolInvocationResult": {
    object (OverallToolInvocationResult)
  },
  "errorInfo": {
    object (EvaluationErrorInfo)
  },
  "spanLatencies": [
    {
      object (SpanLatency)
    }
  ],

  // Union field _tool_ordered_invocation_score can be only one of the following:
  "toolOrderedInvocationScore": number
  // End of list of possible types for union field
  // _tool_ordered_invocation_score.
}

Campi
`conversation`	`string` Solo output. La conversazione generata per questo turno.
`expectationOutcome[]`	`object (GoldenExpectationOutcome)` Solo output. Il risultato di ogni aspettativa.
`hallucinationResult`	`object (HallucinationResult)` Solo output. Il risultato del controllo delle allucinazioni.
`toolInvocationScore (deprecated)`	`number` Questo elemento è deprecato. Solo output. Deprecato. Utilizza OverallToolInvocationResult.
`turnLatency`	`string (Duration format)` Solo output. Durata del turno. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "`s`". Esempio: `"3.5s"`.
`toolCallLatencies[]`	`object (ToolCallLatency)` Solo output. La latenza di ogni chiamata allo strumento nel turno.
`semanticSimilarityResult`	`object (SemanticSimilarityResult)` Solo output. Il risultato del controllo della somiglianza semantica.
`overallToolInvocationResult`	`object (OverallToolInvocationResult)` Solo output. Il risultato del controllo complessivo dell'invocazione dello strumento.
`errorInfo`	`object (EvaluationErrorInfo)` Solo output. Informazioni sull'errore che si è verificato durante questo turno.
`spanLatencies[]`	`object (SpanLatency)` Solo output. La latenza degli span nel turno.
Campo unione `_tool_ordered_invocation_score`. `_tool_ordered_invocation_score` può essere solo uno dei seguenti tipi:
`toolOrderedInvocationScore`	`number` Solo output. Il punteggio complessivo di chiamata dello strumento ordinato per questo turno. Indica la percentuale complessiva di strumenti della svolta prevista che sono stati effettivamente richiamati nell'ordine previsto.

GoldenExpectationOutcome

Rappresentazione JSON

{
  "expectation": {
    object (GoldenExpectation)
  },
  "outcome": enum (Outcome),
  "semanticSimilarityResult": {
    object (SemanticSimilarityResult)
  },
  "toolInvocationResult": {
    object (ToolInvocationResult)
  },

  // Union field result can be only one of the following:
  "observedToolCall": {
    object (ToolCall)
  },
  "observedToolResponse": {
    object (ToolResponse)
  },
  "observedAgentResponse": {
    object (Message)
  },
  "observedAgentTransfer": {
    object (AgentTransfer)
  }
  // End of list of possible types for union field result.
}

Campi
`expectation`	`object (GoldenExpectation)` Solo output. L'aspettativa che è stata valutata.
`outcome`	`enum (Outcome)` Solo output. Il risultato dell'aspettativa.
`semanticSimilarityResult (deprecated)`	`object (SemanticSimilarityResult)` Questo elemento è deprecato. Solo output. Il risultato del controllo della somiglianza semantica.
`toolInvocationResult`	`object (ToolInvocationResult)` Solo output. Il risultato del controllo di chiamata dello strumento.
Campo unione `result`. Il risultato dell'aspettativa. `result` può essere solo uno dei seguenti tipi:
`observedToolCall`	`object (ToolCall)` Solo output. Il risultato dell'aspettativa di chiamata allo strumento.
`observedToolResponse`	`object (ToolResponse)` Solo output. Il risultato dell'aspettativa di risposta dello strumento.
`observedAgentResponse`	`object (Message)` Solo output. Il risultato dell'aspettativa di risposta dell'agente.
`observedAgentTransfer`	`object (AgentTransfer)` Solo output. Il risultato dell'aspettativa di trasferimento dell'agente.

SemanticSimilarityResult

Rappresentazione JSON

{
  "label": string,
  "explanation": string,
  "outcome": enum (Outcome),

  // Union field _score can be only one of the following:
  "score": integer
  // End of list of possible types for union field _score.
}

Campi
`label`	`string` Solo output. L'etichetta associata a ogni punteggio. Punteggio 4: completamente coerente Punteggio 3: per lo più coerente Punteggio 2: parzialmente coerente (omissioni minori) Punteggio 1: in gran parte incoerente (omissioni maggiori) Punteggio 0: completamente incoerente / contraddittorio
`explanation`	`string` Solo output. La spiegazione del punteggio di similarità semantica.
`outcome`	`enum (Outcome)` Solo output. Il risultato del controllo della somiglianza semantica. Questo valore viene determinato confrontando il punteggio con semantic_similarity_success_threshold. Se il punteggio è uguale o superiore alla soglia, il risultato sarà PASS. In caso contrario, il risultato sarà FAIL.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`integer` Solo output. Il punteggio di similarità semantica. Può essere 0, 1, 2, 3 o 4.

ToolInvocationResult

Rappresentazione JSON

{
  "outcome": enum (Outcome),
  "explanation": string,

  // Union field _parameter_correctness_score can be only one of the following:
  "parameterCorrectnessScore": number
  // End of list of possible types for union field _parameter_correctness_score.
}

Campi
`outcome`	`enum (Outcome)` Solo output. Il risultato del controllo di chiamata dello strumento. Questo valore viene determinato confrontando il punteggio di correttezza dei parametri con la soglia. Se il punteggio è uguale o superiore alla soglia, il risultato sarà PASS. In caso contrario, il risultato sarà FAIL.
`explanation`	`string` Solo output. Una spiegazione in formato libero del risultato dell'invocazione dello strumento.
Campo unione `_parameter_correctness_score`. `_parameter_correctness_score` può essere solo uno dei seguenti tipi:
`parameterCorrectnessScore`	`number` Solo output. Il punteggio di correttezza del parametro di chiamata dello strumento. Indica la percentuale di parametri della chiamata allo strumento prevista che erano presenti anche nella chiamata allo strumento effettiva.

HallucinationResult

Rappresentazione JSON
{ "label": string, "explanation": string, // Union field `_score` can be only one of the following: "score": integer // End of list of possible types for union field `_score`. }

Campi
`label`	`string` Solo output. L'etichetta associata a ogni punteggio. Punteggio 1: Punteggio giustificato Punteggio 0: Punteggio non giustificato Punteggio -1: Nessuna rivendicazione da valutare
`explanation`	`string` Solo output. La spiegazione del punteggio di allucinazione.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`integer` Solo output. Il punteggio di allucinazione. Può essere -1, 0, 1.

ToolCallLatency

Rappresentazione JSON
{ "tool": string, "displayName": string, "startTime": string, "endTime": string, "executionLatency": string }

Campi
`tool`	`string` Solo output. Il nome dello strumento eseguito. Formato: `projects/{project}/locations/{location}/apps/{app}/tools/{tool}`.
`displayName`	`string` Solo output. Il nome visualizzato dello strumento.
`startTime`	`string (Timestamp format)` Solo output. L'ora di inizio dell'esecuzione della chiamata allo strumento. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`endTime`	`string (Timestamp format)` Solo output. L'ora di fine dell'esecuzione della chiamata allo strumento. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`executionLatency`	`string (Duration format)` Solo output. La latenza dell'esecuzione della chiamata di funzione. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "`s`". Esempio: `"3.5s"`.

OverallToolInvocationResult

Rappresentazione JSON

{
  "outcome": enum (Outcome),

  // Union field _tool_invocation_score can be only one of the following:
  "toolInvocationScore": number
  // End of list of possible types for union field _tool_invocation_score.
}

Campi

outcome

enum (Outcome)

Campo unione _tool_invocation_score.

_tool_invocation_score può essere solo uno dei seguenti tipi:

toolInvocationScore

number

Il punteggio complessivo di invocazione dello strumento per questo turno. Indica la percentuale complessiva di strumenti dell'azione prevista che sono stati effettivamente richiamati.

EvaluationErrorInfo

Rappresentazione JSON
{ "errorType": enum (`ErrorType`), "errorMessage": string, "sessionId": string }

Campi

errorType

enum (ErrorType)

Solo output. Il tipo di errore.

errorMessage

string

Solo output. Il messaggio di errore.

sessionId

string

Solo output. L'ID sessione della conversazione che ha causato l'errore.

SpanLatency

Rappresentazione JSON

{
  "type": enum (Type),
  "displayName": string,
  "startTime": string,
  "endTime": string,
  "executionLatency": string,

  // Union field identifier can be only one of the following:
  "resource": string,
  "toolset": {
    object (ToolsetTool)
  },
  "model": string,
  "callback": string
  // End of list of possible types for union field identifier.
}

Campi
`type`	`enum (Type)` Solo output. Il tipo di intervallo.
`displayName`	`string` Solo output. Il nome visualizzato dello span. Valido per gli intervalli di strumenti e sistemi di protezione.
`startTime`	`string (Timestamp format)` Solo output. L'ora di inizio dell'intervallo. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`endTime`	`string (Timestamp format)` Solo output. L'ora di fine dell'intervallo. Utilizza RFC 3339, in cui l'output generato è sempre con normalizzazione Z e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` o `"2014-10-02T15:01:23+05:30"`.
`executionLatency`	`string (Duration format)` Solo output. La latenza dello span. Una durata in secondi con un massimo di nove cifre frazionarie, che termina con "`s`". Esempio: `"3.5s"`.
Campo unione `identifier`. L'identificatore dell'elemento specifico in base al suo tipo. `identifier` può essere solo uno dei seguenti tipi:
`resource`	`string` Solo output. Il nome della risorsa degli intervalli di guardrail o strumenti.
`toolset`	`object (ToolsetTool)` Solo output. L'identificatore dello strumento del toolset.
`model`	`string` Solo output. Il nome dello span LLM.
`callback`	`string` Solo output. Il nome dello span di callback dell'utente.

EvaluationExpectationResult

Rappresentazione JSON
{ "evaluationExpectation": string, "prompt": string, "outcome": enum (`Outcome`), "explanation": string }

Campi
`evaluationExpectation`	`string` Solo output. L'aspettativa di valutazione. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationExpectations/{evaluation_expectation}`
`prompt`	`string` Solo output. Il prompt utilizzato per la valutazione.
`outcome`	`enum (Outcome)` Solo output. Il risultato dell'aspettativa di valutazione.
`explanation`	`string` Solo output. La spiegazione del risultato.

ScenarioResult

Rappresentazione JSON

{
  "conversation": string,
  "task": string,
  "userFacts": [
    {
      object (UserFact)
    }
  ],
  "expectationOutcomes": [
    {
      object (ScenarioExpectationOutcome)
    }
  ],
  "rubricOutcomes": [
    {
      object (ScenarioRubricOutcome)
    }
  ],
  "hallucinationResult": [
    {
      object (HallucinationResult)
    }
  ],
  "taskCompletionResult": {
    object (TaskCompletionResult)
  },
  "toolCallLatencies": [
    {
      object (ToolCallLatency)
    }
  ],
  "userGoalSatisfactionResult": {
    object (UserGoalSatisfactionResult)
  },
  "spanLatencies": [
    {
      object (SpanLatency)
    }
  ],
  "evaluationExpectationResults": [
    {
      object (EvaluationExpectationResult)
    }
  ],

  // Union field _all_expectations_satisfied can be only one of the following:
  "allExpectationsSatisfied": boolean
  // End of list of possible types for union field _all_expectations_satisfied.

  // Union field _task_completed can be only one of the following:
  "taskCompleted": boolean
  // End of list of possible types for union field _task_completed.
}

Campi

conversation

string

Solo output. La conversazione generata nello scenario.

task

string

Solo output. L'attività utilizzata durante l'esecuzione dello scenario per questo risultato.

userFacts[]

object (UserFact)

Solo output. I fatti sull'utente utilizzati dallo scenario per questo risultato.

expectationOutcomes[]

object (ScenarioExpectationOutcome)

Solo output. Il risultato di ogni aspettativa.

rubricOutcomes[]

object (ScenarioRubricOutcome)

Solo output. Il risultato della griglia.

hallucinationResult[]

object (HallucinationResult)

Solo output. Il risultato del controllo delle allucinazioni. Verrà visualizzato un risultato di allucinazione per ogni turno della conversazione.

taskCompletionResult
(deprecated)

object (TaskCompletionResult)

Solo output. Il risultato del controllo del completamento dell'attività.

toolCallLatencies[]

object (ToolCallLatency)

Solo output. La latenza di ogni esecuzione della chiamata allo strumento nella conversazione.

userGoalSatisfactionResult

object (UserGoalSatisfactionResult)

Solo output. Il risultato del controllo della soddisfazione dell'obiettivo dell'utente.

spanLatencies[]

object (SpanLatency)

Solo output. La latenza degli intervalli nella conversazione.

evaluationExpectationResults[]

object (EvaluationExpectationResult)

Solo output. I risultati delle aspettative di valutazione.

Campo unione _all_expectations_satisfied.

_all_expectations_satisfied può essere solo uno dei seguenti tipi:

allExpectationsSatisfied

boolean

Solo output. Indica se tutte le aspettative sono state soddisfatte per questo turno.

Campo unione _task_completed.

_task_completed può essere solo uno dei seguenti tipi:

taskCompleted

boolean

Solo output. Se l'attività è stata completata per questo turno. Si tratta di un insieme di tutte le aspettative soddisfatte, senza allucinazioni e con la soddisfazione dell'obiettivo dell'utente.

ScenarioExpectationOutcome

Rappresentazione JSON

{
  "expectation": {
    object (ScenarioExpectation)
  },
  "outcome": enum (Outcome),

  // Union field result can be only one of the following:
  "observedToolCall": {
    object (ObservedToolCall)
  },
  "observedAgentResponse": {
    object (Message)
  }
  // End of list of possible types for union field result.
}

Campi
`expectation`	`object (ScenarioExpectation)` Solo output. L'aspettativa che è stata valutata.
`outcome`	`enum (Outcome)` Solo output. Il risultato di ScenarioExpectation.
Campo unione `result`. Il risultato dell'aspettativa. `result` può essere solo uno dei seguenti tipi:
`observedToolCall`	`object (ObservedToolCall)` Solo output. La chiamata allo strumento osservata.
`observedAgentResponse`	`object (Message)` Solo output. La risposta dell'agente osservata.

ObservedToolCall

Rappresentazione JSON
{ "toolCall": { object (`ToolCall`) }, "toolResponse": { object (`ToolResponse`) } }

Campi

toolCall

object (ToolCall)

Solo output. La chiamata allo strumento osservata.

toolResponse

object (ToolResponse)

Solo output. La risposta dello strumento osservata.

ScenarioRubricOutcome

Rappresentazione JSON
{ "rubric": string, "scoreExplanation": string, // Union field `_score` can be only one of the following: "score": number // End of list of possible types for union field `_score`. }

Campi
`rubric`	`string` Solo output. La rubrica utilizzata per valutare la conversazione.
`scoreExplanation`	`string` Solo output. La risposta del valutatore alla rubrica.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`number` Solo output. Il punteggio della conversazione rispetto alla griglia.

TaskCompletionResult

Rappresentazione JSON
{ "label": string, "explanation": string, // Union field `_score` can be only one of the following: "score": integer // End of list of possible types for union field `_score`. }

Campi
`label`	`string` Solo output. L'etichetta associata a ogni punteggio. Punteggio 1: attività completata. Punteggio 0: attività non completata. Punteggio -1: obiettivo utente non definito.
`explanation`	`string` Solo output. La spiegazione del punteggio di completamento dell'attività.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`integer` Solo output. Il punteggio di completamento dell'attività. Può essere -1, 0, 1

UserGoalSatisfactionResult

Rappresentazione JSON
{ "label": string, "explanation": string, // Union field `_score` can be only one of the following: "score": integer // End of list of possible types for union field `_score`. }

Campi
`label`	`string` Solo output. L'etichetta associata a ogni punteggio. Punteggio 1: attività utente soddisfatta Punteggio 0: attività utente non soddisfatta Punteggio -1: attività utente non specificata
`explanation`	`string` Solo output. La spiegazione del punteggio di soddisfazione dell'attività dell'utente.
Campo unione `_score`. `_score` può essere solo uno dei seguenti tipi:
`score`	`integer` Solo output. Il punteggio di soddisfazione dell'attività dell'utente. Può essere -1, 0, 1.

EvaluationPersona

Rappresentazione JSON
{ "name": string, "description": string, "displayName": string, "personality": string, "speechConfig": { object (`SpeechConfig`) } }

Campi
`name`	`string` Obbligatorio. L'identificatore univoco della persona. Formato: `projects/{project}/locations/{location}/apps/{app}/evaluationPersonas/{evaluationPersona}`
`description`	`string` Facoltativo. La descrizione della persona.
`displayName`	`string` Obbligatorio. Il nome visualizzato della persona. Unico all'interno di un'app.
`personality`	`string` Obbligatorio. Un'istruzione per l'agente su come comportarsi nella valutazione.
`speechConfig`	`object (SpeechConfig)` Facoltativo. Configurazione del suono della persona (impostazioni TTS).

SpeechConfig

Rappresentazione JSON
{ "speakingRate": number, "environment": enum (`BackgroundEnvironment`), "voiceId": string }

Campi

speakingRate

number

environment

enum (BackgroundEnvironment)

Facoltativo. L'ambiente audio simulato.

voiceId

string

Facoltativo. L'identificatore/l'accento della voce specifico da utilizzare. Esempio: "en-US-Wavenet-D" o "en-GB-Standard-A"

Stato

Rappresentazione JSON
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] }

Campi

code

integer

Il codice di stato, che deve essere un valore enum di google.rpc.Code.

message

string

details[]

object

Un elenco di messaggi contenenti i dettagli dell'errore. Esiste un insieme comune di tipi di messaggi da utilizzare per le API.

Un oggetto contenente campi di tipo arbitrario. Un campo aggiuntivo "@type" contenente un URI che identifica il tipo. Esempio: { "id": 1234, "@type": "types.example.com/standard/id" }.

Qualsiasi

Rappresentazione JSON
{ "typeUrl": string, "value": string }

Campi

typeUrl

string

Identifica il tipo di messaggio Protobuf serializzato con un riferimento URI costituito da un prefisso che termina con una barra e il nome del tipo completo.

Esempio: type.googleapis.com/google.protobuf.StringValue

value

string (bytes format)

Contiene una serializzazione Protobuf del tipo descritto da type_url.

Una stringa con codifica in base64.

EvaluationMetricsThresholds

Rappresentazione JSON

{
  "goldenEvaluationMetricsThresholds": {
    object (GoldenEvaluationMetricsThresholds)
  },
  "hallucinationMetricBehavior": enum (HallucinationMetricBehavior),
  "goldenHallucinationMetricBehavior": enum (HallucinationMetricBehavior),
  "scenarioHallucinationMetricBehavior": enum (HallucinationMetricBehavior)
}

Campi
`goldenEvaluationMetricsThresholds`	`object (GoldenEvaluationMetricsThresholds)` Facoltativo. Le soglie delle metriche di valutazione secondo regole d'oro.
`hallucinationMetricBehavior (deprecated)`	`enum (HallucinationMetricBehavior)` Questo elemento è deprecato. Facoltativo. Deprecato: utilizza `golden_hallucination_metric_behavior`. Il comportamento della metrica di allucinazione viene attualmente utilizzato per le valutazioni dorate.
`goldenHallucinationMetricBehavior`	`enum (HallucinationMetricBehavior)` Facoltativo. Il comportamento della metrica delle allucinazioni per le valutazioni di riferimento.
`scenarioHallucinationMetricBehavior`	`enum (HallucinationMetricBehavior)` Facoltativo. Il comportamento della metrica di allucinazione per le valutazioni degli scenari.

GoldenEvaluationMetricsThresholds

Rappresentazione JSON

{
  "turnLevelMetricsThresholds": {
    object (TurnLevelMetricsThresholds)
  },
  "expectationLevelMetricsThresholds": {
    object (ExpectationLevelMetricsThresholds)
  },
  "toolMatchingSettings": {
    object (ToolMatchingSettings)
  }
}

Campi

turnLevelMetricsThresholds

object (TurnLevelMetricsThresholds)

Facoltativo. Le soglie delle metriche a livello di turno.

expectationLevelMetricsThresholds

object (ExpectationLevelMetricsThresholds)

Facoltativo. Le soglie delle metriche del livello di aspettativa.

toolMatchingSettings

object (ToolMatchingSettings)

TurnLevelMetricsThresholds

Rappresentazione JSON

{
  "semanticSimilarityChannel": enum (SemanticSimilarityChannel),

  // Union field _semantic_similarity_success_threshold can be only one of the
  // following:
  "semanticSimilaritySuccessThreshold": integer
  // End of list of possible types for union field
  // _semantic_similarity_success_threshold.

  // Union field _overall_tool_invocation_correctness_threshold can be only one
  // of the following:
  "overallToolInvocationCorrectnessThreshold": number
  // End of list of possible types for union field
  // _overall_tool_invocation_correctness_threshold.
}

Campi

semanticSimilarityChannel

enum (SemanticSimilarityChannel)

Facoltativo. Il canale di similarità semantica da utilizzare per la valutazione.

Campo unione _semantic_similarity_success_threshold.

_semantic_similarity_success_threshold può essere solo uno dei seguenti tipi:

semanticSimilaritySuccessThreshold

integer

Facoltativo. La soglia di successo per la somiglianza semantica. Deve essere un numero intero compreso tra 0 e 4. Il valore predefinito è >= 3.

Campo unione _overall_tool_invocation_correctness_threshold.

_overall_tool_invocation_correctness_threshold può essere solo uno dei seguenti tipi:

overallToolInvocationCorrectnessThreshold

number

Facoltativo. La soglia di successo per la correttezza complessiva dell'invocazione dello strumento. Deve essere un numero in virgola mobile compreso tra 0 e 1. Il valore predefinito è 1.0.

ExpectationLevelMetricsThresholds

Rappresentazione JSON

{

  // Union field _tool_invocation_parameter_correctness_threshold can be only one
  // of the following:
  "toolInvocationParameterCorrectnessThreshold": number
  // End of list of possible types for union field
  // _tool_invocation_parameter_correctness_threshold.
}

Campi

Campo unione _tool_invocation_parameter_correctness_threshold.

_tool_invocation_parameter_correctness_threshold può essere solo uno dei seguenti tipi:

toolInvocationParameterCorrectnessThreshold

number

Facoltativo. La soglia di successo per la correttezza dei parametri di chiamata dei singoli strumenti. Deve essere un numero in virgola mobile compreso tra 0 e 1. Il valore predefinito è 1.0.

ToolMatchingSettings

Rappresentazione JSON
{ "extraToolCallBehavior": enum (`ExtraToolCallBehavior`) }

Campi

extraToolCallBehavior

enum (ExtraToolCallBehavior)

Facoltativo. Comportamento per le chiamate di strumenti aggiuntivi. Il valore predefinito è FAIL.

EvaluationConfig

Rappresentazione JSON

{
  "inputAudioConfig": {
    object (InputAudioConfig)
  },
  "outputAudioConfig": {
    object (OutputAudioConfig)
  },
  "evaluationChannel": enum (EvaluationChannel),
  "toolCallBehaviour": enum (EvaluationToolCallBehaviour)
}

Campi
`inputAudioConfig (deprecated)`	`object (InputAudioConfig)` Questo elemento è deprecato. Facoltativo. Configurazione per l'elaborazione dell'audio di input.
`outputAudioConfig (deprecated)`	`object (OutputAudioConfig)` Questo elemento è deprecato. Facoltativo. Configurazione per la generazione dell'audio di output.
`evaluationChannel`	`enum (EvaluationChannel)` Facoltativo. Il canale da valutare.
`toolCallBehaviour`	`enum (EvaluationToolCallBehaviour)` Facoltativo. Specifica se la valutazione deve utilizzare chiamate di strumenti reali o fittizi.

InputAudioConfig

Rappresentazione JSON
{ "audioEncoding": enum (`AudioEncoding`), "sampleRateHertz": integer, "noiseSuppressionLevel": string }

Campi

audioEncoding

enum (AudioEncoding)

Obbligatorio. La codifica dei dati audio di input.

sampleRateHertz

integer

Obbligatorio. La frequenza di campionamento (in hertz) dei dati audio di input.

noiseSuppressionLevel

string

Facoltativo. Indica se attivare la soppressione del rumore nell'audio di input. I valori disponibili sono "low", "moderate", "high", "very_high".

OutputAudioConfig

Rappresentazione JSON
{ "audioEncoding": enum (`AudioEncoding`), "sampleRateHertz": integer }

Campi

audioEncoding

enum (AudioEncoding)

Obbligatorio. La codifica dei dati audio di output.

sampleRateHertz

integer

Obbligatorio. La frequenza di campionamento (in hertz) dei dati audio di output.

Annotazioni dello strumento

Suggerimento distruttivo: ❌ | Suggerimento idempotente: ❌ | Suggerimento di sola lettura: ❌ | Suggerimento open world: ❌

MCP Tools Reference: ces.googleapis.com Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Strumento: create_evaluation

Schema di input

CreateEvaluationRequest

Valutazione

Golden

GoldenTurn

Passaggio

SessionInput

ToolResponses

ToolResponse

ToolsetTool

Struct

FieldsEntry

Valore

ListValue

Immagine

Blob

Evento

AgentTransfer

GoldenExpectation

ToolCall

Messaggio

Chunk

Timestamp

Intervallo

Durata

Scenario

UserFact

ScenarioExpectation

ToolExpectation

AggregatedMetrics

MetricsByAppVersion

ToolMetrics

SemanticSimilarityMetrics

HallucinationMetrics

ToolCallLatencyMetrics

TurnLatencyMetrics

MetricsByTurn

EvaluationResult

GoldenResult

TurnReplayResult

GoldenExpectationOutcome

SemanticSimilarityResult

ToolInvocationResult

HallucinationResult

ToolCallLatency

OverallToolInvocationResult

EvaluationErrorInfo

SpanLatency

EvaluationExpectationResult

ScenarioResult

ScenarioExpectationOutcome

ObservedToolCall

ScenarioRubricOutcome

TaskCompletionResult

UserGoalSatisfactionResult

EvaluationPersona

SpeechConfig

Stato

Qualsiasi

EvaluationMetricsThresholds

GoldenEvaluationMetricsThresholds

TurnLevelMetricsThresholds

ExpectationLevelMetricsThresholds

ToolMatchingSettings

EvaluationConfig

InputAudioConfig

OutputAudioConfig

Schema di output

Valutazione

Golden

GoldenTurn

Passaggio

SessionInput

ToolResponses

ToolResponse

ToolsetTool

Struct

FieldsEntry

MCP Tools Reference: ces.googleapis.com

Strumento: `create_evaluation`