Ferramenta: create_evaluation
Cria uma nova avaliação.
O exemplo a seguir demonstra como usar curl para invocar a ferramenta create_evaluation MCP.
| Solicitação curl |
|---|
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "create_evaluation", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
Esquema de entrada
Mensagem de solicitação para EvaluationService.CreateEvaluation.
CreateEvaluationRequest
| Representação JSON |
|---|
{
"parent": string,
"evaluationId": string,
"evaluation": {
object ( |
| Campos | |
|---|---|
parent |
Obrigatório. O app para criar a avaliação. Formato: |
evaluationId |
Opcional. O ID a ser usado na avaliação, que se tornará o componente final do nome do recurso da avaliação. Se não for fornecido, um ID exclusivo será atribuído automaticamente à avaliação. |
evaluation |
Obrigatório. A avaliação a ser criada. |
Avaliação
| Representação JSON |
|---|
{ "name": string, "displayName": string, "description": string, "tags": [ string ], "evaluationDatasets": [ string ], "createTime": string, "createdBy": string, "updateTime": string, "lastUpdatedBy": string, "evaluationRuns": [ string ], "etag": string, "aggregatedMetrics": { object ( |
| Campos | |
|---|---|
name |
Identificador. O identificador exclusivo desta avaliação. Formato: |
displayName |
Obrigatório. Nome de exibição da avaliação definido pelo usuário. Exclusivo em um app. |
description |
Opcional. Descrição da avaliação definida pelo usuário. |
tags[] |
Opcional. Tags definidas pelo usuário para categorizar a avaliação. |
evaluationDatasets[] |
Apenas saída. Lista de conjuntos de dados de avaliação a que a avaliação pertence. Formato: |
createTime |
Apenas saída. Carimbo de data/hora em que a avaliação foi criada. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
createdBy |
Apenas saída. O usuário que criou a avaliação. |
updateTime |
Apenas saída. Carimbo de data/hora da última atualização da avaliação. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
lastUpdatedBy |
Apenas saída. O usuário que atualizou a avaliação por último. |
evaluationRuns[] |
Apenas saída. As EvaluationRuns associadas a esta avaliação. |
etag |
Apenas saída. Etag usada para garantir que o objeto não mudou durante uma operação de leitura-modificação-gravação. Se a ETag estiver vazia, a atualização vai substituir todas as mudanças simultâneas. |
aggregatedMetrics |
Apenas saída. As métricas agregadas dessa avaliação em todas as execuções. |
lastCompletedResult |
Apenas saída. O resultado mais recente da avaliação. |
invalid |
Apenas saída. Se a avaliação é inválida. Isso pode acontecer se uma avaliação estiver fazendo referência a uma ferramenta, um conjunto de ferramentas ou um agente que foi excluído. |
lastTenResults[] |
Apenas saída. Os últimos 10 resultados da avaliação. Isso só será preenchido se include_last_ten_results estiver definido como "true" em ListEvaluationsRequest ou GetEvaluationRequest. |
Campo de união inputs. As entradas para a avaliação inputs podem ser apenas uma das seguintes opções: |
|
golden |
Opcional. As etapas de referência a serem avaliadas. |
scenario |
Opcional. A configuração de um cenário. |
Dourado
| Representação JSON |
|---|
{
"turns": [
{
object ( |
| Campos | |
|---|---|
turns[] |
Obrigatório. As rodadas de ouro necessárias para reproduzir uma conversa de ouro. |
evaluationExpectations[] |
Opcional. As expectativas de avaliação para avaliar a conversa reproduzida. Formato: |
GoldenTurn
| Representação JSON |
|---|
{ "steps": [ { object ( |
| Campos | |
|---|---|
steps[] |
Obrigatório. As etapas necessárias para reproduzir uma conversa de ouro. |
rootSpan |
Opcional. O intervalo raiz da resposta de ouro para processar e manter informações de áudio. |
Etapa
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união step. A etapa a ser realizada. step pode ser apenas de um dos tipos a seguir: |
|
userInput |
Opcional. Entrada do usuário para a conversa. |
agentTransfer |
Opcional. Transfira a conversa para outro agente. |
expectation |
Opcional. Executa uma expectativa no turno atual. |
SessionInput
| Representação JSON |
|---|
{ "willContinue": boolean, // Union field |
| Campos | |
|---|---|
willContinue |
Opcional. Uma flag para indicar se a mensagem atual é um fragmento de uma entrada maior na sessão de streaming bidirecional. Quando definido como OBSERVAÇÃO: esse campo não se aplica a entradas de áudio e DTMF, já que elas são sempre processadas automaticamente com base no sinal de encerramento. |
Campo de união input_type. O tipo da entrada. input_type pode ser apenas de um dos tipos a seguir: |
|
text |
Opcional. Dados de texto do usuário final. |
dtmf |
Opcional. Dígitos DTMF do usuário final. |
audio |
Opcional. Dados de áudio do usuário final. Uma string codificada em base64. |
toolResponses |
Opcional. Resultados da execução das chamadas de função do cliente. |
image |
Opcional. Dados de imagem do usuário final. |
blob |
Opcional. Dados de blob do usuário final. |
variables |
Opcional. Variáveis contextuais da sessão, com chave pelo nome. Somente as variáveis declaradas no app serão usadas pelo agente da CES. Variáveis não reconhecidas ainda serão enviadas ao [agente do Dialogflow][Agent.RemoteDialogflowAgent] como parâmetros de sessão adicionais. |
event |
Opcional. Entrada de evento. |
ToolResponses
| Representação JSON |
|---|
{
"toolResponses": [
{
object ( |
| Campos | |
|---|---|
toolResponses[] |
Opcional. A lista de resultados da execução da ferramenta. |
ToolResponse
| Representação JSON |
|---|
{ "id": string, "displayName": string, "response": { object }, // Union field |
| Campos | |
|---|---|
id |
Opcional. O código correspondente do |
displayName |
Apenas saída. Nome de exibição da ferramenta. |
response |
Obrigatório. O resultado da execução da ferramenta no formato de objeto JSON. Use a chave "output" para especificar a resposta da ferramenta e a chave "error" para especificar os detalhes do erro (se houver). Se as chaves "output" e "error" não forem especificadas, toda a "response" será tratada como resultado da execução da ferramenta. |
Campo de união tool_identifier. O identificador da ferramenta que foi executada. Ela pode ser uma ferramenta persistente ou de um conjunto de ferramentas. tool_identifier pode ser apenas de um dos tipos a seguir: |
|
tool |
Opcional. O nome da ferramenta a ser executada. Formato: |
toolsetTool |
Opcional. A ferramenta do conjunto de ferramentas que foi executada. |
ToolsetTool
| Representação JSON |
|---|
{ "toolset": string, "toolId": string } |
| Campos | |
|---|---|
toolset |
Obrigatório. O nome do recurso do conjunto de ferramentas de que essa ferramenta deriva. Formato: |
toolId |
Opcional. O ID da ferramenta para filtrar as ferramentas e recuperar o esquema. |
Struct
| Representação JSON |
|---|
{ "fields": { string: value, ... } } |
| Campos | |
|---|---|
fields |
Mapa não ordenado de valores com tipagem dinâmica. Um objeto com uma lista de pares |
FieldsEntry
| Representação JSON |
|---|
{ "key": string, "value": value } |
| Campos | |
|---|---|
key |
|
value |
|
Valor
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união kind. O tipo de valor. kind pode ser apenas de um dos tipos a seguir: |
|
nullValue |
Representa um valor nulo. |
numberValue |
Representa um valor double. |
stringValue |
Representa um valor de string. |
boolValue |
Representa um valor booleano. |
structValue |
Representa um valor estruturado. |
listValue |
Representa um |
ListValue
| Representação JSON |
|---|
{ "values": [ value ] } |
| Campos | |
|---|---|
values[] |
Campo repetido de valores digitados dinamicamente. |
Image
| Representação JSON |
|---|
{ "mimeType": string, "data": string } |
| Campos | |
|---|---|
mimeType |
Obrigatório. O tipo MIME padrão da IANA dos dados de origem. Os tipos de imagem compatíveis incluem: * image/png * image/jpeg * image/webp |
data |
Obrigatório. Bytes brutos da imagem. Uma string codificada em base64. |
Blob
| Representação JSON |
|---|
{ "mimeType": string, "data": string } |
| Campos | |
|---|---|
mimeType |
Obrigatório. O tipo MIME padrão da IANA dos dados de origem. |
data |
Obrigatório. Bytes brutos do blob. Uma string codificada em base64. |
Evento
| Representação JSON |
|---|
{ "event": string } |
| Campos | |
|---|---|
event |
Obrigatório. O nome do evento. |
AgentTransfer
| Representação JSON |
|---|
{ "targetAgent": string, "displayName": string } |
| Campos | |
|---|---|
targetAgent |
Obrigatório. O agente para quem a conversa está sendo transferida. O agente vai cuidar da conversa a partir desse ponto. Formato: |
displayName |
Apenas saída. Nome de exibição do agente. |
GoldenExpectation
| Representação JSON |
|---|
{ "note": string, // Union field |
| Campos | |
|---|---|
note |
Opcional. Uma observação para esse requisito, útil ao informar quando verificações específicas falham. Ex.: "Check_Payment_Tool_Called". |
Campo de união condition. A verificação real a ser realizada. condition pode ser apenas de um dos tipos a seguir: |
|
toolCall |
Opcional. Verifique se uma ferramenta específica foi chamada com os parâmetros. |
toolResponse |
Opcional. Verifique se uma ferramenta específica teve a resposta esperada. |
agentResponse |
Opcional. Verifique se o agente respondeu corretamente. A função "agente" está implícita. |
agentTransfer |
Opcional. Verifique se o agente transferiu a conversa para outro agente. |
updatedVariables |
Opcional. Verifique se o agente atualizou as variáveis de sessão para os valores esperados. Usado também para capturar atualizações de variáveis do agente para avaliações de ouro. |
mockToolResponse |
Opcional. A resposta da ferramenta a ser simulada, com os parâmetros de interesse especificados. Os parâmetros não especificados serão alucinados pelo LLM. |
ToolCall
| Representação JSON |
|---|
{ "id": string, "displayName": string, "args": { object }, // Union field |
| Campos | |
|---|---|
id |
Opcional. O identificador exclusivo da chamada de função. Se preenchido, o cliente vai retornar o resultado da execução com o código correspondente em |
displayName |
Apenas saída. Nome de exibição da ferramenta. |
args |
Opcional. Os parâmetros e valores de entrada da ferramenta no formato de objeto JSON. |
Campo de união tool_identifier. O identificador da ferramenta a ser executada. Ela pode ser uma ferramenta persistente ou de um conjunto de ferramentas. tool_identifier pode ser apenas de um dos tipos a seguir: |
|
tool |
Opcional. O nome da ferramenta a ser executada. Formato: |
toolsetTool |
Opcional. A ferramenta do conjunto de ferramentas a ser executada. |
Mensagem
| Representação JSON |
|---|
{
"role": string,
"chunks": [
{
object ( |
| Campos | |
|---|---|
role |
Opcional. A função na conversa, por exemplo, usuário, agente. |
chunks[] |
Opcional. Conteúdo da mensagem como uma série de partes. |
eventTime |
Opcional. Carimbo de data/hora em que a mensagem foi enviada ou recebida. Não pode ser usado se a mensagem fizer parte de um Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
Chunk
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união data. Dados de bloco. data pode ser apenas de um dos tipos a seguir: |
|
text |
Opcional. Dados de texto. |
transcript |
Opcional. Transcrição associada ao áudio. |
blob |
Opcional. Dados de blob. |
payload |
Opcional. Dados de payload personalizados. |
image |
Opcional. Dados da imagem. |
toolCall |
Opcional. Solicitação de execução de ferramenta. |
toolResponse |
Opcional. Resposta de execução da ferramenta. |
agentTransfer |
Opcional. Evento de transferência de agente. |
updatedVariables |
Uma struct representa variáveis que foram atualizadas na conversa, com chaves pelos nomes das variáveis. |
defaultVariables |
Uma struct representa variáveis padrão no início da conversa, com chaves de nomes de variáveis. |
Carimbo de data/hora
| Representação JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Representa os segundos do horário UTC desde a época Unix 1970-01-01T00:00:00Z. Precisa estar entre -62135596800 e 253402300799 (o que corresponde a 0001-01-01T00:00:00Z a 9999-12-31T23:59:59Z). |
nanos |
Frações não negativas de um segundo com resolução de nanossegundos. Esse campo é a parte de nanossegundos da duração, não uma alternativa aos segundos. Os valores de segundos negativos com frações ainda precisam ter valores em nanossegundos não negativos que representam períodos posteriores. O valor precisa ser de 0 a 999.999.999 (inclusive). |
Período
| Representação JSON |
|---|
{
"name": string,
"startTime": string,
"endTime": string,
"duration": string,
"attributes": {
object
},
"childSpans": [
{
object ( |
| Campos | |
|---|---|
name |
Apenas saída. O nome do intervalo. |
startTime |
Apenas saída. O horário de início do intervalo. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
endTime |
Apenas saída. O horário de término do período. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
duration |
Apenas saída. A duração do período. Duração em segundos com até nove dígitos fracionários, terminando em " |
attributes |
Apenas saída. Atributos de chave-valor associados ao intervalo. |
childSpans[] |
Apenas saída. Os intervalos filhos aninhados neste intervalo. |
Duração
| Representação JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Segundos assinados do período. Precisa estar entre -315.576.000.000 e +315.576.000.000 (inclusive). Observação: esses limites são calculados da seguinte forma: 60 s/min * 60 min/h * 24 h/dia * 365,25 dias/ano * 10.000 anos |
nanos |
Frações assinadas de um segundo com resolução de nanossegundos do período. Durações menores que um segundo são representadas com um campo |
Cenário
| Representação JSON |
|---|
{ "task": string, "userFacts": [ { object ( |
| Campos | |
|---|---|
task |
Obrigatório. A tarefa que será afetada pelo cenário. |
userFacts[] |
Opcional. Os fatos do usuário a serem usados pelo cenário. |
maxTurns |
Opcional. O número máximo de turnos a serem simulados. Se não for especificado, a simulação vai continuar até que a tarefa seja concluída. |
rubrics[] |
Obrigatório. As rubricas para pontuar o cenário. |
scenarioExpectations[] |
Obrigatório. O ScenarioExpectations para avaliar a conversa produzida pela simulação do usuário. |
variableOverrides |
Opcional. Variáveis / parâmetros de sessão como contexto para a sessão, com chave pelos nomes das variáveis. Os membros dessa struct vão substituir todos os valores padrão definidos pelo sistema. Esses fatos são diferentes dos fatos do usuário, que são conhecidos por ele. Variáveis são parâmetros conhecidos pelo agente, ou seja, MDN (número de telefone) transmitido pelo sistema de telefonia. |
taskCompletionBehavior |
Opcional. Obsoleto. Use user_goal_behavior. |
userGoalBehavior |
Opcional. O comportamento esperado da meta do usuário. |
evaluationExpectations[] |
Opcional. As expectativas de avaliação para avaliar a conversa produzida pela simulação. Formato: |
UserFact
| Representação JSON |
|---|
{ "name": string, "value": string } |
| Campos | |
|---|---|
name |
Obrigatório. O nome do fato do usuário. |
value |
Obrigatório. O valor do fato do usuário. |
ScenarioExpectation
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união expectation. A expectativa de avaliar a conversa produzida pela simulação. expectation pode ser apenas de um dos tipos a seguir: |
|
toolExpectation |
Opcional. O par de chamada de ferramenta e resposta que será avaliado. |
agentResponse |
Opcional. A resposta do agente a ser avaliada. |
ToolExpectation
| Representação JSON |
|---|
{ "expectedToolCall": { object ( |
| Campos | |
|---|---|
expectedToolCall |
Obrigatório. A chamada de ferramenta esperada, com os parâmetros de interesse especificados. Os parâmetros não especificados serão alucinados pelo LLM. |
mockToolResponse |
Obrigatório. A resposta da ferramenta a ser simulada, com os parâmetros de interesse especificados. Os parâmetros não especificados serão alucinados pelo LLM. |
AggregatedMetrics
| Representação JSON |
|---|
{
"metricsByAppVersion": [
{
object ( |
| Campos | |
|---|---|
metricsByAppVersion[] |
Apenas saída. Métricas agregadas, agrupadas por ID da versão do app. |
MetricsByAppVersion
| Representação JSON |
|---|
{ "appVersionId": string, "toolMetrics": [ { object ( |
| Campos | |
|---|---|
appVersionId |
Apenas saída. O ID da versão do app. |
toolMetrics[] |
Apenas saída. Métricas de cada ferramenta nesta versão do app. |
semanticSimilarityMetrics[] |
Apenas saída. Métricas de similaridade semântica nesta versão do app. |
hallucinationMetrics[] |
Apenas saída. Métricas de alucinação nesta versão do app. |
toolCallLatencyMetrics[] |
Apenas saída. Métricas para latência de chamada de ferramenta nesta versão do app. |
turnLatencyMetrics[] |
Apenas saída. Métricas para latência de turno nesta versão do app. |
passCount |
Apenas saída. O número de vezes que a avaliação foi aprovada. |
failCount |
Apenas saída. O número de vezes que a avaliação falhou. |
metricsByTurn[] |
Apenas saída. Métricas agregadas por turno nessa versão do app. |
ToolMetrics
| Representação JSON |
|---|
{ "tool": string, "passCount": integer, "failCount": integer } |
| Campos | |
|---|---|
tool |
Apenas saída. O nome da ferramenta. |
passCount |
Apenas saída. O número de vezes que a ferramenta foi aprovada. |
failCount |
Apenas saída. O número de vezes que a ferramenta falhou. |
SemanticSimilarityMetrics
| Representação JSON |
|---|
{ "score": number } |
| Campos | |
|---|---|
score |
Apenas saída. A pontuação média de similaridade semântica (0 a 4). |
HallucinationMetrics
| Representação JSON |
|---|
{ "score": number } |
| Campos | |
|---|---|
score |
Apenas saída. A pontuação média de alucinação (0 a 1). |
ToolCallLatencyMetrics
| Representação JSON |
|---|
{ "tool": string, "averageLatency": string } |
| Campos | |
|---|---|
tool |
Apenas saída. O nome da ferramenta. |
averageLatency |
Apenas saída. A latência média das chamadas de ferramenta. Duração em segundos com até nove dígitos fracionários, terminando em " |
TurnLatencyMetrics
| Representação JSON |
|---|
{ "averageLatency": string } |
| Campos | |
|---|---|
averageLatency |
Apenas saída. A latência média dos turnos. Duração em segundos com até nove dígitos fracionários, terminando em " |
MetricsByTurn
| Representação JSON |
|---|
{ "turnIndex": integer, "toolMetrics": [ { object ( |
| Campos | |
|---|---|
turnIndex |
Apenas saída. O índice da vez (com base em 0). |
toolMetrics[] |
Apenas saída. Métricas para cada ferramenta nesta rodada. |
semanticSimilarityMetrics[] |
Apenas saída. Métricas de similaridade semântica neste turno. |
hallucinationMetrics[] |
Apenas saída. Métricas para alucinação neste turno. |
toolCallLatencyMetrics[] |
Apenas saída. Métricas para latência de chamada de ferramenta neste turno. |
turnLatencyMetrics[] |
Apenas saída. Métricas de latência do turno. |
EvaluationResult
| Representação JSON |
|---|
{ "name": string, "displayName": string, "createTime": string, "evaluationStatus": enum ( |
| Campos | |
|---|---|
name |
Identificador. O identificador exclusivo do resultado da avaliação. Formato: |
displayName |
Obrigatório. Nome de exibição do resultado da avaliação. Exclusivo em uma avaliação. Por padrão, ele tem o seguinte formato: " |
createTime |
Apenas saída. Carimbo de data/hora em que o resultado da avaliação foi criado. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
evaluationStatus |
Apenas saída. O resultado da avaliação. Preenchido apenas se "execution_state" for "COMPLETE". |
evaluationRun |
Apenas saída. A execução da avaliação que gerou esse resultado. Formato: |
persona |
Apenas saída. A persona usada para gerar a conversa do resultado da avaliação. |
errorInfo |
Apenas saída. Informações de erro para o resultado da avaliação. |
error |
Apenas saída. Descontinuado: use |
initiatedBy |
Apenas saída. O usuário que iniciou a execução da avaliação que resultou neste resultado. |
appVersion |
Apenas saída. A versão do app usada para gerar a conversa que resultou nesse resultado. Formato: |
appVersionDisplayName |
Apenas saída. O nome de exibição do |
changelog |
Apenas saída. O changelog da versão do app em que a avaliação foi executada. Esse campo é preenchido se o usuário executar a avaliação na versão mais recente/rascunho. |
changelogCreateTime |
Apenas saída. O horário de criação do changelog da versão do app em que a avaliação foi executada. Esse campo é preenchido se o usuário executar a avaliação na versão mais recente/rascunho. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
executionState |
Apenas saída. O estado da execução do resultado da avaliação. |
evaluationMetricsThresholds |
Apenas saída. Os limites de avaliação do resultado. |
config |
Apenas saída. A configuração usada na execução da avaliação que resultou nesse resultado. |
goldenRunMethod |
Apenas saída. O método usado para executar a avaliação de ouro. |
Campo de união result. O resultado da avaliação. Preenchido apenas quando o "execution_state" é "COMPLETED". result pode ser apenas de um dos tipos a seguir: |
|
goldenResult |
Apenas saída. O resultado de uma avaliação de ouro. |
scenarioResult |
Apenas saída. O resultado de uma avaliação de cenário. |
GoldenResult
| Representação JSON |
|---|
{ "turnReplayResults": [ { object ( |
| Campos | |
|---|---|
turnReplayResults[] |
Apenas saída. O resultado da execução de cada turno da conversa de referência. |
evaluationExpectationResults[] |
Apenas saída. Os resultados das expectativas de avaliação. |
TurnReplayResult
| Representação JSON |
|---|
{ "conversation": string, "expectationOutcome": [ { object ( |
| Campos | |
|---|---|
conversation |
Apenas saída. A conversa gerada para essa vez. |
expectationOutcome[] |
Apenas saída. O resultado de cada expectativa. |
hallucinationResult |
Apenas saída. O resultado da verificação de alucinação. |
toolInvocationScore |
Apenas saída. Obsoleto. Use OverallToolInvocationResult. |
turnLatency |
Apenas saída. Duração da vez. Duração em segundos com até nove dígitos fracionários, terminando em " |
toolCallLatencies[] |
Apenas saída. A latência de cada chamada de ferramenta no turno. |
semanticSimilarityResult |
Apenas saída. O resultado da verificação de similaridade semântica. |
overallToolInvocationResult |
Apenas saída. O resultado da verificação geral de invocação da ferramenta. |
errorInfo |
Apenas saída. Informações sobre o erro que ocorreu durante essa interação. |
spanLatencies[] |
Apenas saída. A latência dos períodos na vez. |
Campo de união
|
|
toolOrderedInvocationScore |
Apenas saída. A pontuação geral de invocação ordenada da ferramenta para esta vez. Isso indica a porcentagem geral de ferramentas do turno esperado que foram realmente invocadas na ordem esperada. |
GoldenExpectationOutcome
| Representação JSON |
|---|
{ "expectation": { object ( |
| Campos | |
|---|---|
expectation |
Apenas saída. A expectativa que foi avaliada. |
outcome |
Apenas saída. O resultado da expectativa. |
semanticSimilarityResult |
Apenas saída. O resultado da verificação de similaridade semântica. |
toolInvocationResult |
Apenas saída. O resultado da verificação de invocação da ferramenta. |
Campo de união result. O resultado da expectativa. result pode ser apenas de um dos tipos a seguir: |
|
observedToolCall |
Apenas saída. O resultado da expectativa de chamada de função. |
observedToolResponse |
Apenas saída. O resultado da expectativa de resposta da ferramenta. |
observedAgentResponse |
Apenas saída. O resultado da expectativa de resposta do agente. |
observedAgentTransfer |
Apenas saída. O resultado da expectativa de transferência do agente. |
SemanticSimilarityResult
| Representação JSON |
|---|
{ "label": string, "explanation": string, "outcome": enum ( |
| Campos | |
|---|---|
label |
Apenas saída. O rótulo associado a cada pontuação. Pontuação 4: totalmente consistente; Pontuação 3: quase totalmente consistente; Pontuação 2: parcialmente consistente (pequenas omissões); Pontuação 1: muito inconsistente (grandes omissões); Pontuação 0: completamente inconsistente / contraditória |
explanation |
Apenas saída. A explicação da pontuação de semelhança semântica. |
outcome |
Apenas saída. O resultado da verificação de similaridade semântica. Isso é determinado comparando a pontuação com o semantic_similarity_success_threshold. Se a pontuação for igual ou maior que o limite, o resultado será "PASS". Caso contrário, o resultado será FAIL. |
Campo de união
|
|
score |
Apenas saída. A pontuação de similaridade semântica. Pode ser 0, 1, 2, 3 ou 4. |
ToolInvocationResult
| Representação JSON |
|---|
{ "outcome": enum ( |
| Campos | |
|---|---|
outcome |
Apenas saída. O resultado da verificação de invocação da ferramenta. Isso é determinado comparando o parameter_correctness_score ao limite. Se a pontuação for igual ou maior que o limite, o resultado será "PASS". Caso contrário, o resultado será FAIL. |
explanation |
Apenas saída. Uma explicação em texto livre para o resultado da invocação da ferramenta. |
Campo de união
|
|
parameterCorrectnessScore |
Apenas saída. A pontuação de correção do parâmetro de invocação da ferramenta. Isso indica a porcentagem de parâmetros da chamada de ferramenta esperada que também estavam presentes na chamada de ferramenta real. |
HallucinationResult
| Representação JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Apenas saída. O rótulo associado a cada pontuação. Pontuação 1: justificada. Pontuação 0: não justificada. Pontuação -1: nenhuma declaração para avaliar. |
explanation |
Apenas saída. A explicação da pontuação de alucinação. |
Campo de união
|
|
score |
Apenas saída. A pontuação de alucinação. Pode ser -1, 0 ou 1. |
ToolCallLatency
| Representação JSON |
|---|
{ "tool": string, "displayName": string, "startTime": string, "endTime": string, "executionLatency": string } |
| Campos | |
|---|---|
tool |
Apenas saída. O nome da ferramenta que foi executada. Formato: |
displayName |
Apenas saída. O nome de exibição da ferramenta. |
startTime |
Apenas saída. O horário de início da execução da chamada de função. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
endTime |
Apenas saída. O horário de término da execução da chamada de função. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
executionLatency |
Apenas saída. A latência da execução da chamada de ferramenta. Duração em segundos com até nove dígitos fracionários, terminando em " |
OverallToolInvocationResult
| Representação JSON |
|---|
{ "outcome": enum ( |
| Campos | |
|---|---|
outcome |
Apenas saída. O resultado da verificação de invocação da ferramenta. Isso é determinado comparando o tool_invocation_score com o overall_tool_invocation_correctness_threshold. Se a pontuação for igual ou maior que o limite, o resultado será "PASS". Caso contrário, o resultado será FAIL. |
Campo de união
|
|
toolInvocationScore |
A pontuação geral de invocação da ferramenta para esta vez. Isso indica a porcentagem geral de ferramentas do turno esperado que foram realmente invocadas. |
EvaluationErrorInfo
| Representação JSON |
|---|
{
"errorType": enum ( |
| Campos | |
|---|---|
errorType |
Apenas saída. O tipo de erro. |
errorMessage |
Apenas saída. A mensagem de erro. |
sessionId |
Apenas saída. O ID da sessão da conversa que causou o erro. |
SpanLatency
| Representação JSON |
|---|
{ "type": enum ( |
| Campos | |
|---|---|
type |
Apenas saída. O tipo de intervalo. |
displayName |
Apenas saída. O nome de exibição do intervalo. Aplicável a intervalos de ferramentas e proteções. |
startTime |
Apenas saída. O horário de início do intervalo. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
endTime |
Apenas saída. O horário de término do período. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
executionLatency |
Apenas saída. A latência do período. Duração em segundos com até nove dígitos fracionários, terminando em " |
Campo de união identifier. O identificador do item específico com base no tipo dele. identifier pode ser apenas de um dos tipos a seguir: |
|
resource |
Apenas saída. O nome do recurso dos intervalos de proteção ou ferramenta. |
toolset |
Apenas saída. O identificador da ferramenta do conjunto de ferramentas. |
model |
Apenas saída. O nome do intervalo do LLM. |
callback |
Apenas saída. O nome do intervalo de retorno de chamada do usuário. |
EvaluationExpectationResult
| Representação JSON |
|---|
{
"evaluationExpectation": string,
"prompt": string,
"outcome": enum ( |
| Campos | |
|---|---|
evaluationExpectation |
Apenas saída. A expectativa de avaliação. Formato: |
prompt |
Apenas saída. O comando usado para a avaliação. |
outcome |
Apenas saída. O resultado da expectativa de avaliação. |
explanation |
Apenas saída. A explicação do resultado. |
ScenarioResult
| Representação JSON |
|---|
{ "conversation": string, "task": string, "userFacts": [ { object ( |
| Campos | |
|---|---|
conversation |
Apenas saída. A conversa gerada no cenário. |
task |
Apenas saída. A tarefa usada ao executar o cenário para esse resultado. |
userFacts[] |
Apenas saída. Os fatos do usuário que foram usados pelo cenário para esse resultado. |
expectationOutcomes[] |
Apenas saída. O resultado de cada expectativa. |
rubricOutcomes[] |
Apenas saída. O resultado da rubrica. |
hallucinationResult[] |
Apenas saída. O resultado da verificação de alucinação. Haverá um resultado de alucinação para cada turno na conversa. |
taskCompletionResult |
Apenas saída. O resultado da verificação de conclusão da tarefa. |
toolCallLatencies[] |
Apenas saída. A latência de cada execução de chamada de ferramenta na conversa. |
userGoalSatisfactionResult |
Apenas saída. O resultado da verificação de satisfação da meta do usuário. |
spanLatencies[] |
Apenas saída. A latência dos intervalos na conversa. |
evaluationExpectationResults[] |
Apenas saída. Os resultados das expectativas de avaliação. |
Campo de união
|
|
allExpectationsSatisfied |
Apenas saída. Se todas as expectativas foram atendidas nesta rodada. |
Campo de união
|
|
taskCompleted |
Apenas saída. Indica se a tarefa foi concluída nesta rodada. É uma combinação de todas as expectativas atendidas, sem alucinações e com satisfação da meta do usuário. |
ScenarioExpectationOutcome
| Representação JSON |
|---|
{ "expectation": { object ( |
| Campos | |
|---|---|
expectation |
Apenas saída. A expectativa que foi avaliada. |
outcome |
Apenas saída. O resultado do ScenarioExpectation. |
Campo de união result. O resultado da expectativa. result pode ser apenas de um dos tipos a seguir: |
|
observedToolCall |
Apenas saída. A chamada de ferramenta observada. |
observedAgentResponse |
Apenas saída. A resposta observada do agente. |
ObservedToolCall
| Representação JSON |
|---|
{ "toolCall": { object ( |
| Campos | |
|---|---|
toolCall |
Apenas saída. A chamada de ferramenta observada. |
toolResponse |
Apenas saída. A resposta da ferramenta observada. |
ScenarioRubricOutcome
| Representação JSON |
|---|
{ "rubric": string, "scoreExplanation": string, // Union field |
| Campos | |
|---|---|
rubric |
Apenas saída. A rubrica usada para avaliar a conversa. |
scoreExplanation |
Apenas saída. A resposta do avaliador à rubrica. |
Campo de união
|
|
score |
Apenas saída. A pontuação da conversa em relação à rubrica. |
TaskCompletionResult
| Representação JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Apenas saída. O rótulo associado a cada pontuação. Pontuação 1: tarefa concluída. Pontuação 0: tarefa não concluída. Pontuação -1: meta do usuário indefinida. |
explanation |
Apenas saída. A explicação da pontuação de conclusão da tarefa. |
Campo de união
|
|
score |
Apenas saída. A pontuação de conclusão da tarefa. Pode ser -1, 0 ou 1 |
UserGoalSatisfactionResult
| Representação JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Apenas saída. O rótulo associado a cada pontuação. Pontuação 1: tarefa do usuário concluída. Pontuação 0: tarefa do usuário não concluída. Pontuação -1: tarefa do usuário não especificada. |
explanation |
Apenas saída. A explicação da pontuação de satisfação da tarefa do usuário. |
Campo de união
|
|
score |
Apenas saída. A pontuação de satisfação da tarefa do usuário. Pode ser -1, 0 ou 1. |
EvaluationPersona
| Representação JSON |
|---|
{
"name": string,
"description": string,
"displayName": string,
"personality": string,
"speechConfig": {
object ( |
| Campos | |
|---|---|
name |
Obrigatório. O identificador exclusivo da persona. Formato: |
description |
Opcional. A descrição da persona. |
displayName |
Obrigatório. O nome de exibição da persona. Exclusivo em um app. |
personality |
Obrigatório. Uma instrução para o agente sobre como se comportar na avaliação. |
speechConfig |
Opcional. Configuração de como a persona soa (configurações de TTS). |
SpeechConfig
| Representação JSON |
|---|
{
"speakingRate": number,
"environment": enum ( |
| Campos | |
|---|---|
speakingRate |
Opcional. A velocidade da fala. 1,0 é normal. Valores menores são mais lentos (por exemplo, 0,8), quanto maior, mais rápido (por exemplo, 1.5). Útil para testar como o agente lida com pessoas que falam rápido. |
environment |
Opcional. O ambiente de áudio simulado. |
voiceId |
Opcional. O identificador/sotaque de voz específico a ser usado. Exemplo: "en-US-Wavenet-D" ou "en-GB-Standard-A" |
Status
| Representação JSON |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| Campos | |
|---|---|
code |
O código de status, que precisa ser um valor de enumeração de |
message |
Uma mensagem de erro em inglês para o desenvolvedor. Qualquer mensagem de erro para o usuário precisa ser localizada e enviada no campo |
details[] |
Uma lista de mensagens com os detalhes do erro. Há um conjunto comum de tipos de mensagens para as APIs usarem. Um objeto contendo campos de um tipo arbitrário. Um campo adicional |
Qualquer
| Representação JSON |
|---|
{ "typeUrl": string, "value": string } |
| Campos | |
|---|---|
typeUrl |
Identifica o tipo da mensagem Protobuf serializada com uma referência de URI que consiste em um prefixo que termina em uma barra e o nome de tipo totalmente qualificado. Exemplo: type.googleapis.com/google.protobuf.StringValue Essa string precisa conter pelo menos um caractere O prefixo é arbitrário, e as implementações do Protobuf devem remover tudo até o último Todas as strings de URL de tipo precisam ser referências de URI válidas com a restrição adicional (para o formato de texto) de que o conteúdo da referência deve consistir apenas em caracteres alfanuméricos, escapes codificados por porcentagem e caracteres no seguinte conjunto (sem incluir as crases externas): No design original do |
value |
Contém uma serialização Protobuf do tipo descrito por type_url. Uma string codificada em base64. |
EvaluationMetricsThresholds
| Representação JSON |
|---|
{ "goldenEvaluationMetricsThresholds": { object ( |
| Campos | |
|---|---|
goldenEvaluationMetricsThresholds |
Opcional. Os limites das métricas de avaliação de ouro. |
hallucinationMetricBehavior |
Opcional. Descontinuado: use |
goldenHallucinationMetricBehavior |
Opcional. O comportamento da métrica de alucinação para avaliações de ouro. |
scenarioHallucinationMetricBehavior |
Opcional. O comportamento da métrica de alucinação para avaliações de cenário. |
GoldenEvaluationMetricsThresholds
| Representação JSON |
|---|
{ "turnLevelMetricsThresholds": { object ( |
| Campos | |
|---|---|
turnLevelMetricsThresholds |
Opcional. Os limites das métricas no nível da rodada. |
expectationLevelMetricsThresholds |
Opcional. Os limites das métricas de nível de expectativa. |
toolMatchingSettings |
Opcional. As configurações de correspondência de ferramentas. Uma chamada de ferramenta extra é uma chamada de ferramenta presente na execução, mas que não corresponde a nenhuma chamada de ferramenta na expectativa de ouro. |
TurnLevelMetricsThresholds
| Representação JSON |
|---|
{ "semanticSimilarityChannel": enum ( |
| Campos | |
|---|---|
semanticSimilarityChannel |
Opcional. O canal de similaridade semântica a ser usado para avaliação. |
Campo de união
|
|
semanticSimilaritySuccessThreshold |
Opcional. O limite de sucesso para similaridade semântica. O valor precisa ser um número inteiro entre 0 e 4. O padrão é ">= 3". |
Campo de união
|
|
overallToolInvocationCorrectnessThreshold |
Opcional. O limite de sucesso para a correção geral da invocação da ferramenta. Precisa ser um número de ponto flutuante entre 0 e 1. O padrão é 1,0. |
ExpectationLevelMetricsThresholds
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união
|
|
toolInvocationParameterCorrectnessThreshold |
Opcional. O limite de sucesso para a correção de parâmetros de invocação de ferramentas individuais. Precisa ser um número de ponto flutuante entre 0 e 1. O padrão é 1,0. |
ToolMatchingSettings
| Representação JSON |
|---|
{
"extraToolCallBehavior": enum ( |
| Campos | |
|---|---|
extraToolCallBehavior |
Opcional. Comportamento para chamadas de função extras. O padrão é FAIL. |
EvaluationConfig
| Representação JSON |
|---|
{ "inputAudioConfig": { object ( |
| Campos | |
|---|---|
inputAudioConfig |
Opcional. Configuração para processar o áudio de entrada. |
outputAudioConfig |
Opcional. Configuração para gerar o áudio de saída. |
evaluationChannel |
Opcional. O canal a ser avaliado. |
toolCallBehaviour |
Opcional. Especifica se a avaliação deve usar chamadas de ferramentas reais ou falsas. |
InputAudioConfig
| Representação JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obrigatório. A codificação dos dados de áudio de entrada. |
sampleRateHertz |
Obrigatório. A taxa de amostragem (em Hertz) dos dados de áudio de entrada. |
noiseSuppressionLevel |
Opcional. Define se a redução de ruído será ativada no áudio de entrada. Os valores disponíveis são "low", "moderate", "high", "very_high". |
OutputAudioConfig
| Representação JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obrigatório. A codificação dos dados de áudio de saída. |
sampleRateHertz |
Obrigatório. A taxa de amostragem (em Hertz) dos dados de áudio de saída. |
Esquema de saída
Uma avaliação representa todas as informações necessárias para simular e avaliar um agente.
Avaliação
| Representação JSON |
|---|
{ "name": string, "displayName": string, "description": string, "tags": [ string ], "evaluationDatasets": [ string ], "createTime": string, "createdBy": string, "updateTime": string, "lastUpdatedBy": string, "evaluationRuns": [ string ], "etag": string, "aggregatedMetrics": { object ( |
| Campos | |
|---|---|
name |
Identificador. O identificador exclusivo desta avaliação. Formato: |
displayName |
Obrigatório. Nome de exibição da avaliação definido pelo usuário. Exclusivo em um app. |
description |
Opcional. Descrição da avaliação definida pelo usuário. |
tags[] |
Opcional. Tags definidas pelo usuário para categorizar a avaliação. |
evaluationDatasets[] |
Apenas saída. Lista de conjuntos de dados de avaliação a que a avaliação pertence. Formato: |
createTime |
Apenas saída. Carimbo de data/hora em que a avaliação foi criada. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
createdBy |
Apenas saída. O usuário que criou a avaliação. |
updateTime |
Apenas saída. Carimbo de data/hora da última atualização da avaliação. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
lastUpdatedBy |
Apenas saída. O usuário que atualizou a avaliação por último. |
evaluationRuns[] |
Apenas saída. As EvaluationRuns associadas a esta avaliação. |
etag |
Apenas saída. Etag usada para garantir que o objeto não mudou durante uma operação de leitura-modificação-gravação. Se a ETag estiver vazia, a atualização vai substituir todas as mudanças simultâneas. |
aggregatedMetrics |
Apenas saída. As métricas agregadas dessa avaliação em todas as execuções. |
lastCompletedResult |
Apenas saída. O resultado mais recente da avaliação. |
invalid |
Apenas saída. Se a avaliação é inválida. Isso pode acontecer se uma avaliação estiver fazendo referência a uma ferramenta, um conjunto de ferramentas ou um agente que foi excluído. |
lastTenResults[] |
Apenas saída. Os últimos 10 resultados da avaliação. Isso só será preenchido se include_last_ten_results estiver definido como "true" em ListEvaluationsRequest ou GetEvaluationRequest. |
Campo de união inputs. As entradas para a avaliação inputs podem ser apenas uma das seguintes opções: |
|
golden |
Opcional. As etapas de referência a serem avaliadas. |
scenario |
Opcional. A configuração de um cenário. |
Dourado
| Representação JSON |
|---|
{
"turns": [
{
object ( |
| Campos | |
|---|---|
turns[] |
Obrigatório. As rodadas de ouro necessárias para reproduzir uma conversa de ouro. |
evaluationExpectations[] |
Opcional. As expectativas de avaliação para avaliar a conversa reproduzida. Formato: |
GoldenTurn
| Representação JSON |
|---|
{ "steps": [ { object ( |
| Campos | |
|---|---|
steps[] |
Obrigatório. As etapas necessárias para reproduzir uma conversa de ouro. |
rootSpan |
Opcional. O intervalo raiz da resposta de ouro para processar e manter informações de áudio. |
Etapa
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união step. A etapa a ser realizada. step pode ser apenas de um dos tipos a seguir: |
|
userInput |
Opcional. Entrada do usuário para a conversa. |
agentTransfer |
Opcional. Transfira a conversa para outro agente. |
expectation |
Opcional. Executa uma expectativa no turno atual. |
SessionInput
| Representação JSON |
|---|
{ "willContinue": boolean, // Union field |
| Campos | |
|---|---|
willContinue |
Opcional. Uma flag para indicar se a mensagem atual é um fragmento de uma entrada maior na sessão de streaming bidirecional. Quando definido como OBSERVAÇÃO: esse campo não se aplica a entradas de áudio e DTMF, já que elas são sempre processadas automaticamente com base no sinal de encerramento. |
Campo de união input_type. O tipo da entrada. input_type pode ser apenas de um dos tipos a seguir: |
|
text |
Opcional. Dados de texto do usuário final. |
dtmf |
Opcional. Dígitos DTMF do usuário final. |
audio |
Opcional. Dados de áudio do usuário final. Uma string codificada em base64. |
toolResponses |
Opcional. Resultados da execução das chamadas de função do cliente. |
image |
Opcional. Dados de imagem do usuário final. |
blob |
Opcional. Dados de blob do usuário final. |
variables |
Opcional. Variáveis contextuais da sessão, com chave pelo nome. Somente as variáveis declaradas no app serão usadas pelo agente da CES. Variáveis não reconhecidas ainda serão enviadas ao [agente do Dialogflow][Agent.RemoteDialogflowAgent] como parâmetros de sessão adicionais. |
event |
Opcional. Entrada de evento. |
ToolResponses
| Representação JSON |
|---|
{
"toolResponses": [
{
object ( |
| Campos | |
|---|---|
toolResponses[] |
Opcional. A lista de resultados da execução da ferramenta. |
ToolResponse
| Representação JSON |
|---|
{ "id": string, "displayName": string, "response": { object }, // Union field |
| Campos | |
|---|---|
id |
Opcional. O código correspondente do |
displayName |
Apenas saída. Nome de exibição da ferramenta. |
response |
Obrigatório. O resultado da execução da ferramenta no formato de objeto JSON. Use a chave "output" para especificar a resposta da ferramenta e a chave "error" para especificar os detalhes do erro (se houver). Se as chaves "output" e "error" não forem especificadas, toda a "response" será tratada como resultado da execução da ferramenta. |
Campo de união tool_identifier. O identificador da ferramenta que foi executada. Ela pode ser uma ferramenta persistente ou de um conjunto de ferramentas. tool_identifier pode ser apenas de um dos tipos a seguir: |
|
tool |
Opcional. O nome da ferramenta a ser executada. Formato: |
toolsetTool |
Opcional. A ferramenta do conjunto de ferramentas que foi executada. |
ToolsetTool
| Representação JSON |
|---|
{ "toolset": string, "toolId": string } |
| Campos | |
|---|---|
toolset |
Obrigatório. O nome do recurso do conjunto de ferramentas de que essa ferramenta deriva. Formato: |
toolId |
Opcional. O ID da ferramenta para filtrar as ferramentas e recuperar o esquema. |
Struct
| Representação JSON |
|---|
{ "fields": { string: value, ... } } |
| Campos | |
|---|---|
fields |
Mapa não ordenado de valores com tipagem dinâmica. Um objeto com uma lista de pares |
FieldsEntry
| Representação JSON |
|---|
{ "key": string, "value": value } |
| Campos | |
|---|---|
key |
|
value |
|
Valor
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união kind. O tipo de valor. kind pode ser apenas de um dos tipos a seguir: |
|
nullValue |
Representa um valor nulo. |
numberValue |
Representa um valor double. |
stringValue |
Representa um valor de string. |
boolValue |
Representa um valor booleano. |
structValue |
Representa um valor estruturado. |
listValue |
Representa um |
ListValue
| Representação JSON |
|---|
{ "values": [ value ] } |
| Campos | |
|---|---|
values[] |
Campo repetido de valores digitados dinamicamente. |
Image
| Representação JSON |
|---|
{ "mimeType": string, "data": string } |
| Campos | |
|---|---|
mimeType |
Obrigatório. O tipo MIME padrão da IANA dos dados de origem. Os tipos de imagem compatíveis incluem: * image/png * image/jpeg * image/webp |
data |
Obrigatório. Bytes brutos da imagem. Uma string codificada em base64. |
Blob
| Representação JSON |
|---|
{ "mimeType": string, "data": string } |
| Campos | |
|---|---|
mimeType |
Obrigatório. O tipo MIME padrão da IANA dos dados de origem. |
data |
Obrigatório. Bytes brutos do blob. Uma string codificada em base64. |
Evento
| Representação JSON |
|---|
{ "event": string } |
| Campos | |
|---|---|
event |
Obrigatório. O nome do evento. |
AgentTransfer
| Representação JSON |
|---|
{ "targetAgent": string, "displayName": string } |
| Campos | |
|---|---|
targetAgent |
Obrigatório. O agente para quem a conversa está sendo transferida. O agente vai cuidar da conversa a partir desse ponto. Formato: |
displayName |
Apenas saída. Nome de exibição do agente. |
GoldenExpectation
| Representação JSON |
|---|
{ "note": string, // Union field |
| Campos | |
|---|---|
note |
Opcional. Uma observação para esse requisito, útil ao informar quando verificações específicas falham. Ex.: "Check_Payment_Tool_Called". |
Campo de união condition. A verificação real a ser realizada. condition pode ser apenas de um dos tipos a seguir: |
|
toolCall |
Opcional. Verifique se uma ferramenta específica foi chamada com os parâmetros. |
toolResponse |
Opcional. Verifique se uma ferramenta específica teve a resposta esperada. |
agentResponse |
Opcional. Verifique se o agente respondeu corretamente. A função "agente" está implícita. |
agentTransfer |
Opcional. Verifique se o agente transferiu a conversa para outro agente. |
updatedVariables |
Opcional. Verifique se o agente atualizou as variáveis de sessão para os valores esperados. Usado também para capturar atualizações de variáveis do agente para avaliações de ouro. |
mockToolResponse |
Opcional. A resposta da ferramenta a ser simulada, com os parâmetros de interesse especificados. Os parâmetros não especificados serão alucinados pelo LLM. |
ToolCall
| Representação JSON |
|---|
{ "id": string, "displayName": string, "args": { object }, // Union field |
| Campos | |
|---|---|
id |
Opcional. O identificador exclusivo da chamada de função. Se preenchido, o cliente vai retornar o resultado da execução com o código correspondente em |
displayName |
Apenas saída. Nome de exibição da ferramenta. |
args |
Opcional. Os parâmetros e valores de entrada da ferramenta no formato de objeto JSON. |
Campo de união tool_identifier. O identificador da ferramenta a ser executada. Ela pode ser uma ferramenta persistente ou de um conjunto de ferramentas. tool_identifier pode ser apenas de um dos tipos a seguir: |
|
tool |
Opcional. O nome da ferramenta a ser executada. Formato: |
toolsetTool |
Opcional. A ferramenta do conjunto de ferramentas a ser executada. |
Mensagem
| Representação JSON |
|---|
{
"role": string,
"chunks": [
{
object ( |
| Campos | |
|---|---|
role |
Opcional. A função na conversa, por exemplo, usuário, agente. |
chunks[] |
Opcional. Conteúdo da mensagem como uma série de partes. |
eventTime |
Opcional. Carimbo de data/hora em que a mensagem foi enviada ou recebida. Não pode ser usado se a mensagem fizer parte de um Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
Chunk
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união data. Dados de bloco. data pode ser apenas de um dos tipos a seguir: |
|
text |
Opcional. Dados de texto. |
transcript |
Opcional. Transcrição associada ao áudio. |
blob |
Opcional. Dados de blob. |
payload |
Opcional. Dados de payload personalizados. |
image |
Opcional. Dados da imagem. |
toolCall |
Opcional. Solicitação de execução de ferramenta. |
toolResponse |
Opcional. Resposta de execução da ferramenta. |
agentTransfer |
Opcional. Evento de transferência de agente. |
updatedVariables |
Uma struct representa variáveis que foram atualizadas na conversa, com chaves pelos nomes das variáveis. |
defaultVariables |
Uma struct representa variáveis padrão no início da conversa, com chaves de nomes de variáveis. |
Carimbo de data/hora
| Representação JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Representa os segundos do horário UTC desde a época Unix 1970-01-01T00:00:00Z. Precisa estar entre -62135596800 e 253402300799 (o que corresponde a 0001-01-01T00:00:00Z a 9999-12-31T23:59:59Z). |
nanos |
Frações não negativas de um segundo com resolução de nanossegundos. Esse campo é a parte de nanossegundos da duração, não uma alternativa aos segundos. Os valores de segundos negativos com frações ainda precisam ter valores em nanossegundos não negativos que representam períodos posteriores. O valor precisa ser de 0 a 999.999.999 (inclusive). |
Período
| Representação JSON |
|---|
{
"name": string,
"startTime": string,
"endTime": string,
"duration": string,
"attributes": {
object
},
"childSpans": [
{
object ( |
| Campos | |
|---|---|
name |
Apenas saída. O nome do intervalo. |
startTime |
Apenas saída. O horário de início do intervalo. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
endTime |
Apenas saída. O horário de término do período. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
duration |
Apenas saída. A duração do período. Duração em segundos com até nove dígitos fracionários, terminando em " |
attributes |
Apenas saída. Atributos de chave-valor associados ao intervalo. |
childSpans[] |
Apenas saída. Os intervalos filhos aninhados neste intervalo. |
Duração
| Representação JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Campos | |
|---|---|
seconds |
Segundos assinados do período. Precisa estar entre -315.576.000.000 e +315.576.000.000 (inclusive). Observação: esses limites são calculados da seguinte forma: 60 s/min * 60 min/h * 24 h/dia * 365,25 dias/ano * 10.000 anos |
nanos |
Frações assinadas de um segundo com resolução de nanossegundos do período. Durações menores que um segundo são representadas com um campo |
Cenário
| Representação JSON |
|---|
{ "task": string, "userFacts": [ { object ( |
| Campos | |
|---|---|
task |
Obrigatório. A tarefa que será afetada pelo cenário. |
userFacts[] |
Opcional. Os fatos do usuário a serem usados pelo cenário. |
maxTurns |
Opcional. O número máximo de turnos a serem simulados. Se não for especificado, a simulação vai continuar até que a tarefa seja concluída. |
rubrics[] |
Obrigatório. As rubricas para pontuar o cenário. |
scenarioExpectations[] |
Obrigatório. O ScenarioExpectations para avaliar a conversa produzida pela simulação do usuário. |
variableOverrides |
Opcional. Variáveis / parâmetros de sessão como contexto para a sessão, com chave pelos nomes das variáveis. Os membros dessa struct vão substituir todos os valores padrão definidos pelo sistema. Esses fatos são diferentes dos fatos do usuário, que são conhecidos por ele. Variáveis são parâmetros conhecidos pelo agente, ou seja, MDN (número de telefone) transmitido pelo sistema de telefonia. |
taskCompletionBehavior |
Opcional. Obsoleto. Use user_goal_behavior. |
userGoalBehavior |
Opcional. O comportamento esperado da meta do usuário. |
evaluationExpectations[] |
Opcional. As expectativas de avaliação para avaliar a conversa produzida pela simulação. Formato: |
UserFact
| Representação JSON |
|---|
{ "name": string, "value": string } |
| Campos | |
|---|---|
name |
Obrigatório. O nome do fato do usuário. |
value |
Obrigatório. O valor do fato do usuário. |
ScenarioExpectation
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união expectation. A expectativa de avaliar a conversa produzida pela simulação. expectation pode ser apenas de um dos tipos a seguir: |
|
toolExpectation |
Opcional. O par de chamada de ferramenta e resposta que será avaliado. |
agentResponse |
Opcional. A resposta do agente a ser avaliada. |
ToolExpectation
| Representação JSON |
|---|
{ "expectedToolCall": { object ( |
| Campos | |
|---|---|
expectedToolCall |
Obrigatório. A chamada de ferramenta esperada, com os parâmetros de interesse especificados. Os parâmetros não especificados serão alucinados pelo LLM. |
mockToolResponse |
Obrigatório. A resposta da ferramenta a ser simulada, com os parâmetros de interesse especificados. Os parâmetros não especificados serão alucinados pelo LLM. |
AggregatedMetrics
| Representação JSON |
|---|
{
"metricsByAppVersion": [
{
object ( |
| Campos | |
|---|---|
metricsByAppVersion[] |
Apenas saída. Métricas agregadas, agrupadas por ID da versão do app. |
MetricsByAppVersion
| Representação JSON |
|---|
{ "appVersionId": string, "toolMetrics": [ { object ( |
| Campos | |
|---|---|
appVersionId |
Apenas saída. O ID da versão do app. |
toolMetrics[] |
Apenas saída. Métricas de cada ferramenta nesta versão do app. |
semanticSimilarityMetrics[] |
Apenas saída. Métricas de similaridade semântica nesta versão do app. |
hallucinationMetrics[] |
Apenas saída. Métricas de alucinação nesta versão do app. |
toolCallLatencyMetrics[] |
Apenas saída. Métricas para latência de chamada de ferramenta nesta versão do app. |
turnLatencyMetrics[] |
Apenas saída. Métricas para latência de turno nesta versão do app. |
passCount |
Apenas saída. O número de vezes que a avaliação foi aprovada. |
failCount |
Apenas saída. O número de vezes que a avaliação falhou. |
metricsByTurn[] |
Apenas saída. Métricas agregadas por turno nessa versão do app. |
ToolMetrics
| Representação JSON |
|---|
{ "tool": string, "passCount": integer, "failCount": integer } |
| Campos | |
|---|---|
tool |
Apenas saída. O nome da ferramenta. |
passCount |
Apenas saída. O número de vezes que a ferramenta foi aprovada. |
failCount |
Apenas saída. O número de vezes que a ferramenta falhou. |
SemanticSimilarityMetrics
| Representação JSON |
|---|
{ "score": number } |
| Campos | |
|---|---|
score |
Apenas saída. A pontuação média de similaridade semântica (0 a 4). |
HallucinationMetrics
| Representação JSON |
|---|
{ "score": number } |
| Campos | |
|---|---|
score |
Apenas saída. A pontuação média de alucinação (0 a 1). |
ToolCallLatencyMetrics
| Representação JSON |
|---|
{ "tool": string, "averageLatency": string } |
| Campos | |
|---|---|
tool |
Apenas saída. O nome da ferramenta. |
averageLatency |
Apenas saída. A latência média das chamadas de ferramenta. Duração em segundos com até nove dígitos fracionários, terminando em " |
TurnLatencyMetrics
| Representação JSON |
|---|
{ "averageLatency": string } |
| Campos | |
|---|---|
averageLatency |
Apenas saída. A latência média dos turnos. Duração em segundos com até nove dígitos fracionários, terminando em " |
MetricsByTurn
| Representação JSON |
|---|
{ "turnIndex": integer, "toolMetrics": [ { object ( |
| Campos | |
|---|---|
turnIndex |
Apenas saída. O índice da vez (com base em 0). |
toolMetrics[] |
Apenas saída. Métricas para cada ferramenta nesta rodada. |
semanticSimilarityMetrics[] |
Apenas saída. Métricas de similaridade semântica neste turno. |
hallucinationMetrics[] |
Apenas saída. Métricas para alucinação neste turno. |
toolCallLatencyMetrics[] |
Apenas saída. Métricas para latência de chamada de ferramenta neste turno. |
turnLatencyMetrics[] |
Apenas saída. Métricas de latência do turno. |
EvaluationResult
| Representação JSON |
|---|
{ "name": string, "displayName": string, "createTime": string, "evaluationStatus": enum ( |
| Campos | |
|---|---|
name |
Identificador. O identificador exclusivo do resultado da avaliação. Formato: |
displayName |
Obrigatório. Nome de exibição do resultado da avaliação. Exclusivo em uma avaliação. Por padrão, ele tem o seguinte formato: " |
createTime |
Apenas saída. Carimbo de data/hora em que o resultado da avaliação foi criado. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
evaluationStatus |
Apenas saída. O resultado da avaliação. Preenchido apenas se "execution_state" for "COMPLETE". |
evaluationRun |
Apenas saída. A execução da avaliação que gerou esse resultado. Formato: |
persona |
Apenas saída. A persona usada para gerar a conversa do resultado da avaliação. |
errorInfo |
Apenas saída. Informações de erro para o resultado da avaliação. |
error |
Apenas saída. Descontinuado: use |
initiatedBy |
Apenas saída. O usuário que iniciou a execução da avaliação que resultou neste resultado. |
appVersion |
Apenas saída. A versão do app usada para gerar a conversa que resultou nesse resultado. Formato: |
appVersionDisplayName |
Apenas saída. O nome de exibição do |
changelog |
Apenas saída. O changelog da versão do app em que a avaliação foi executada. Esse campo é preenchido se o usuário executar a avaliação na versão mais recente/rascunho. |
changelogCreateTime |
Apenas saída. O horário de criação do changelog da versão do app em que a avaliação foi executada. Esse campo é preenchido se o usuário executar a avaliação na versão mais recente/rascunho. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
executionState |
Apenas saída. O estado da execução do resultado da avaliação. |
evaluationMetricsThresholds |
Apenas saída. Os limites de avaliação do resultado. |
config |
Apenas saída. A configuração usada na execução da avaliação que resultou nesse resultado. |
goldenRunMethod |
Apenas saída. O método usado para executar a avaliação de ouro. |
Campo de união result. O resultado da avaliação. Preenchido apenas quando o "execution_state" é "COMPLETED". result pode ser apenas de um dos tipos a seguir: |
|
goldenResult |
Apenas saída. O resultado de uma avaliação de ouro. |
scenarioResult |
Apenas saída. O resultado de uma avaliação de cenário. |
GoldenResult
| Representação JSON |
|---|
{ "turnReplayResults": [ { object ( |
| Campos | |
|---|---|
turnReplayResults[] |
Apenas saída. O resultado da execução de cada turno da conversa de referência. |
evaluationExpectationResults[] |
Apenas saída. Os resultados das expectativas de avaliação. |
TurnReplayResult
| Representação JSON |
|---|
{ "conversation": string, "expectationOutcome": [ { object ( |
| Campos | |
|---|---|
conversation |
Apenas saída. A conversa gerada para essa vez. |
expectationOutcome[] |
Apenas saída. O resultado de cada expectativa. |
hallucinationResult |
Apenas saída. O resultado da verificação de alucinação. |
toolInvocationScore |
Apenas saída. Obsoleto. Use OverallToolInvocationResult. |
turnLatency |
Apenas saída. Duração da vez. Duração em segundos com até nove dígitos fracionários, terminando em " |
toolCallLatencies[] |
Apenas saída. A latência de cada chamada de ferramenta no turno. |
semanticSimilarityResult |
Apenas saída. O resultado da verificação de similaridade semântica. |
overallToolInvocationResult |
Apenas saída. O resultado da verificação geral de invocação da ferramenta. |
errorInfo |
Apenas saída. Informações sobre o erro que ocorreu durante essa interação. |
spanLatencies[] |
Apenas saída. A latência dos períodos na vez. |
Campo de união
|
|
toolOrderedInvocationScore |
Apenas saída. A pontuação geral de invocação ordenada da ferramenta para esta vez. Isso indica a porcentagem geral de ferramentas do turno esperado que foram realmente invocadas na ordem esperada. |
GoldenExpectationOutcome
| Representação JSON |
|---|
{ "expectation": { object ( |
| Campos | |
|---|---|
expectation |
Apenas saída. A expectativa que foi avaliada. |
outcome |
Apenas saída. O resultado da expectativa. |
semanticSimilarityResult |
Apenas saída. O resultado da verificação de similaridade semântica. |
toolInvocationResult |
Apenas saída. O resultado da verificação de invocação da ferramenta. |
Campo de união result. O resultado da expectativa. result pode ser apenas de um dos tipos a seguir: |
|
observedToolCall |
Apenas saída. O resultado da expectativa de chamada de função. |
observedToolResponse |
Apenas saída. O resultado da expectativa de resposta da ferramenta. |
observedAgentResponse |
Apenas saída. O resultado da expectativa de resposta do agente. |
observedAgentTransfer |
Apenas saída. O resultado da expectativa de transferência do agente. |
SemanticSimilarityResult
| Representação JSON |
|---|
{ "label": string, "explanation": string, "outcome": enum ( |
| Campos | |
|---|---|
label |
Apenas saída. O rótulo associado a cada pontuação. Pontuação 4: totalmente consistente; Pontuação 3: quase totalmente consistente; Pontuação 2: parcialmente consistente (pequenas omissões); Pontuação 1: muito inconsistente (grandes omissões); Pontuação 0: completamente inconsistente / contraditória |
explanation |
Apenas saída. A explicação da pontuação de semelhança semântica. |
outcome |
Apenas saída. O resultado da verificação de similaridade semântica. Isso é determinado comparando a pontuação com o semantic_similarity_success_threshold. Se a pontuação for igual ou maior que o limite, o resultado será "PASS". Caso contrário, o resultado será FAIL. |
Campo de união
|
|
score |
Apenas saída. A pontuação de similaridade semântica. Pode ser 0, 1, 2, 3 ou 4. |
ToolInvocationResult
| Representação JSON |
|---|
{ "outcome": enum ( |
| Campos | |
|---|---|
outcome |
Apenas saída. O resultado da verificação de invocação da ferramenta. Isso é determinado comparando o parameter_correctness_score ao limite. Se a pontuação for igual ou maior que o limite, o resultado será "PASS". Caso contrário, o resultado será FAIL. |
explanation |
Apenas saída. Uma explicação em texto livre para o resultado da invocação da ferramenta. |
Campo de união
|
|
parameterCorrectnessScore |
Apenas saída. A pontuação de correção do parâmetro de invocação da ferramenta. Isso indica a porcentagem de parâmetros da chamada de ferramenta esperada que também estavam presentes na chamada de ferramenta real. |
HallucinationResult
| Representação JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Apenas saída. O rótulo associado a cada pontuação. Pontuação 1: justificada. Pontuação 0: não justificada. Pontuação -1: nenhuma declaração para avaliar. |
explanation |
Apenas saída. A explicação da pontuação de alucinação. |
Campo de união
|
|
score |
Apenas saída. A pontuação de alucinação. Pode ser -1, 0 ou 1. |
ToolCallLatency
| Representação JSON |
|---|
{ "tool": string, "displayName": string, "startTime": string, "endTime": string, "executionLatency": string } |
| Campos | |
|---|---|
tool |
Apenas saída. O nome da ferramenta que foi executada. Formato: |
displayName |
Apenas saída. O nome de exibição da ferramenta. |
startTime |
Apenas saída. O horário de início da execução da chamada de função. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
endTime |
Apenas saída. O horário de término da execução da chamada de função. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
executionLatency |
Apenas saída. A latência da execução da chamada de ferramenta. Duração em segundos com até nove dígitos fracionários, terminando em " |
OverallToolInvocationResult
| Representação JSON |
|---|
{ "outcome": enum ( |
| Campos | |
|---|---|
outcome |
Apenas saída. O resultado da verificação de invocação da ferramenta. Isso é determinado comparando o tool_invocation_score com o overall_tool_invocation_correctness_threshold. Se a pontuação for igual ou maior que o limite, o resultado será "PASS". Caso contrário, o resultado será FAIL. |
Campo de união
|
|
toolInvocationScore |
A pontuação geral de invocação da ferramenta para esta vez. Isso indica a porcentagem geral de ferramentas do turno esperado que foram realmente invocadas. |
EvaluationErrorInfo
| Representação JSON |
|---|
{
"errorType": enum ( |
| Campos | |
|---|---|
errorType |
Apenas saída. O tipo de erro. |
errorMessage |
Apenas saída. A mensagem de erro. |
sessionId |
Apenas saída. O ID da sessão da conversa que causou o erro. |
SpanLatency
| Representação JSON |
|---|
{ "type": enum ( |
| Campos | |
|---|---|
type |
Apenas saída. O tipo de intervalo. |
displayName |
Apenas saída. O nome de exibição do intervalo. Aplicável a intervalos de ferramentas e proteções. |
startTime |
Apenas saída. O horário de início do intervalo. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
endTime |
Apenas saída. O horário de término do período. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
executionLatency |
Apenas saída. A latência do período. Duração em segundos com até nove dígitos fracionários, terminando em " |
Campo de união identifier. O identificador do item específico com base no tipo dele. identifier pode ser apenas de um dos tipos a seguir: |
|
resource |
Apenas saída. O nome do recurso dos intervalos de proteção ou ferramenta. |
toolset |
Apenas saída. O identificador da ferramenta do conjunto de ferramentas. |
model |
Apenas saída. O nome do intervalo do LLM. |
callback |
Apenas saída. O nome do intervalo de retorno de chamada do usuário. |
EvaluationExpectationResult
| Representação JSON |
|---|
{
"evaluationExpectation": string,
"prompt": string,
"outcome": enum ( |
| Campos | |
|---|---|
evaluationExpectation |
Apenas saída. A expectativa de avaliação. Formato: |
prompt |
Apenas saída. O comando usado para a avaliação. |
outcome |
Apenas saída. O resultado da expectativa de avaliação. |
explanation |
Apenas saída. A explicação do resultado. |
ScenarioResult
| Representação JSON |
|---|
{ "conversation": string, "task": string, "userFacts": [ { object ( |
| Campos | |
|---|---|
conversation |
Apenas saída. A conversa gerada no cenário. |
task |
Apenas saída. A tarefa usada ao executar o cenário para esse resultado. |
userFacts[] |
Apenas saída. Os fatos do usuário que foram usados pelo cenário para esse resultado. |
expectationOutcomes[] |
Apenas saída. O resultado de cada expectativa. |
rubricOutcomes[] |
Apenas saída. O resultado da rubrica. |
hallucinationResult[] |
Apenas saída. O resultado da verificação de alucinação. Haverá um resultado de alucinação para cada turno na conversa. |
taskCompletionResult |
Apenas saída. O resultado da verificação de conclusão da tarefa. |
toolCallLatencies[] |
Apenas saída. A latência de cada execução de chamada de ferramenta na conversa. |
userGoalSatisfactionResult |
Apenas saída. O resultado da verificação de satisfação da meta do usuário. |
spanLatencies[] |
Apenas saída. A latência dos intervalos na conversa. |
evaluationExpectationResults[] |
Apenas saída. Os resultados das expectativas de avaliação. |
Campo de união
|
|
allExpectationsSatisfied |
Apenas saída. Se todas as expectativas foram atendidas nesta rodada. |
Campo de união
|
|
taskCompleted |
Apenas saída. Indica se a tarefa foi concluída nesta rodada. É uma combinação de todas as expectativas atendidas, sem alucinações e com satisfação da meta do usuário. |
ScenarioExpectationOutcome
| Representação JSON |
|---|
{ "expectation": { object ( |
| Campos | |
|---|---|
expectation |
Apenas saída. A expectativa que foi avaliada. |
outcome |
Apenas saída. O resultado do ScenarioExpectation. |
Campo de união result. O resultado da expectativa. result pode ser apenas de um dos tipos a seguir: |
|
observedToolCall |
Apenas saída. A chamada de ferramenta observada. |
observedAgentResponse |
Apenas saída. A resposta observada do agente. |
ObservedToolCall
| Representação JSON |
|---|
{ "toolCall": { object ( |
| Campos | |
|---|---|
toolCall |
Apenas saída. A chamada de ferramenta observada. |
toolResponse |
Apenas saída. A resposta da ferramenta observada. |
ScenarioRubricOutcome
| Representação JSON |
|---|
{ "rubric": string, "scoreExplanation": string, // Union field |
| Campos | |
|---|---|
rubric |
Apenas saída. A rubrica usada para avaliar a conversa. |
scoreExplanation |
Apenas saída. A resposta do avaliador à rubrica. |
Campo de união
|
|
score |
Apenas saída. A pontuação da conversa em relação à rubrica. |
TaskCompletionResult
| Representação JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Apenas saída. O rótulo associado a cada pontuação. Pontuação 1: tarefa concluída. Pontuação 0: tarefa não concluída. Pontuação -1: meta do usuário indefinida. |
explanation |
Apenas saída. A explicação da pontuação de conclusão da tarefa. |
Campo de união
|
|
score |
Apenas saída. A pontuação de conclusão da tarefa. Pode ser -1, 0 ou 1 |
UserGoalSatisfactionResult
| Representação JSON |
|---|
{ "label": string, "explanation": string, // Union field |
| Campos | |
|---|---|
label |
Apenas saída. O rótulo associado a cada pontuação. Pontuação 1: tarefa do usuário concluída. Pontuação 0: tarefa do usuário não concluída. Pontuação -1: tarefa do usuário não especificada. |
explanation |
Apenas saída. A explicação da pontuação de satisfação da tarefa do usuário. |
Campo de união
|
|
score |
Apenas saída. A pontuação de satisfação da tarefa do usuário. Pode ser -1, 0 ou 1. |
EvaluationPersona
| Representação JSON |
|---|
{
"name": string,
"description": string,
"displayName": string,
"personality": string,
"speechConfig": {
object ( |
| Campos | |
|---|---|
name |
Obrigatório. O identificador exclusivo da persona. Formato: |
description |
Opcional. A descrição da persona. |
displayName |
Obrigatório. O nome de exibição da persona. Exclusivo em um app. |
personality |
Obrigatório. Uma instrução para o agente sobre como se comportar na avaliação. |
speechConfig |
Opcional. Configuração de como a persona soa (configurações de TTS). |
SpeechConfig
| Representação JSON |
|---|
{
"speakingRate": number,
"environment": enum ( |
| Campos | |
|---|---|
speakingRate |
Opcional. A velocidade da fala. 1,0 é normal. Valores menores são mais lentos (por exemplo, 0,8), quanto maior, mais rápido (por exemplo, 1.5). Útil para testar como o agente lida com pessoas que falam rápido. |
environment |
Opcional. O ambiente de áudio simulado. |
voiceId |
Opcional. O identificador/sotaque de voz específico a ser usado. Exemplo: "en-US-Wavenet-D" ou "en-GB-Standard-A" |
Status
| Representação JSON |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| Campos | |
|---|---|
code |
O código de status, que precisa ser um valor de enumeração de |
message |
Uma mensagem de erro em inglês para o desenvolvedor. Qualquer mensagem de erro para o usuário precisa ser localizada e enviada no campo |
details[] |
Uma lista de mensagens com os detalhes do erro. Há um conjunto comum de tipos de mensagens para as APIs usarem. Um objeto contendo campos de um tipo arbitrário. Um campo adicional |
Qualquer
| Representação JSON |
|---|
{ "typeUrl": string, "value": string } |
| Campos | |
|---|---|
typeUrl |
Identifica o tipo da mensagem Protobuf serializada com uma referência de URI que consiste em um prefixo que termina em uma barra e o nome de tipo totalmente qualificado. Exemplo: type.googleapis.com/google.protobuf.StringValue Essa string precisa conter pelo menos um caractere O prefixo é arbitrário, e as implementações do Protobuf devem remover tudo até o último Todas as strings de URL de tipo precisam ser referências de URI válidas com a restrição adicional (para o formato de texto) de que o conteúdo da referência deve consistir apenas em caracteres alfanuméricos, escapes codificados por porcentagem e caracteres no seguinte conjunto (sem incluir as crases externas): No design original do |
value |
Contém uma serialização Protobuf do tipo descrito por type_url. Uma string codificada em base64. |
EvaluationMetricsThresholds
| Representação JSON |
|---|
{ "goldenEvaluationMetricsThresholds": { object ( |
| Campos | |
|---|---|
goldenEvaluationMetricsThresholds |
Opcional. Os limites das métricas de avaliação de ouro. |
hallucinationMetricBehavior |
Opcional. Descontinuado: use |
goldenHallucinationMetricBehavior |
Opcional. O comportamento da métrica de alucinação para avaliações de ouro. |
scenarioHallucinationMetricBehavior |
Opcional. O comportamento da métrica de alucinação para avaliações de cenário. |
GoldenEvaluationMetricsThresholds
| Representação JSON |
|---|
{ "turnLevelMetricsThresholds": { object ( |
| Campos | |
|---|---|
turnLevelMetricsThresholds |
Opcional. Os limites das métricas no nível da rodada. |
expectationLevelMetricsThresholds |
Opcional. Os limites das métricas de nível de expectativa. |
toolMatchingSettings |
Opcional. As configurações de correspondência de ferramentas. Uma chamada de ferramenta extra é uma chamada de ferramenta presente na execução, mas que não corresponde a nenhuma chamada de ferramenta na expectativa de ouro. |
TurnLevelMetricsThresholds
| Representação JSON |
|---|
{ "semanticSimilarityChannel": enum ( |
| Campos | |
|---|---|
semanticSimilarityChannel |
Opcional. O canal de similaridade semântica a ser usado para avaliação. |
Campo de união
|
|
semanticSimilaritySuccessThreshold |
Opcional. O limite de sucesso para similaridade semântica. O valor precisa ser um número inteiro entre 0 e 4. O padrão é ">= 3". |
Campo de união
|
|
overallToolInvocationCorrectnessThreshold |
Opcional. O limite de sucesso para a correção geral da invocação da ferramenta. Precisa ser um número de ponto flutuante entre 0 e 1. O padrão é 1,0. |
ExpectationLevelMetricsThresholds
| Representação JSON |
|---|
{ // Union field |
| Campos | |
|---|---|
Campo de união
|
|
toolInvocationParameterCorrectnessThreshold |
Opcional. O limite de sucesso para a correção de parâmetros de invocação de ferramentas individuais. Precisa ser um número de ponto flutuante entre 0 e 1. O padrão é 1,0. |
ToolMatchingSettings
| Representação JSON |
|---|
{
"extraToolCallBehavior": enum ( |
| Campos | |
|---|---|
extraToolCallBehavior |
Opcional. Comportamento para chamadas de função extras. O padrão é FAIL. |
EvaluationConfig
| Representação JSON |
|---|
{ "inputAudioConfig": { object ( |
| Campos | |
|---|---|
inputAudioConfig |
Opcional. Configuração para processar o áudio de entrada. |
outputAudioConfig |
Opcional. Configuração para gerar o áudio de saída. |
evaluationChannel |
Opcional. O canal a ser avaliado. |
toolCallBehaviour |
Opcional. Especifica se a avaliação deve usar chamadas de ferramentas reais ou falsas. |
InputAudioConfig
| Representação JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obrigatório. A codificação dos dados de áudio de entrada. |
sampleRateHertz |
Obrigatório. A taxa de amostragem (em Hertz) dos dados de áudio de entrada. |
noiseSuppressionLevel |
Opcional. Define se a redução de ruído será ativada no áudio de entrada. Os valores disponíveis são "low", "moderate", "high", "very_high". |
OutputAudioConfig
| Representação JSON |
|---|
{
"audioEncoding": enum ( |
| Campos | |
|---|---|
audioEncoding |
Obrigatório. A codificação dos dados de áudio de saída. |
sampleRateHertz |
Obrigatório. A taxa de amostragem (em Hertz) dos dados de áudio de saída. |
Anotações de ferramentas
Dica destrutiva: ❌ | Dica idempotente: ❌ | Dica somente leitura: ❌ | Dica de mundo aberto: ❌