工具:update_evaluation
更新指定的評估作業。請務必在輸入內容中傳遞更新遮罩。
下列範例示範如何使用 curl 叫用 update_evaluation MCP 工具。
| Curl 要求 |
|---|
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "update_evaluation", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
輸入內容的結構定義
EvaluationService.UpdateEvaluation 的要求訊息。
UpdateEvaluationRequest
| JSON 表示法 |
|---|
{
"evaluation": {
object ( |
| 欄位 | |
|---|---|
evaluation |
這是必要旗標,要更新的評估。 |
updateMask |
選用。欄位遮罩用於控管要更新的欄位。如果沒有遮罩,系統會更新所有欄位。 這是以半形逗號分隔的完整欄位名稱清單,範例: |
評估
| JSON 表示法 |
|---|
{ "name": string, "displayName": string, "description": string, "tags": [ string ], "evaluationDatasets": [ string ], "createTime": string, "createdBy": string, "updateTime": string, "lastUpdatedBy": string, "evaluationRuns": [ string ], "etag": string, "aggregatedMetrics": { object ( |
| 欄位 | |
|---|---|
name |
ID。這項評估的專屬 ID。格式: |
displayName |
這是必要旗標,使用者定義的評估顯示名稱。不得在應用程式中重複。 |
description |
選用。使用者定義的評估說明。 |
tags[] |
選用。使用者定義的標籤,用於分類評估。 |
evaluationDatasets[] |
僅供輸出。評估所屬的評估資料集清單。格式: |
createTime |
僅供輸出。建立評估作業的時間戳記。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
createdBy |
僅供輸出。建立評估的使用者。 |
updateTime |
僅供輸出。上次更新評估的時間戳記。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
lastUpdatedBy |
僅供輸出。上次更新評估的使用者。 |
evaluationRuns[] |
僅供輸出。與這項評估作業相關聯的 EvaluationRun。 |
etag |
僅供輸出。Etag 用於確保物件在讀取 - 修改 - 寫入作業期間未變更。如果 etag 為空,更新作業會覆寫任何並行變更。 |
aggregatedMetrics |
僅供輸出。所有執行作業的這項評估匯總指標。 |
lastCompletedResult |
僅供輸出。這項評估的最新評估結果。 |
invalid |
僅供輸出。評估是否無效。如果評估作業參照的工具、工具集或代理程式已遭刪除,就會發生這種情況。 |
lastTenResults[] |
僅供輸出。這項評估的最近 10 項評估結果。只有在 ListEvaluationsRequest 或 GetEvaluationRequest 中將 include_last_ten_results 設為 true 時,才會填入這個欄位。 |
聯集欄位 inputs。評估 inputs 的輸入內容只能是下列其中一項: |
|
golden |
選用。要評估的黃金步驟。 |
scenario |
選用。情境的設定。 |
金黃
| JSON 表示法 |
|---|
{
"turns": [
{
object ( |
| 欄位 | |
|---|---|
turns[] |
這是必要旗標,重播黃金對話所需的黃金回合數。 |
evaluationExpectations[] |
選用。評估重新播放對話時的評估期望。格式: |
GoldenTurn
| JSON 表示法 |
|---|
{ "steps": [ { object ( |
| 欄位 | |
|---|---|
steps[] |
這是必要旗標,重播精彩對話的必要步驟。 |
rootSpan |
選用。處理及維護音訊資訊的黃金回合根範圍。 |
步驟
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 step。要執行的步驟。step 只能是下列其中一個設定: |
|
userInput |
選用。對話中輸入的使用者內容。 |
agentTransfer |
選用。將對話轉給其他服務專員。 |
expectation |
選用。在目前回合執行期望。 |
SessionInput
| JSON 表示法 |
|---|
{ "willContinue": boolean, // Union field |
| 欄位 | |
|---|---|
willContinue |
選用。這個旗標用於指出目前訊息是否為雙向串流工作階段中較大輸入內容的片段。 設為 注意:音訊和 DTMF 輸入內容一律會根據終止信號自動處理,因此不適用於這個欄位。 |
聯集欄位 input_type。輸入內容的類型。input_type 只能是下列其中一個設定: |
|
text |
選用。來自使用者的文字資料。 |
dtmf |
選用。來自使用者的 DTMF 數字。 |
audio |
選用。終端使用者的音訊資料。 Base64 編碼字串。 |
toolResponses |
選用。用戶端工具呼叫的執行結果。 |
image |
選用。來自使用者的圖片資料。 |
blob |
選用。來自使用者的 Blob 資料。 |
variables |
選用。工作階段的內容變數,以名稱做為鍵。CES 代理程式只會使用在應用程式中宣告的變數。 無法辨識的變數仍會以額外工作階段參數的形式傳送至 [Dialogflow 代理程式][Agent.RemoteDialogflowAgent]。 |
event |
選用。活動輸入。 |
ToolResponses
| JSON 表示法 |
|---|
{
"toolResponses": [
{
object ( |
| 欄位 | |
|---|---|
toolResponses[] |
選用。工具執行結果清單。 |
ToolResponse
| JSON 表示法 |
|---|
{ "id": string, "displayName": string, "response": { object }, // Union field |
| 欄位 | |
|---|---|
id |
選用。 |
displayName |
僅供輸出。工具的顯示名稱。 |
response |
這是必要旗標,JSON 物件格式的工具執行結果。使用「output」鍵指定工具回應,並使用「error」鍵指定錯誤詳細資料 (如有)。如果未指定「output」和「error」鍵,系統會將整個「response」視為工具執行結果。 |
聯集欄位 tool_identifier。已執行的工具 ID。可以是持續性工具,也可以是工具集中的工具。tool_identifier 只能是下列其中一個設定: |
|
tool |
選用。要執行的工具名稱。格式: |
toolsetTool |
選用。執行的工具集工具。 |
ToolsetTool
| JSON 表示法 |
|---|
{ "toolset": string, "toolId": string } |
| 欄位 | |
|---|---|
toolset |
這是必要旗標,衍生此工具的工具集資源名稱。格式: |
toolId |
選用。用於篩選工具的工具 ID,可擷取結構定義。 |
結構
| JSON 表示法 |
|---|
{ "fields": { string: value, ... } } |
| 欄位 | |
|---|---|
fields |
動態型別值的無序對應。 包含 |
FieldsEntry
| JSON 表示法 |
|---|
{ "key": string, "value": value } |
| 欄位 | |
|---|---|
key |
|
value |
|
值
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 kind。值的類型。kind 只能是下列其中一個設定: |
|
nullValue |
代表空值。 |
numberValue |
表示雙精度浮點數值。 |
stringValue |
代表字串值。 |
boolValue |
表示布林值。 |
structValue |
代表結構化值。 |
listValue |
代表重複的 |
ListValue
| JSON 表示法 |
|---|
{ "values": [ value ] } |
| 欄位 | |
|---|---|
values[] |
動態型別值的重複欄位。 |
圖片
| JSON 表示法 |
|---|
{ "mimeType": string, "data": string } |
| 欄位 | |
|---|---|
mimeType |
這是必要旗標,來源資料的 IANA 標準 MIME 類型。支援的圖片類型包括: * image/png * image/jpeg * image/webp |
data |
這是必要旗標,圖片的原始位元組。 Base64 編碼字串。 |
Blob
| JSON 表示法 |
|---|
{ "mimeType": string, "data": string } |
| 欄位 | |
|---|---|
mimeType |
這是必要旗標,來源資料的 IANA 標準 MIME 類型。 |
data |
這是必要旗標,Blob 的原始位元組。 Base64 編碼字串。 |
事件
| JSON 表示法 |
|---|
{ "event": string } |
| 欄位 | |
|---|---|
event |
這是必要旗標,活動名稱。 |
AgentTransfer
| JSON 表示法 |
|---|
{ "targetAgent": string, "displayName": string } |
| 欄位 | |
|---|---|
targetAgent |
這是必要旗標,要將對話轉移給哪位服務專員。服務專員會接手後續對話。格式: |
displayName |
僅供輸出。代理程式的顯示名稱。 |
GoldenExpectation
| JSON 表示法 |
|---|
{ "note": string, // Union field |
| 欄位 | |
|---|---|
note |
選用。這項要求的附註,有助於在特定檢查失敗時回報。例如:"Check_Payment_Tool_Called". |
聯集欄位 condition。要執行的實際檢查。condition 只能是下列其中一個設定: |
|
toolCall |
選用。確認是否已使用參數呼叫特定工具。 |
toolResponse |
選用。確認特定工具是否提供預期回應。 |
agentResponse |
選用。確認代理程式是否回覆正確內容。「代理商」角色是隱含的。 |
agentTransfer |
選用。確認服務專員已將對話轉給其他服務專員。 |
updatedVariables |
選用。確認代理程式已將工作階段變數更新為預期值。也用於擷取黃金評估的代理程式變數更新。 |
mockToolResponse |
選用。工具模擬回應,並指定感興趣的參數。如果未指定任何參數,LLM 就會產生幻覺。 |
ToolCall
| JSON 表示法 |
|---|
{ "id": string, "displayName": string, "args": { object }, // Union field |
| 欄位 | |
|---|---|
id |
選用。工具呼叫的專屬 ID。如果已填入,用戶端應傳回執行結果,並在 |
displayName |
僅供輸出。工具的顯示名稱。 |
args |
選用。工具的輸入參數和值,採用 JSON 物件格式。 |
聯集欄位 tool_identifier。要執行的工具 ID。可以是持續性工具,也可以是工具集中的工具。tool_identifier 只能是下列其中一個設定: |
|
tool |
選用。要執行的工具名稱。格式: |
toolsetTool |
選用。要執行的工具集工具。 |
訊息
| JSON 表示法 |
|---|
{
"role": string,
"chunks": [
{
object ( |
| 欄位 | |
|---|---|
role |
選用。對話中的角色,例如使用者、代理程式。 |
chunks[] |
選用。訊息內容,以一系列區塊的形式呈現。 |
eventTime |
選用。傳送或接收郵件/訊息時的時間戳記。如果訊息屬於 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
Chunk
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 data。將資料分塊。data 只能是下列其中一個設定: |
|
text |
選用。文字資料。 |
transcript |
選用。與音訊相關的轉錄稿。 |
blob |
選用。Blob 資料。 |
payload |
選用。自訂酬載資料。 |
image |
選用。圖片資料。 |
toolCall |
選用。工具執行要求。 |
toolResponse |
選用。工具執行回應。 |
agentTransfer |
選用。代理程式轉移事件。 |
updatedVariables |
結構體代表對話中更新的變數,並以變數名稱做為鍵。 |
defaultVariables |
結構體代表對話開始時的預設變數,並以變數名稱做為鍵。 |
時間戳記
| JSON 表示法 |
|---|
{ "seconds": string, "nanos": integer } |
| 欄位 | |
|---|---|
seconds |
代表自 Unix 紀元 1970-01-01T00:00:00Z 起算的世界標準時間秒數。必須介於 -62135596800 和 253402300799 之間 (含),對應至 0001-01-01T00:00:00Z 至 9999-12-31T23:59:59Z。 |
nanos |
以奈秒為單位的非負秒數小數。這個欄位是時間長度的奈秒部分,並非秒數的替代值。如果第二個值為負數,且包含分數,奈秒值仍須為非負數,且會向前計時。必須介於 0 至 999,999,999 之間 (含)。 |
時距
| JSON 表示法 |
|---|
{
"name": string,
"startTime": string,
"endTime": string,
"duration": string,
"attributes": {
object
},
"childSpans": [
{
object ( |
| 欄位 | |
|---|---|
name |
僅供輸出。範圍的名稱。 |
startTime |
僅供輸出。時間範圍的開始時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
endTime |
僅供輸出。時間範圍的結束時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
duration |
僅供輸出。時距長度。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
attributes |
僅供輸出。與範圍相關聯的鍵/值屬性。 |
childSpans[] |
僅供輸出。這個範圍下巢狀的子範圍。 |
時間長度
| JSON 表示法 |
|---|
{ "seconds": string, "nanos": integer } |
| 欄位 | |
|---|---|
seconds |
時間範圍的簽署秒數。必須介於 -315,576,000,000 到 +315,576,000,000 之間 (含這兩個值)。注意:這些界限是根據以下公式計算得出:60 秒/分鐘 * 60 分鐘/小時 * 24 小時/天 * 365.25 天/年 * 10000 年 |
nanos |
時間跨度的小數部分 (以奈秒為單位),可為正數或負數。如果時間長度不到一秒,系統會以 0 |
情境
| JSON 表示法 |
|---|
{ "task": string, "userFacts": [ { object ( |
| 欄位 | |
|---|---|
task |
這是必要旗標,情境要鎖定的工作。 |
userFacts[] |
選用。情境要使用的使用者事實。 |
maxTurns |
選用。要模擬的回合數上限。如未指定,模擬作業會持續進行,直到工作完成為止。 |
rubrics[] |
這是必要旗標,用來評估情境的評量表。 |
scenarioExpectations[] |
這是必要旗標,ScenarioExpectations,用於評估使用者模擬產生的對話。 |
variableOverrides |
選用。工作階段的變數 / 工作階段參數,以變數名稱做為鍵。這個結構體的成員會覆寫系統設定的所有預設值。 請注意,這些與使用者事實不同,使用者事實是指使用者已知的事實。變數是服務專員已知的參數,也就是電話系統傳送的 MDN (電話號碼)。 |
taskCompletionBehavior |
選用。已淘汰,請改用 user_goal_behavior。 |
userGoalBehavior |
選用。使用者目標的預期行為。 |
evaluationExpectations[] |
選用。評估模擬對話的預期結果。格式: |
UserFact
| JSON 表示法 |
|---|
{ "name": string, "value": string } |
| 欄位 | |
|---|---|
name |
這是必要旗標,使用者事實的名稱。 |
value |
這是必要旗標,使用者事實的值。 |
ScenarioExpectation
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 expectation。評估模擬產生的對話。expectation 只能是下列其中一個設定: |
|
toolExpectation |
選用。要評估的工具呼叫和回覆配對。 |
agentResponse |
選用。要評估的服務專員回覆。 |
ToolExpectation
| JSON 表示法 |
|---|
{ "expectedToolCall": { object ( |
| 欄位 | |
|---|---|
expectedToolCall |
這是必要旗標,預期工具呼叫,並指定感興趣的參數。如果未指定任何參數,LLM 就會產生幻覺。 |
mockToolResponse |
這是必要旗標,工具模擬回應,並指定感興趣的參數。如果未指定任何參數,LLM 就會產生幻覺。 |
AggregatedMetrics
| JSON 表示法 |
|---|
{
"metricsByAppVersion": [
{
object ( |
| 欄位 | |
|---|---|
metricsByAppVersion[] |
僅供輸出。依應用程式版本 ID 分組的匯總指標。 |
MetricsByAppVersion
| JSON 表示法 |
|---|
{ "appVersionId": string, "toolMetrics": [ { object ( |
| 欄位 | |
|---|---|
appVersionId |
僅供輸出。應用程式版本 ID。 |
toolMetrics[] |
僅供輸出。這個應用程式版本中各項工具的指標。 |
semanticSimilarityMetrics[] |
僅供輸出。這個應用程式版本中的語意相似度指標。 |
hallucinationMetrics[] |
僅供輸出。這個應用程式版本中的錯覺指標。 |
toolCallLatencyMetrics[] |
僅供輸出。這個應用程式版本的工具呼叫延遲指標。 |
turnLatencyMetrics[] |
僅供輸出。這個應用程式版本的輪替延遲指標。 |
passCount |
僅供輸出。評估通過的次數。 |
failCount |
僅供輸出。評估失敗次數。 |
metricsByTurn[] |
僅供輸出。這項應用程式版本中,每個回合的匯總指標。 |
ToolMetrics
| JSON 表示法 |
|---|
{ "tool": string, "passCount": integer, "failCount": integer } |
| 欄位 | |
|---|---|
tool |
僅供輸出。工具名稱。 |
passCount |
僅供輸出。工具通過的次數。 |
failCount |
僅供輸出。工具失敗的次數。 |
SemanticSimilarityMetrics
| JSON 表示法 |
|---|
{ "score": number } |
| 欄位 | |
|---|---|
score |
僅供輸出。平均語意相似度分數 (0 到 4 分)。 |
HallucinationMetrics
| JSON 表示法 |
|---|
{ "score": number } |
| 欄位 | |
|---|---|
score |
僅供輸出。平均錯覺分數 (0 到 1)。 |
ToolCallLatencyMetrics
| JSON 表示法 |
|---|
{ "tool": string, "averageLatency": string } |
| 欄位 | |
|---|---|
tool |
僅供輸出。工具名稱。 |
averageLatency |
僅供輸出。工具呼叫的平均延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
TurnLatencyMetrics
| JSON 表示法 |
|---|
{ "averageLatency": string } |
| 欄位 | |
|---|---|
averageLatency |
僅供輸出。回合的平均延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
MetricsByTurn
| JSON 表示法 |
|---|
{ "turnIndex": integer, "toolMetrics": [ { object ( |
| 欄位 | |
|---|---|
turnIndex |
僅供輸出。回合索引 (從 0 開始)。 |
toolMetrics[] |
僅供輸出。這個回合中各項工具的指標。 |
semanticSimilarityMetrics[] |
僅供輸出。這個回合的語意相似度指標。 |
hallucinationMetrics[] |
僅供輸出。這個回合的錯覺指標。 |
toolCallLatencyMetrics[] |
僅供輸出。這個回合中工具呼叫的延遲時間指標。 |
turnLatencyMetrics[] |
僅供輸出。這個回合的延遲時間指標。 |
EvaluationResult
| JSON 表示法 |
|---|
{ "name": string, "displayName": string, "createTime": string, "evaluationStatus": enum ( |
| 欄位 | |
|---|---|
name |
ID。評估結果的專屬 ID。格式: |
displayName |
這是必要旗標,評估結果的顯示名稱。評估中不得重複。預設格式為「結果 - |
createTime |
僅供輸出。建立評估結果的時間戳記。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
evaluationStatus |
僅供輸出。評估結果。只有在 execution_state 為 COMPLETE 時,才會填入這個欄位。 |
evaluationRun |
僅供輸出。產生這項結果的評估作業。格式: |
persona |
僅供輸出。用於產生對話的虛擬角色,以取得評估結果。 |
errorInfo |
僅供輸出。評估結果的錯誤資訊。 |
error |
僅供輸出。已淘汰:請改用 |
initiatedBy |
僅供輸出。發起評估執行作業的使用者,該作業產生了這項結果。 |
appVersion |
僅供輸出。用於生成對話的應用程式版本,該對話產生了這項結果。格式: |
appVersionDisplayName |
僅供輸出。評估作業所評估的 |
changelog |
僅供輸出。評估作業所用應用程式版本的變更記錄。如果使用者對最新/草稿執行評估,系統就會填入這項資訊。 |
changelogCreateTime |
僅供輸出。評估作業所依據的應用程式版本,其變更記錄的建立時間。如果使用者對最新/草稿執行評估,系統就會填入這項資訊。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
executionState |
僅供輸出。評估結果執行的狀態。 |
evaluationMetricsThresholds |
僅供輸出。結果的評估門檻。 |
config |
僅供輸出。評估執行作業所用的設定,產生了這項結果。 |
goldenRunMethod |
僅供輸出。用來執行黃金評估的方法。 |
聯集欄位 result。評估結果。只有在 execution_state 為 COMPLETED 時才會填入資料。result 只能是下列其中一個設定: |
|
goldenResult |
僅供輸出。黃金評估的結果。 |
scenarioResult |
僅供輸出。情境評估結果。 |
GoldenResult
| JSON 表示法 |
|---|
{ "turnReplayResults": [ { object ( |
| 欄位 | |
|---|---|
turnReplayResults[] |
僅供輸出。執行黃金對話中每個回合的結果。 |
evaluationExpectationResults[] |
僅供輸出。評估期望的結果。 |
TurnReplayResult
| JSON 表示法 |
|---|
{ "conversation": string, "expectationOutcome": [ { object ( |
| 欄位 | |
|---|---|
conversation |
僅供輸出。系統為這個回合生成的對話。 |
expectationOutcome[] |
僅供輸出。各項期望的結果。 |
hallucinationResult |
僅供輸出。幻覺檢查結果。 |
toolInvocationScore |
僅供輸出。已淘汰,請改用 OverallToolInvocationResult。 |
turnLatency |
僅供輸出。回合時間長度。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
toolCallLatencies[] |
僅供輸出。回合中每次工具呼叫的延遲時間。 |
semanticSimilarityResult |
僅供輸出。語意相似度檢查結果。 |
overallToolInvocationResult |
僅供輸出。整體工具叫用檢查的結果。 |
errorInfo |
僅供輸出。這個回合期間發生的錯誤相關資訊。 |
spanLatencies[] |
僅供輸出。回合中時距的延遲時間。 |
聯集欄位
|
|
toolOrderedInvocationScore |
僅供輸出。這個回合的工具呼叫分數。這表示在預期回合中,實際以預期順序叫用工具的整體百分比。 |
GoldenExpectationOutcome
| JSON 表示法 |
|---|
{ "expectation": { object ( |
| 欄位 | |
|---|---|
expectation |
僅供輸出。評估的期望。 |
outcome |
僅供輸出。預期的結果。 |
semanticSimilarityResult |
僅供輸出。語意相似度檢查結果。 |
toolInvocationResult |
僅供輸出。工具叫用檢查結果。 |
聯集欄位 result。預期結果。result 只能是下列其中一個設定: |
|
observedToolCall |
僅供輸出。工具呼叫預期的結果。 |
observedToolResponse |
僅供輸出。工具回應預期的結果。 |
observedAgentResponse |
僅供輸出。代理回覆預期的結果。 |
observedAgentTransfer |
僅供輸出。預期轉移給服務專員的結果。 |
SemanticSimilarityResult
| JSON 表示法 |
|---|
{ "label": string, "explanation": string, "outcome": enum ( |
| 欄位 | |
|---|---|
label |
僅供輸出。與各個分數相關的標籤。分數 4:完全一致 分數 3:大致一致 分數 2:部分一致 (有小部分遺漏) 分數 1:大致不一致 (有大部分遺漏) 分數 0:完全不一致 / 矛盾 |
explanation |
僅供輸出。語意相似度分數的說明。 |
outcome |
僅供輸出。語意相似度檢查結果。這是透過比較分數與 semantic_similarity_success_threshold 來判斷。如果分數等於或高於門檻,結果就會是「通過」。否則結果會是「失敗」。 |
聯集欄位
|
|
score |
僅供輸出。語意相似度分數。可以是 0、1、2、3 或 4。 |
ToolInvocationResult
| JSON 表示法 |
|---|
{ "outcome": enum ( |
| 欄位 | |
|---|---|
outcome |
僅供輸出。工具叫用檢查的結果。這是透過比較 parameter_correctness_score 與門檻來判斷。如果分數等於或高於門檻,結果就會是「通過」。否則結果會是「失敗」。 |
explanation |
僅供輸出。工具呼叫結果的自由文字說明。 |
聯集欄位
|
|
parameterCorrectnessScore |
僅供輸出。工具叫用參數正確度分數。這表示實際工具呼叫中也出現預期工具呼叫的參數百分比。 |
HallucinationResult
| JSON 表示法 |
|---|
{ "label": string, "explanation": string, // Union field |
| 欄位 | |
|---|---|
label |
僅供輸出。與各個分數相關的標籤。分數 1:合理分數 0:不合理分數 -1:沒有可評估的聲明 |
explanation |
僅供輸出。幻覺分數的說明。 |
聯集欄位
|
|
score |
僅供輸出。幻覺分數。可以是 -1、0、1。 |
ToolCallLatency
| JSON 表示法 |
|---|
{ "tool": string, "displayName": string, "startTime": string, "endTime": string, "executionLatency": string } |
| 欄位 | |
|---|---|
tool |
僅供輸出。執行的工具名稱。格式: |
displayName |
僅供輸出。工具的顯示名稱。 |
startTime |
僅供輸出。工具呼叫執行的開始時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
endTime |
僅供輸出。工具呼叫執行的結束時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
executionLatency |
僅供輸出。工具呼叫執行的延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
OverallToolInvocationResult
| JSON 表示法 |
|---|
{ "outcome": enum ( |
| 欄位 | |
|---|---|
outcome |
僅供輸出。工具叫用檢查的結果。這是透過比較 tool_invocation_score 與 overall_tool_invocation_correctness_threshold 來判斷。如果分數等於或高於門檻,結果就會是「通過」。否則結果會是 FAIL。 |
聯集欄位
|
|
toolInvocationScore |
這個回合的整體工具叫用分數。這表示實際叫用工具的百分比,以預期回合為基準。 |
EvaluationErrorInfo
| JSON 表示法 |
|---|
{
"errorType": enum ( |
| 欄位 | |
|---|---|
errorType |
僅供輸出。錯誤類型。 |
errorMessage |
僅供輸出。錯誤訊息。 |
sessionId |
僅供輸出。導致錯誤的對話工作階段 ID。 |
SpanLatency
| JSON 表示法 |
|---|
{ "type": enum ( |
| 欄位 | |
|---|---|
type |
僅供輸出。範圍類型。 |
displayName |
僅供輸出。範圍的顯示名稱。適用於工具和防護機制範圍。 |
startTime |
僅供輸出。時間範圍的開始時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
endTime |
僅供輸出。時間範圍的結束時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
executionLatency |
僅供輸出。時距的延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
聯集欄位 identifier。根據特定項目的類型,該項目的 ID。identifier 只能是下列其中一個設定: |
|
resource |
僅供輸出。防護措施或工具範圍的資源名稱。 |
toolset |
僅供輸出。工具集工具 ID。 |
model |
僅供輸出。LLM 範圍的名稱。 |
callback |
僅供輸出。使用者回呼範圍的名稱。 |
EvaluationExpectationResult
| JSON 表示法 |
|---|
{
"evaluationExpectation": string,
"prompt": string,
"outcome": enum ( |
| 欄位 | |
|---|---|
evaluationExpectation |
僅供輸出。評估預期結果。格式: |
prompt |
僅供輸出。用於評估的提示。 |
outcome |
僅供輸出。評估期望的結果。 |
explanation |
僅供輸出。結果的說明。 |
ScenarioResult
| JSON 表示法 |
|---|
{ "conversation": string, "task": string, "userFacts": [ { object ( |
| 欄位 | |
|---|---|
conversation |
僅供輸出。情境中生成的對話。 |
task |
僅供輸出。執行此結果情境時使用的工作。 |
userFacts[] |
僅供輸出。情境用於此結果的使用者事實。 |
expectationOutcomes[] |
僅供輸出。各項期望的結果。 |
rubricOutcomes[] |
僅供輸出。評分量表的結果。 |
hallucinationResult[] |
僅供輸出。幻覺檢查結果。對話中的每一輪都會有一個幻覺結果。 |
taskCompletionResult |
僅供輸出。工作完成檢查結果。 |
toolCallLatencies[] |
僅供輸出。對話中每次執行工具呼叫的延遲時間。 |
userGoalSatisfactionResult |
僅供輸出。使用者目標達成情況檢查結果。 |
spanLatencies[] |
僅供輸出。對話中跨度的延遲時間。 |
evaluationExpectationResults[] |
僅供輸出。評估期望的結果。 |
聯集欄位
|
|
allExpectationsSatisfied |
僅供輸出。是否滿足此回合的所有期望。 |
聯集欄位
|
|
taskCompleted |
僅供輸出。這回合是否已完成工作。這項指標的計算方式是將所有滿足的期望、沒有錯覺和使用者目標達成率加總。 |
ScenarioExpectationOutcome
| JSON 表示法 |
|---|
{ "expectation": { object ( |
| 欄位 | |
|---|---|
expectation |
僅供輸出。評估的期望。 |
outcome |
僅供輸出。ScenarioExpectation 的結果。 |
聯集欄位 result。預期結果。result 只能是下列其中一個設定: |
|
observedToolCall |
僅供輸出。觀察到的工具呼叫。 |
observedAgentResponse |
僅供輸出。觀察到的代理程式回應。 |
ObservedToolCall
| JSON 表示法 |
|---|
{ "toolCall": { object ( |
| 欄位 | |
|---|---|
toolCall |
僅供輸出。觀察到的工具呼叫。 |
toolResponse |
僅供輸出。觀察到的工具回應。 |
ScenarioRubricOutcome
| JSON 表示法 |
|---|
{ "rubric": string, "scoreExplanation": string, // Union field |
| 欄位 | |
|---|---|
rubric |
僅供輸出。用來評估對話的評量表。 |
scoreExplanation |
僅供輸出。評估者對評分量表的回應。 |
聯集欄位
|
|
score |
僅供輸出。對話的評分量表分數。 |
TaskCompletionResult
| JSON 表示法 |
|---|
{ "label": string, "explanation": string, // Union field |
| 欄位 | |
|---|---|
label |
僅供輸出。與各個分數相關的標籤。分數 1:工作完成 分數 0:工作未完成 分數 -1:使用者目標未定義 |
explanation |
僅供輸出。工作完成分數的說明。 |
聯集欄位
|
|
score |
僅供輸出。工作完成分數。可以是 -1、0、1 |
UserGoalSatisfactionResult
| JSON 表示法 |
|---|
{ "label": string, "explanation": string, // Union field |
| 欄位 | |
|---|---|
label |
僅供輸出。與各個分數相關的標籤。分數 1:使用者任務滿意分數 0:使用者任務不滿意分數 -1:使用者任務未指定 |
explanation |
僅供輸出。使用者工作滿意度分數的說明。 |
聯集欄位
|
|
score |
僅供輸出。使用者工作滿意度分數。可以是 -1、0、1。 |
EvaluationPersona
| JSON 表示法 |
|---|
{
"name": string,
"description": string,
"displayName": string,
"personality": string,
"speechConfig": {
object ( |
| 欄位 | |
|---|---|
name |
這是必要旗標,角色的專屬 ID。格式: |
description |
選用。角色說明。 |
displayName |
這是必要旗標,角色的顯示名稱。應用程式內的專屬識別碼。 |
personality |
這是必要旗標,代理程式在評估期間的行為指示。 |
speechConfig |
選用。設定角色聲音的方式 (文字轉語音設定)。 |
SpeechConfig
| JSON 表示法 |
|---|
{
"speakingRate": number,
"environment": enum ( |
| 欄位 | |
|---|---|
speakingRate |
選用。說話速率。1.0 為正常值。值越低,速度越慢 (例如 0.8),值越高速度越快 (例如 1.5)。適合測試代理程式如何處理說話速度快的人。 |
environment |
選用。模擬音訊環境。 |
voiceId |
選用。要使用的特定語音 ID/口音。例如:「en-US-Wavenet-D」或「en-GB-Standard-A」 |
狀態
| JSON 表示法 |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| 欄位 | |
|---|---|
code |
狀態碼,應為 |
message |
向開發人員顯示的錯誤訊息,應以英文呈現。所有面向使用者的錯誤訊息都應經過本地化,並透過 |
details[] |
包含錯誤詳細資料的訊息清單。這是供 API 使用的一組常用訊息類型。 包含任意類型欄位的物件。額外的 |
不限
| JSON 表示法 |
|---|
{ "typeUrl": string, "value": string } |
| 欄位 | |
|---|---|
typeUrl |
使用 URI 參照識別序列化 Protobuf 訊息的類型,該參照包含以斜線結尾的前置字串和完整合格的類型名稱。 範例:type.googleapis.com/google.protobuf.StringValue 這個字串至少須包含一個 前置字元是任意的,Protobuf 實作項目應會直接去除最後一個 所有型別網址字串都必須是合法的 URI 參照,且參照內容只能包含英數字元、百分比編碼逸出字元,以及下列集合中的字元 (不含外側的反引號): 在 |
value |
保存 type_url 所描述類型的 Protobuf 序列化。 Base64 編碼字串。 |
EvaluationMetricsThresholds
| JSON 表示法 |
|---|
{ "goldenEvaluationMetricsThresholds": { object ( |
| 欄位 | |
|---|---|
goldenEvaluationMetricsThresholds |
選用。黃金評估指標門檻。 |
hallucinationMetricBehavior |
選用。已淘汰:請改用 |
goldenHallucinationMetricBehavior |
選用。黃金評估的幻覺指標行為。 |
scenarioHallucinationMetricBehavior |
選用。情境評估的錯覺指標行為。 |
GoldenEvaluationMetricsThresholds
| JSON 表示法 |
|---|
{ "turnLevelMetricsThresholds": { object ( |
| 欄位 | |
|---|---|
turnLevelMetricsThresholds |
選用。回合層級指標的門檻。 |
expectationLevelMetricsThresholds |
選用。預期等級指標門檻。 |
toolMatchingSettings |
選用。工具比對設定。額外工具呼叫是指執行作業中出現的工具呼叫,但與黃金期望中的任何工具呼叫都不相符。 |
TurnLevelMetricsThresholds
| JSON 表示法 |
|---|
{ "semanticSimilarityChannel": enum ( |
| 欄位 | |
|---|---|
semanticSimilarityChannel |
選用。用於評估的語意相似度管道。 |
聯集欄位
|
|
semanticSimilaritySuccessThreshold |
選用。語意相似度的成功門檻。必須是介於 0 到 4 之間的整數。預設值為 >= 3。 |
聯集欄位
|
|
overallToolInvocationCorrectnessThreshold |
選用。工具整體叫用正確性的成功門檻。必須是介於 0 到 1 之間的浮點數。預設值為 1.0。 |
ExpectationLevelMetricsThresholds
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位
|
|
toolInvocationParameterCorrectnessThreshold |
選用。個別工具叫用參數正確性的成功門檻。必須是介於 0 到 1 之間的浮點數。預設值為 1.0。 |
ToolMatchingSettings
| JSON 表示法 |
|---|
{
"extraToolCallBehavior": enum ( |
| 欄位 | |
|---|---|
extraToolCallBehavior |
選用。額外工具呼叫的行為。預設值為 FAIL。 |
EvaluationConfig
| JSON 表示法 |
|---|
{ "inputAudioConfig": { object ( |
| 欄位 | |
|---|---|
inputAudioConfig |
選用。用於處理輸入音訊的設定。 |
outputAudioConfig |
選用。用於生成輸出音訊的設定。 |
evaluationChannel |
選用。要評估的管道。 |
toolCallBehaviour |
選用。指定評估作業應使用真實工具呼叫或虛擬工具。 |
InputAudioConfig
| JSON 表示法 |
|---|
{
"audioEncoding": enum ( |
| 欄位 | |
|---|---|
audioEncoding |
這是必要旗標,輸入音訊資料的編碼。 |
sampleRateHertz |
這是必要旗標,輸入音訊資料的取樣率 (單位為赫茲)。 |
noiseSuppressionLevel |
選用。是否要對輸入音訊啟用噪音抑制功能。可用的值為「low」、「moderate」、「high」、「very_high」。 |
OutputAudioConfig
| JSON 表示法 |
|---|
{
"audioEncoding": enum ( |
| 欄位 | |
|---|---|
audioEncoding |
這是必要旗標,輸出音訊資料的編碼。 |
sampleRateHertz |
這是必要旗標,輸出音訊資料的取樣率 (單位為赫茲)。 |
FieldMask
| JSON 表示法 |
|---|
{ "paths": [ string ] } |
| 欄位 | |
|---|---|
paths[] |
一組欄位遮罩路徑。 |
輸出內容的結構定義
評估代表模擬及評估代理程式所需的所有資訊。
評估
| JSON 表示法 |
|---|
{ "name": string, "displayName": string, "description": string, "tags": [ string ], "evaluationDatasets": [ string ], "createTime": string, "createdBy": string, "updateTime": string, "lastUpdatedBy": string, "evaluationRuns": [ string ], "etag": string, "aggregatedMetrics": { object ( |
| 欄位 | |
|---|---|
name |
ID。這項評估的專屬 ID。格式: |
displayName |
這是必要旗標,使用者定義的評估顯示名稱。不得在應用程式中重複。 |
description |
選用。使用者定義的評估說明。 |
tags[] |
選用。使用者定義的標籤,用於分類評估。 |
evaluationDatasets[] |
僅供輸出。評估所屬的評估資料集清單。格式: |
createTime |
僅供輸出。建立評估作業的時間戳記。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
createdBy |
僅供輸出。建立評估的使用者。 |
updateTime |
僅供輸出。上次更新評估的時間戳記。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
lastUpdatedBy |
僅供輸出。上次更新評估的使用者。 |
evaluationRuns[] |
僅供輸出。與這項評估作業相關聯的 EvaluationRun。 |
etag |
僅供輸出。Etag 用於確保物件在讀取 - 修改 - 寫入作業期間未變更。如果 etag 為空,更新作業會覆寫任何並行變更。 |
aggregatedMetrics |
僅供輸出。所有執行作業的這項評估匯總指標。 |
lastCompletedResult |
僅供輸出。這項評估的最新評估結果。 |
invalid |
僅供輸出。評估是否無效。如果評估作業參照的工具、工具集或代理程式已遭刪除,就會發生這種情況。 |
lastTenResults[] |
僅供輸出。這項評估的最近 10 項評估結果。只有在 ListEvaluationsRequest 或 GetEvaluationRequest 中將 include_last_ten_results 設為 true 時,才會填入這個欄位。 |
聯集欄位 inputs。評估 inputs 的輸入內容只能是下列其中一項: |
|
golden |
選用。要評估的黃金步驟。 |
scenario |
選用。情境的設定。 |
金黃
| JSON 表示法 |
|---|
{
"turns": [
{
object ( |
| 欄位 | |
|---|---|
turns[] |
這是必要旗標,重播黃金對話所需的黃金回合數。 |
evaluationExpectations[] |
選用。評估重新播放對話時的評估期望。格式: |
GoldenTurn
| JSON 表示法 |
|---|
{ "steps": [ { object ( |
| 欄位 | |
|---|---|
steps[] |
這是必要旗標,重播精彩對話的必要步驟。 |
rootSpan |
選用。處理及維護音訊資訊的黃金回合根範圍。 |
步驟
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 step。要執行的步驟。step 只能是下列其中一個設定: |
|
userInput |
選用。對話中輸入的使用者內容。 |
agentTransfer |
選用。將對話轉給其他服務專員。 |
expectation |
選用。在目前回合執行期望。 |
SessionInput
| JSON 表示法 |
|---|
{ "willContinue": boolean, // Union field |
| 欄位 | |
|---|---|
willContinue |
選用。這個旗標用於指出目前訊息是否為雙向串流工作階段中較大輸入內容的片段。 設為 注意:音訊和 DTMF 輸入內容一律會根據終止信號自動處理,因此不適用於這個欄位。 |
聯集欄位 input_type。輸入內容的類型。input_type 只能是下列其中一個設定: |
|
text |
選用。來自使用者的文字資料。 |
dtmf |
選用。來自使用者的 DTMF 數字。 |
audio |
選用。終端使用者的音訊資料。 Base64 編碼字串。 |
toolResponses |
選用。用戶端工具呼叫的執行結果。 |
image |
選用。來自使用者的圖片資料。 |
blob |
選用。來自使用者的 Blob 資料。 |
variables |
選用。工作階段的內容變數,以名稱做為鍵。CES 代理程式只會使用在應用程式中宣告的變數。 無法辨識的變數仍會以額外工作階段參數的形式傳送至 [Dialogflow 代理程式][Agent.RemoteDialogflowAgent]。 |
event |
選用。活動輸入。 |
ToolResponses
| JSON 表示法 |
|---|
{
"toolResponses": [
{
object ( |
| 欄位 | |
|---|---|
toolResponses[] |
選用。工具執行結果清單。 |
ToolResponse
| JSON 表示法 |
|---|
{ "id": string, "displayName": string, "response": { object }, // Union field |
| 欄位 | |
|---|---|
id |
選用。 |
displayName |
僅供輸出。工具的顯示名稱。 |
response |
這是必要旗標,JSON 物件格式的工具執行結果。使用「output」鍵指定工具回應,並使用「error」鍵指定錯誤詳細資料 (如有)。如果未指定「output」和「error」鍵,系統會將整個「response」視為工具執行結果。 |
聯集欄位 tool_identifier。已執行的工具 ID。可以是持續性工具,也可以是工具集中的工具。tool_identifier 只能是下列其中一個設定: |
|
tool |
選用。要執行的工具名稱。格式: |
toolsetTool |
選用。執行的工具集工具。 |
ToolsetTool
| JSON 表示法 |
|---|
{ "toolset": string, "toolId": string } |
| 欄位 | |
|---|---|
toolset |
這是必要旗標,衍生此工具的工具集資源名稱。格式: |
toolId |
選用。用於篩選工具的工具 ID,可擷取結構定義。 |
結構
| JSON 表示法 |
|---|
{ "fields": { string: value, ... } } |
| 欄位 | |
|---|---|
fields |
動態型別值的無序對應。 包含 |
FieldsEntry
| JSON 表示法 |
|---|
{ "key": string, "value": value } |
| 欄位 | |
|---|---|
key |
|
value |
|
值
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 kind。值的類型。kind 只能是下列其中一個設定: |
|
nullValue |
代表空值。 |
numberValue |
表示雙精度浮點數值。 |
stringValue |
代表字串值。 |
boolValue |
表示布林值。 |
structValue |
代表結構化值。 |
listValue |
代表重複的 |
ListValue
| JSON 表示法 |
|---|
{ "values": [ value ] } |
| 欄位 | |
|---|---|
values[] |
動態型別值的重複欄位。 |
圖片
| JSON 表示法 |
|---|
{ "mimeType": string, "data": string } |
| 欄位 | |
|---|---|
mimeType |
這是必要旗標,來源資料的 IANA 標準 MIME 類型。支援的圖片類型包括: * image/png * image/jpeg * image/webp |
data |
這是必要旗標,圖片的原始位元組。 Base64 編碼字串。 |
Blob
| JSON 表示法 |
|---|
{ "mimeType": string, "data": string } |
| 欄位 | |
|---|---|
mimeType |
這是必要旗標,來源資料的 IANA 標準 MIME 類型。 |
data |
這是必要旗標,Blob 的原始位元組。 Base64 編碼字串。 |
事件
| JSON 表示法 |
|---|
{ "event": string } |
| 欄位 | |
|---|---|
event |
這是必要旗標,活動名稱。 |
AgentTransfer
| JSON 表示法 |
|---|
{ "targetAgent": string, "displayName": string } |
| 欄位 | |
|---|---|
targetAgent |
這是必要旗標,要將對話轉移給哪位服務專員。服務專員會接手後續對話。格式: |
displayName |
僅供輸出。代理程式的顯示名稱。 |
GoldenExpectation
| JSON 表示法 |
|---|
{ "note": string, // Union field |
| 欄位 | |
|---|---|
note |
選用。這項要求的附註,有助於在特定檢查失敗時回報。例如:"Check_Payment_Tool_Called". |
聯集欄位 condition。要執行的實際檢查。condition 只能是下列其中一個設定: |
|
toolCall |
選用。確認是否已使用參數呼叫特定工具。 |
toolResponse |
選用。確認特定工具是否提供預期回應。 |
agentResponse |
選用。確認代理程式是否回覆正確內容。「代理商」角色是隱含的。 |
agentTransfer |
選用。確認服務專員已將對話轉給其他服務專員。 |
updatedVariables |
選用。確認代理程式已將工作階段變數更新為預期值。也用於擷取黃金評估的代理程式變數更新。 |
mockToolResponse |
選用。工具模擬回應,並指定感興趣的參數。如果未指定任何參數,LLM 就會產生幻覺。 |
ToolCall
| JSON 表示法 |
|---|
{ "id": string, "displayName": string, "args": { object }, // Union field |
| 欄位 | |
|---|---|
id |
選用。工具呼叫的專屬 ID。如果已填入,用戶端應傳回執行結果,並在 |
displayName |
僅供輸出。工具的顯示名稱。 |
args |
選用。工具的輸入參數和值,採用 JSON 物件格式。 |
聯集欄位 tool_identifier。要執行的工具 ID。可以是持續性工具,也可以是工具集中的工具。tool_identifier 只能是下列其中一個設定: |
|
tool |
選用。要執行的工具名稱。格式: |
toolsetTool |
選用。要執行的工具集工具。 |
訊息
| JSON 表示法 |
|---|
{
"role": string,
"chunks": [
{
object ( |
| 欄位 | |
|---|---|
role |
選用。對話中的角色,例如使用者、代理程式。 |
chunks[] |
選用。訊息內容,以一系列區塊的形式呈現。 |
eventTime |
選用。傳送或接收郵件/訊息時的時間戳記。如果訊息屬於 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
Chunk
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 data。將資料分塊。data 只能是下列其中一個設定: |
|
text |
選用。文字資料。 |
transcript |
選用。與音訊相關的轉錄稿。 |
blob |
選用。Blob 資料。 |
payload |
選用。自訂酬載資料。 |
image |
選用。圖片資料。 |
toolCall |
選用。工具執行要求。 |
toolResponse |
選用。工具執行回應。 |
agentTransfer |
選用。代理程式轉移事件。 |
updatedVariables |
結構體代表對話中更新的變數,並以變數名稱做為鍵。 |
defaultVariables |
結構體代表對話開始時的預設變數,並以變數名稱做為鍵。 |
時間戳記
| JSON 表示法 |
|---|
{ "seconds": string, "nanos": integer } |
| 欄位 | |
|---|---|
seconds |
代表自 Unix 紀元 1970-01-01T00:00:00Z 起算的世界標準時間秒數。必須介於 -62135596800 和 253402300799 之間 (含),對應至 0001-01-01T00:00:00Z 至 9999-12-31T23:59:59Z。 |
nanos |
以奈秒為單位的非負秒數小數。這個欄位是時間長度的奈秒部分,並非秒數的替代值。如果第二個值為負數,且包含分數,奈秒值仍須為非負數,且會向前計時。必須介於 0 至 999,999,999 之間 (含)。 |
時距
| JSON 表示法 |
|---|
{
"name": string,
"startTime": string,
"endTime": string,
"duration": string,
"attributes": {
object
},
"childSpans": [
{
object ( |
| 欄位 | |
|---|---|
name |
僅供輸出。範圍的名稱。 |
startTime |
僅供輸出。時間範圍的開始時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
endTime |
僅供輸出。時間範圍的結束時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
duration |
僅供輸出。時距長度。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
attributes |
僅供輸出。與範圍相關聯的鍵/值屬性。 |
childSpans[] |
僅供輸出。這個範圍下巢狀的子範圍。 |
時間長度
| JSON 表示法 |
|---|
{ "seconds": string, "nanos": integer } |
| 欄位 | |
|---|---|
seconds |
時間範圍的簽署秒數。必須介於 -315,576,000,000 到 +315,576,000,000 之間 (含這兩個值)。注意:這些界限是根據以下公式計算得出:60 秒/分鐘 * 60 分鐘/小時 * 24 小時/天 * 365.25 天/年 * 10000 年 |
nanos |
時間跨度的小數部分 (以奈秒為單位),可為正數或負數。如果時間長度不到一秒,系統會以 0 |
情境
| JSON 表示法 |
|---|
{ "task": string, "userFacts": [ { object ( |
| 欄位 | |
|---|---|
task |
這是必要旗標,情境要鎖定的工作。 |
userFacts[] |
選用。情境要使用的使用者事實。 |
maxTurns |
選用。要模擬的回合數上限。如未指定,模擬作業會持續進行,直到工作完成為止。 |
rubrics[] |
這是必要旗標,用來評估情境的評量表。 |
scenarioExpectations[] |
這是必要旗標,ScenarioExpectations,用於評估使用者模擬產生的對話。 |
variableOverrides |
選用。工作階段的變數 / 工作階段參數,以變數名稱做為鍵。這個結構體的成員會覆寫系統設定的所有預設值。 請注意,這些與使用者事實不同,使用者事實是指使用者已知的事實。變數是服務專員已知的參數,也就是電話系統傳送的 MDN (電話號碼)。 |
taskCompletionBehavior |
選用。已淘汰,請改用 user_goal_behavior。 |
userGoalBehavior |
選用。使用者目標的預期行為。 |
evaluationExpectations[] |
選用。評估模擬對話的預期結果。格式: |
UserFact
| JSON 表示法 |
|---|
{ "name": string, "value": string } |
| 欄位 | |
|---|---|
name |
這是必要旗標,使用者事實的名稱。 |
value |
這是必要旗標,使用者事實的值。 |
ScenarioExpectation
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 expectation。評估模擬產生的對話。expectation 只能是下列其中一個設定: |
|
toolExpectation |
選用。要評估的工具呼叫和回覆配對。 |
agentResponse |
選用。要評估的服務專員回覆。 |
ToolExpectation
| JSON 表示法 |
|---|
{ "expectedToolCall": { object ( |
| 欄位 | |
|---|---|
expectedToolCall |
這是必要旗標,預期工具呼叫,並指定感興趣的參數。如果未指定任何參數,LLM 就會產生幻覺。 |
mockToolResponse |
這是必要旗標,工具模擬回應,並指定感興趣的參數。如果未指定任何參數,LLM 就會產生幻覺。 |
AggregatedMetrics
| JSON 表示法 |
|---|
{
"metricsByAppVersion": [
{
object ( |
| 欄位 | |
|---|---|
metricsByAppVersion[] |
僅供輸出。依應用程式版本 ID 分組的匯總指標。 |
MetricsByAppVersion
| JSON 表示法 |
|---|
{ "appVersionId": string, "toolMetrics": [ { object ( |
| 欄位 | |
|---|---|
appVersionId |
僅供輸出。應用程式版本 ID。 |
toolMetrics[] |
僅供輸出。這個應用程式版本中各項工具的指標。 |
semanticSimilarityMetrics[] |
僅供輸出。這個應用程式版本中的語意相似度指標。 |
hallucinationMetrics[] |
僅供輸出。這個應用程式版本中的錯覺指標。 |
toolCallLatencyMetrics[] |
僅供輸出。這個應用程式版本的工具呼叫延遲指標。 |
turnLatencyMetrics[] |
僅供輸出。這個應用程式版本的輪替延遲指標。 |
passCount |
僅供輸出。評估通過的次數。 |
failCount |
僅供輸出。評估失敗次數。 |
metricsByTurn[] |
僅供輸出。這項應用程式版本中,每個回合的匯總指標。 |
ToolMetrics
| JSON 表示法 |
|---|
{ "tool": string, "passCount": integer, "failCount": integer } |
| 欄位 | |
|---|---|
tool |
僅供輸出。工具名稱。 |
passCount |
僅供輸出。工具通過的次數。 |
failCount |
僅供輸出。工具失敗的次數。 |
SemanticSimilarityMetrics
| JSON 表示法 |
|---|
{ "score": number } |
| 欄位 | |
|---|---|
score |
僅供輸出。平均語意相似度分數 (0 到 4 分)。 |
HallucinationMetrics
| JSON 表示法 |
|---|
{ "score": number } |
| 欄位 | |
|---|---|
score |
僅供輸出。平均錯覺分數 (0 到 1)。 |
ToolCallLatencyMetrics
| JSON 表示法 |
|---|
{ "tool": string, "averageLatency": string } |
| 欄位 | |
|---|---|
tool |
僅供輸出。工具名稱。 |
averageLatency |
僅供輸出。工具呼叫的平均延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
TurnLatencyMetrics
| JSON 表示法 |
|---|
{ "averageLatency": string } |
| 欄位 | |
|---|---|
averageLatency |
僅供輸出。回合的平均延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
MetricsByTurn
| JSON 表示法 |
|---|
{ "turnIndex": integer, "toolMetrics": [ { object ( |
| 欄位 | |
|---|---|
turnIndex |
僅供輸出。回合索引 (從 0 開始)。 |
toolMetrics[] |
僅供輸出。這個回合中各項工具的指標。 |
semanticSimilarityMetrics[] |
僅供輸出。這個回合的語意相似度指標。 |
hallucinationMetrics[] |
僅供輸出。這個回合的錯覺指標。 |
toolCallLatencyMetrics[] |
僅供輸出。這個回合中工具呼叫的延遲時間指標。 |
turnLatencyMetrics[] |
僅供輸出。這個回合的延遲時間指標。 |
EvaluationResult
| JSON 表示法 |
|---|
{ "name": string, "displayName": string, "createTime": string, "evaluationStatus": enum ( |
| 欄位 | |
|---|---|
name |
ID。評估結果的專屬 ID。格式: |
displayName |
這是必要旗標,評估結果的顯示名稱。評估中不得重複。預設格式為「結果 - |
createTime |
僅供輸出。建立評估結果的時間戳記。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
evaluationStatus |
僅供輸出。評估結果。只有在 execution_state 為 COMPLETE 時,才會填入這個欄位。 |
evaluationRun |
僅供輸出。產生這項結果的評估作業。格式: |
persona |
僅供輸出。用於產生對話的虛擬角色,以取得評估結果。 |
errorInfo |
僅供輸出。評估結果的錯誤資訊。 |
error |
僅供輸出。已淘汰:請改用 |
initiatedBy |
僅供輸出。發起評估執行作業的使用者,該作業產生了這項結果。 |
appVersion |
僅供輸出。用於生成對話的應用程式版本,該對話產生了這項結果。格式: |
appVersionDisplayName |
僅供輸出。評估作業所評估的 |
changelog |
僅供輸出。評估作業所用應用程式版本的變更記錄。如果使用者對最新/草稿執行評估,系統就會填入這項資訊。 |
changelogCreateTime |
僅供輸出。評估作業所依據的應用程式版本,其變更記錄的建立時間。如果使用者對最新/草稿執行評估,系統就會填入這項資訊。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
executionState |
僅供輸出。評估結果執行的狀態。 |
evaluationMetricsThresholds |
僅供輸出。結果的評估門檻。 |
config |
僅供輸出。評估執行作業所用的設定,產生了這項結果。 |
goldenRunMethod |
僅供輸出。用來執行黃金評估的方法。 |
聯集欄位 result。評估結果。只有在 execution_state 為 COMPLETED 時才會填入資料。result 只能是下列其中一個設定: |
|
goldenResult |
僅供輸出。黃金評估的結果。 |
scenarioResult |
僅供輸出。情境評估結果。 |
GoldenResult
| JSON 表示法 |
|---|
{ "turnReplayResults": [ { object ( |
| 欄位 | |
|---|---|
turnReplayResults[] |
僅供輸出。執行黃金對話中每個回合的結果。 |
evaluationExpectationResults[] |
僅供輸出。評估期望的結果。 |
TurnReplayResult
| JSON 表示法 |
|---|
{ "conversation": string, "expectationOutcome": [ { object ( |
| 欄位 | |
|---|---|
conversation |
僅供輸出。系統為這個回合生成的對話。 |
expectationOutcome[] |
僅供輸出。各項期望的結果。 |
hallucinationResult |
僅供輸出。幻覺檢查結果。 |
toolInvocationScore |
僅供輸出。已淘汰,請改用 OverallToolInvocationResult。 |
turnLatency |
僅供輸出。回合時間長度。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
toolCallLatencies[] |
僅供輸出。回合中每次工具呼叫的延遲時間。 |
semanticSimilarityResult |
僅供輸出。語意相似度檢查結果。 |
overallToolInvocationResult |
僅供輸出。整體工具叫用檢查的結果。 |
errorInfo |
僅供輸出。這個回合期間發生的錯誤相關資訊。 |
spanLatencies[] |
僅供輸出。回合中時距的延遲時間。 |
聯集欄位
|
|
toolOrderedInvocationScore |
僅供輸出。這個回合的工具呼叫分數。這表示在預期回合中,實際以預期順序叫用工具的整體百分比。 |
GoldenExpectationOutcome
| JSON 表示法 |
|---|
{ "expectation": { object ( |
| 欄位 | |
|---|---|
expectation |
僅供輸出。評估的期望。 |
outcome |
僅供輸出。預期的結果。 |
semanticSimilarityResult |
僅供輸出。語意相似度檢查結果。 |
toolInvocationResult |
僅供輸出。工具叫用檢查結果。 |
聯集欄位 result。預期結果。result 只能是下列其中一個設定: |
|
observedToolCall |
僅供輸出。工具呼叫預期的結果。 |
observedToolResponse |
僅供輸出。工具回應預期的結果。 |
observedAgentResponse |
僅供輸出。代理回覆預期的結果。 |
observedAgentTransfer |
僅供輸出。預期轉移給服務專員的結果。 |
SemanticSimilarityResult
| JSON 表示法 |
|---|
{ "label": string, "explanation": string, "outcome": enum ( |
| 欄位 | |
|---|---|
label |
僅供輸出。與各個分數相關的標籤。分數 4:完全一致 分數 3:大致一致 分數 2:部分一致 (有小部分遺漏) 分數 1:大致不一致 (有大部分遺漏) 分數 0:完全不一致 / 矛盾 |
explanation |
僅供輸出。語意相似度分數的說明。 |
outcome |
僅供輸出。語意相似度檢查結果。這是透過比較分數與 semantic_similarity_success_threshold 來判斷。如果分數等於或高於門檻,結果就會是「通過」。否則結果會是「失敗」。 |
聯集欄位
|
|
score |
僅供輸出。語意相似度分數。可以是 0、1、2、3 或 4。 |
ToolInvocationResult
| JSON 表示法 |
|---|
{ "outcome": enum ( |
| 欄位 | |
|---|---|
outcome |
僅供輸出。工具叫用檢查的結果。這是透過比較 parameter_correctness_score 與門檻來判斷。如果分數等於或高於門檻,結果就會是「通過」。否則結果會是「失敗」。 |
explanation |
僅供輸出。工具呼叫結果的自由文字說明。 |
聯集欄位
|
|
parameterCorrectnessScore |
僅供輸出。工具叫用參數正確度分數。這表示實際工具呼叫中也出現預期工具呼叫的參數百分比。 |
HallucinationResult
| JSON 表示法 |
|---|
{ "label": string, "explanation": string, // Union field |
| 欄位 | |
|---|---|
label |
僅供輸出。與各個分數相關的標籤。分數 1:合理分數 0:不合理分數 -1:沒有可評估的聲明 |
explanation |
僅供輸出。幻覺分數的說明。 |
聯集欄位
|
|
score |
僅供輸出。幻覺分數。可以是 -1、0、1。 |
ToolCallLatency
| JSON 表示法 |
|---|
{ "tool": string, "displayName": string, "startTime": string, "endTime": string, "executionLatency": string } |
| 欄位 | |
|---|---|
tool |
僅供輸出。執行的工具名稱。格式: |
displayName |
僅供輸出。工具的顯示名稱。 |
startTime |
僅供輸出。工具呼叫執行的開始時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
endTime |
僅供輸出。工具呼叫執行的結束時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
executionLatency |
僅供輸出。工具呼叫執行的延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
OverallToolInvocationResult
| JSON 表示法 |
|---|
{ "outcome": enum ( |
| 欄位 | |
|---|---|
outcome |
僅供輸出。工具叫用檢查的結果。這是透過比較 tool_invocation_score 與 overall_tool_invocation_correctness_threshold 來判斷。如果分數等於或高於門檻,結果就會是「通過」。否則結果會是 FAIL。 |
聯集欄位
|
|
toolInvocationScore |
這個回合的整體工具叫用分數。這表示實際叫用工具的百分比,以預期回合為基準。 |
EvaluationErrorInfo
| JSON 表示法 |
|---|
{
"errorType": enum ( |
| 欄位 | |
|---|---|
errorType |
僅供輸出。錯誤類型。 |
errorMessage |
僅供輸出。錯誤訊息。 |
sessionId |
僅供輸出。導致錯誤的對話工作階段 ID。 |
SpanLatency
| JSON 表示法 |
|---|
{ "type": enum ( |
| 欄位 | |
|---|---|
type |
僅供輸出。範圍類型。 |
displayName |
僅供輸出。範圍的顯示名稱。適用於工具和防護機制範圍。 |
startTime |
僅供輸出。時間範圍的開始時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
endTime |
僅供輸出。時間範圍的結束時間。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
executionLatency |
僅供輸出。時距的延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
聯集欄位 identifier。根據特定項目的類型,該項目的 ID。identifier 只能是下列其中一個設定: |
|
resource |
僅供輸出。防護措施或工具範圍的資源名稱。 |
toolset |
僅供輸出。工具集工具 ID。 |
model |
僅供輸出。LLM 範圍的名稱。 |
callback |
僅供輸出。使用者回呼範圍的名稱。 |
EvaluationExpectationResult
| JSON 表示法 |
|---|
{
"evaluationExpectation": string,
"prompt": string,
"outcome": enum ( |
| 欄位 | |
|---|---|
evaluationExpectation |
僅供輸出。評估預期結果。格式: |
prompt |
僅供輸出。用於評估的提示。 |
outcome |
僅供輸出。評估期望的結果。 |
explanation |
僅供輸出。結果的說明。 |
ScenarioResult
| JSON 表示法 |
|---|
{ "conversation": string, "task": string, "userFacts": [ { object ( |
| 欄位 | |
|---|---|
conversation |
僅供輸出。情境中生成的對話。 |
task |
僅供輸出。執行此結果情境時使用的工作。 |
userFacts[] |
僅供輸出。情境用於此結果的使用者事實。 |
expectationOutcomes[] |
僅供輸出。各項期望的結果。 |
rubricOutcomes[] |
僅供輸出。評分量表的結果。 |
hallucinationResult[] |
僅供輸出。幻覺檢查結果。對話中的每一輪都會有一個幻覺結果。 |
taskCompletionResult |
僅供輸出。工作完成檢查結果。 |
toolCallLatencies[] |
僅供輸出。對話中每次執行工具呼叫的延遲時間。 |
userGoalSatisfactionResult |
僅供輸出。使用者目標達成情況檢查結果。 |
spanLatencies[] |
僅供輸出。對話中跨度的延遲時間。 |
evaluationExpectationResults[] |
僅供輸出。評估期望的結果。 |
聯集欄位
|
|
allExpectationsSatisfied |
僅供輸出。是否滿足此回合的所有期望。 |
聯集欄位
|
|
taskCompleted |
僅供輸出。這回合是否已完成工作。這項指標的計算方式是將所有滿足的期望、沒有錯覺和使用者目標達成率加總。 |
ScenarioExpectationOutcome
| JSON 表示法 |
|---|
{ "expectation": { object ( |
| 欄位 | |
|---|---|
expectation |
僅供輸出。評估的期望。 |
outcome |
僅供輸出。ScenarioExpectation 的結果。 |
聯集欄位 result。預期結果。result 只能是下列其中一個設定: |
|
observedToolCall |
僅供輸出。觀察到的工具呼叫。 |
observedAgentResponse |
僅供輸出。觀察到的代理程式回應。 |
ObservedToolCall
| JSON 表示法 |
|---|
{ "toolCall": { object ( |
| 欄位 | |
|---|---|
toolCall |
僅供輸出。觀察到的工具呼叫。 |
toolResponse |
僅供輸出。觀察到的工具回應。 |
ScenarioRubricOutcome
| JSON 表示法 |
|---|
{ "rubric": string, "scoreExplanation": string, // Union field |
| 欄位 | |
|---|---|
rubric |
僅供輸出。用來評估對話的評量表。 |
scoreExplanation |
僅供輸出。評估者對評分量表的回應。 |
聯集欄位
|
|
score |
僅供輸出。對話的評分量表分數。 |
TaskCompletionResult
| JSON 表示法 |
|---|
{ "label": string, "explanation": string, // Union field |
| 欄位 | |
|---|---|
label |
僅供輸出。與各個分數相關的標籤。分數 1:工作完成 分數 0:工作未完成 分數 -1:使用者目標未定義 |
explanation |
僅供輸出。工作完成分數的說明。 |
聯集欄位
|
|
score |
僅供輸出。工作完成分數。可以是 -1、0、1 |
UserGoalSatisfactionResult
| JSON 表示法 |
|---|
{ "label": string, "explanation": string, // Union field |
| 欄位 | |
|---|---|
label |
僅供輸出。與各個分數相關的標籤。分數 1:使用者任務滿意分數 0:使用者任務不滿意分數 -1:使用者任務未指定 |
explanation |
僅供輸出。使用者工作滿意度分數的說明。 |
聯集欄位
|
|
score |
僅供輸出。使用者工作滿意度分數。可以是 -1、0、1。 |
EvaluationPersona
| JSON 表示法 |
|---|
{
"name": string,
"description": string,
"displayName": string,
"personality": string,
"speechConfig": {
object ( |
| 欄位 | |
|---|---|
name |
這是必要旗標,角色的專屬 ID。格式: |
description |
選用。角色說明。 |
displayName |
這是必要旗標,角色的顯示名稱。應用程式內的專屬識別碼。 |
personality |
這是必要旗標,代理程式在評估期間的行為指示。 |
speechConfig |
選用。設定角色聲音的方式 (文字轉語音設定)。 |
SpeechConfig
| JSON 表示法 |
|---|
{
"speakingRate": number,
"environment": enum ( |
| 欄位 | |
|---|---|
speakingRate |
選用。說話速率。1.0 為正常值。值越低,速度越慢 (例如 0.8),值越高速度越快 (例如 1.5)。適合測試代理程式如何處理說話速度快的人。 |
environment |
選用。模擬音訊環境。 |
voiceId |
選用。要使用的特定語音 ID/口音。例如:「en-US-Wavenet-D」或「en-GB-Standard-A」 |
狀態
| JSON 表示法 |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| 欄位 | |
|---|---|
code |
狀態碼,應為 |
message |
向開發人員顯示的錯誤訊息,應以英文呈現。所有面向使用者的錯誤訊息都應經過本地化,並透過 |
details[] |
包含錯誤詳細資料的訊息清單。這是供 API 使用的一組常用訊息類型。 包含任意類型欄位的物件。額外的 |
不限
| JSON 表示法 |
|---|
{ "typeUrl": string, "value": string } |
| 欄位 | |
|---|---|
typeUrl |
使用 URI 參照識別序列化 Protobuf 訊息的類型,該參照包含以斜線結尾的前置字串和完整合格的類型名稱。 範例:type.googleapis.com/google.protobuf.StringValue 這個字串至少須包含一個 前置字元是任意的,Protobuf 實作項目應會直接去除最後一個 所有型別網址字串都必須是合法的 URI 參照,且參照內容只能包含英數字元、百分比編碼逸出字元,以及下列集合中的字元 (不含外側的反引號): 在 |
value |
保存 type_url 所描述類型的 Protobuf 序列化。 Base64 編碼字串。 |
EvaluationMetricsThresholds
| JSON 表示法 |
|---|
{ "goldenEvaluationMetricsThresholds": { object ( |
| 欄位 | |
|---|---|
goldenEvaluationMetricsThresholds |
選用。黃金評估指標門檻。 |
hallucinationMetricBehavior |
選用。已淘汰:請改用 |
goldenHallucinationMetricBehavior |
選用。黃金評估的幻覺指標行為。 |
scenarioHallucinationMetricBehavior |
選用。情境評估的錯覺指標行為。 |
GoldenEvaluationMetricsThresholds
| JSON 表示法 |
|---|
{ "turnLevelMetricsThresholds": { object ( |
| 欄位 | |
|---|---|
turnLevelMetricsThresholds |
選用。回合層級指標的門檻。 |
expectationLevelMetricsThresholds |
選用。預期等級指標門檻。 |
toolMatchingSettings |
選用。工具比對設定。額外工具呼叫是指執行作業中出現的工具呼叫,但與黃金期望中的任何工具呼叫都不相符。 |
TurnLevelMetricsThresholds
| JSON 表示法 |
|---|
{ "semanticSimilarityChannel": enum ( |
| 欄位 | |
|---|---|
semanticSimilarityChannel |
選用。用於評估的語意相似度管道。 |
聯集欄位
|
|
semanticSimilaritySuccessThreshold |
選用。語意相似度的成功門檻。必須是介於 0 到 4 之間的整數。預設值為 >= 3。 |
聯集欄位
|
|
overallToolInvocationCorrectnessThreshold |
選用。工具整體叫用正確性的成功門檻。必須是介於 0 到 1 之間的浮點數。預設值為 1.0。 |
ExpectationLevelMetricsThresholds
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位
|
|
toolInvocationParameterCorrectnessThreshold |
選用。個別工具叫用參數正確性的成功門檻。必須是介於 0 到 1 之間的浮點數。預設值為 1.0。 |
ToolMatchingSettings
| JSON 表示法 |
|---|
{
"extraToolCallBehavior": enum ( |
| 欄位 | |
|---|---|
extraToolCallBehavior |
選用。額外工具呼叫的行為。預設值為 FAIL。 |
EvaluationConfig
| JSON 表示法 |
|---|
{ "inputAudioConfig": { object ( |
| 欄位 | |
|---|---|
inputAudioConfig |
選用。用於處理輸入音訊的設定。 |
outputAudioConfig |
選用。用於生成輸出音訊的設定。 |
evaluationChannel |
選用。要評估的管道。 |
toolCallBehaviour |
選用。指定評估作業應使用真實工具呼叫或虛擬工具。 |
InputAudioConfig
| JSON 表示法 |
|---|
{
"audioEncoding": enum ( |
| 欄位 | |
|---|---|
audioEncoding |
這是必要旗標,輸入音訊資料的編碼。 |
sampleRateHertz |
這是必要旗標,輸入音訊資料的取樣率 (單位為赫茲)。 |
noiseSuppressionLevel |
選用。是否要對輸入音訊啟用噪音抑制功能。可用的值為「low」、「moderate」、「high」、「very_high」。 |
OutputAudioConfig
| JSON 表示法 |
|---|
{
"audioEncoding": enum ( |
| 欄位 | |
|---|---|
audioEncoding |
這是必要旗標,輸出音訊資料的編碼。 |
sampleRateHertz |
這是必要旗標,輸出音訊資料的取樣率 (單位為赫茲)。 |
工具註解
破壞性提示:❌ | 等冪提示:❌ | 唯讀提示:❌ | 開放世界提示:❌