工具:get_evaluation_run
取得指定評估作業的詳細資料。
下列範例示範如何使用 curl 叫用 get_evaluation_run MCP 工具。
| Curl 要求 |
|---|
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "get_evaluation_run", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
輸入內容的結構定義
EvaluationService.GetEvaluationRun 的要求訊息。
GetEvaluationRunRequest
| JSON 表示法 |
|---|
{ "name": string } |
| 欄位 | |
|---|---|
name |
這是必要旗標,要擷取的評估執行作業資源名稱。 |
輸出內容的結構定義
評估執行作業的所有評估結果都屬於評估執行。
EvaluationRun
| JSON 表示法 |
|---|
{ "name": string, "displayName": string, "evaluationResults": [ string ], "createTime": string, "initiatedBy": string, "appVersion": string, "appVersionDisplayName": string, "changelog": string, "changelogCreateTime": string, "evaluations": [ string ], "evaluationDataset": string, "evaluationType": enum ( |
| 欄位 | |
|---|---|
name |
ID。評估執行的專屬 ID。格式: |
displayName |
選用。評估作業執行項目的使用者定義顯示名稱。預設值為「 |
evaluationResults[] |
僅供輸出。這項執行作業的評估結果。格式: |
createTime |
僅供輸出。建立評估作業的時間戳記。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
initiatedBy |
僅供輸出。發起評估執行作業的使用者。 |
appVersion |
僅供輸出。要評估的應用程式版本。格式: |
appVersionDisplayName |
僅供輸出。評估作業所評估的 |
changelog |
僅供輸出。評估作業所用應用程式版本的變更記錄。如果使用者對最新/草稿執行評估,系統就會填入這項資訊。 |
changelogCreateTime |
僅供輸出。評估作業所依據的應用程式版本,其變更記錄的建立時間。如果使用者對最新/草稿執行評估,系統就會填入這項資訊。 使用 RFC 3339,產生的輸出內容一律會經過 Z 正規化,並使用 0、3、6 或 9 個小數位數,也接受「Z」以外的偏移量。範例: |
evaluations[] |
僅供輸出。這項執行作業包含的評估。清單可能包含任一類型的評估。這個欄位與 |
evaluationDataset |
僅供輸出。與這項執行作業相關聯的評估資料集。這個欄位與 |
evaluationType |
僅供輸出。本次執行的評估類型。 |
state |
僅供輸出。評估作業的狀態。 |
progress |
僅供輸出。評估作業的進度。 |
config |
僅供輸出。執行作業中使用的設定。 |
error |
僅供輸出。已淘汰:請改用 error_info。執行期間發生錯誤。 |
errorInfo |
僅供輸出。評估作業的錯誤資訊。 |
evaluationRunSummaries |
僅供輸出。評估名稱對應至 EvaluationRunSummary 的對應。 包含 |
latencyReport |
僅供輸出。評估執行作業的延遲報告。 |
runCount |
僅供輸出。執行中評估的執行次數。 |
personaRunConfigs[] |
僅供輸出。每個角色執行時要使用的設定。 |
optimizationConfig |
選用。設定在評估作業執行完畢後執行最佳化步驟。如未設定,系統就不會執行最佳化步驟。 |
scheduledEvaluationRun |
僅供輸出。建立這項評估作業的排定評估作業資源名稱。只有在評估作業是由排定的評估作業建立時,才會設定這個欄位。格式: |
goldenRunMethod |
僅供輸出。用於執行評估作業的方法。 |
時間戳記
| JSON 表示法 |
|---|
{ "seconds": string, "nanos": integer } |
| 欄位 | |
|---|---|
seconds |
代表自 Unix 紀元 1970-01-01T00:00:00Z 起算的世界標準時間秒數。必須介於 -62135596800 和 253402300799 之間 (含),對應至 0001-01-01T00:00:00Z 至 9999-12-31T23:59:59Z。 |
nanos |
以奈秒為單位的非負秒數小數。這個欄位是時間長度的奈秒部分,並非秒數的替代值。如果第二個值為負數,且包含分數,奈秒值仍須為非負數,且會向前計時。必須介於 0 至 999,999,999 之間 (含)。 |
進度
| JSON 表示法 |
|---|
{ "totalCount": integer, "failedCount": integer, "errorCount": integer, "completedCount": integer, "passedCount": integer } |
| 欄位 | |
|---|---|
totalCount |
僅供輸出。本次執行中的評估結果總數。 |
failedCount |
僅供輸出。評估結果為「失敗」的次數。(EvaluationResult.execution_state 為 COMPLETED,且 EvaluationResult.evaluation_status 為 FAIL)。 |
errorCount |
僅供輸出。無法執行的評估結果數量。(EvaluationResult.execution_state 為 ERROR)。 |
completedCount |
僅供輸出。成功完成的評估結果數量。(EvaluationResult.execution_state 為 COMPLETED)。 |
passedCount |
僅供輸出。結果為「通過」的評估結果數量。(EvaluationResult.execution_state 為 COMPLETED,且 EvaluationResult.evaluation_status 為 PASS)。 |
EvaluationConfig
| JSON 表示法 |
|---|
{ "inputAudioConfig": { object ( |
| 欄位 | |
|---|---|
inputAudioConfig |
選用。用於處理輸入音訊的設定。 |
outputAudioConfig |
選用。用於生成輸出音訊的設定。 |
evaluationChannel |
選用。要評估的管道。 |
toolCallBehaviour |
選用。指定評估作業應使用真實工具呼叫或虛擬工具。 |
InputAudioConfig
| JSON 表示法 |
|---|
{
"audioEncoding": enum ( |
| 欄位 | |
|---|---|
audioEncoding |
這是必要旗標,輸入音訊資料的編碼。 |
sampleRateHertz |
這是必要旗標,輸入音訊資料的取樣率 (單位為赫茲)。 |
noiseSuppressionLevel |
選用。是否要對輸入音訊啟用噪音抑制功能。可用的值為「low」、「moderate」、「high」、「very_high」。 |
OutputAudioConfig
| JSON 表示法 |
|---|
{
"audioEncoding": enum ( |
| 欄位 | |
|---|---|
audioEncoding |
這是必要旗標,輸出音訊資料的編碼。 |
sampleRateHertz |
這是必要旗標,輸出音訊資料的取樣率 (單位為赫茲)。 |
狀態
| JSON 表示法 |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| 欄位 | |
|---|---|
code |
狀態碼,應為 |
message |
向開發人員顯示的錯誤訊息,應以英文呈現。所有面向使用者的錯誤訊息都應經過本地化,並透過 |
details[] |
包含錯誤詳細資料的訊息清單。這是供 API 使用的一組常用訊息類型。 包含任意類型欄位的物件。額外的 |
不限
| JSON 表示法 |
|---|
{ "typeUrl": string, "value": string } |
| 欄位 | |
|---|---|
typeUrl |
使用 URI 參照識別序列化 Protobuf 訊息的類型,該參照包含以斜線結尾的前置字串和完整合格的類型名稱。 範例:type.googleapis.com/google.protobuf.StringValue 這個字串至少須包含一個 前置字元是任意的,Protobuf 實作項目應會直接去除最後一個 所有型別網址字串都必須是合法的 URI 參照,且參照內容只能包含英數字元、百分比編碼逸出字元,以及下列集合中的字元 (不含外側的反引號): 在 |
value |
保存 type_url 所描述類型的 Protobuf 序列化。 Base64 編碼字串。 |
EvaluationErrorInfo
| JSON 表示法 |
|---|
{
"errorType": enum ( |
| 欄位 | |
|---|---|
errorType |
僅供輸出。錯誤類型。 |
errorMessage |
僅供輸出。錯誤訊息。 |
sessionId |
僅供輸出。導致錯誤的對話工作階段 ID。 |
EvaluationRunSummariesEntry
| JSON 表示法 |
|---|
{
"key": string,
"value": {
object ( |
| 欄位 | |
|---|---|
key |
|
value |
|
EvaluationRunSummary
| JSON 表示法 |
|---|
{ "passedCount": integer, "failedCount": integer, "errorCount": integer } |
| 欄位 | |
|---|---|
passedCount |
僅供輸出。本次執行相關聯評估作業時通過的結果數量。 |
failedCount |
僅供輸出。本次執行相關評估作業時,失敗的結果數量。 |
errorCount |
僅供輸出。本次執行中,相關聯評估的錯誤結果數。 |
LatencyReport
| JSON 表示法 |
|---|
{ "toolLatencies": [ { object ( |
| 欄位 | |
|---|---|
toolLatencies[] |
僅供輸出。未排序的清單。各項工具的延遲指標。 |
callbackLatencies[] |
僅供輸出。未排序的清單。每個回呼的延遲指標。 |
guardrailLatencies[] |
僅供輸出。未排序的清單。每個防護措施的延遲指標。 |
llmCallLatencies[] |
僅供輸出。未排序的清單。每次 LLM 呼叫的延遲指標。 |
sessionCount |
僅供輸出。延遲報表考量的總工作階段數。 |
ToolLatency
| JSON 表示法 |
|---|
{ "toolDisplayName": string, "latencyMetrics": { object ( |
| 欄位 | |
|---|---|
toolDisplayName |
僅供輸出。工具的顯示名稱。 |
latencyMetrics |
僅供輸出。工具的延遲指標。 |
聯集欄位 tool_identifier。工具的 ID。tool_identifier 只能是下列其中一個設定: |
|
tool |
僅供輸出。格式: |
toolsetTool |
僅供輸出。工具集工具 ID。 |
ToolsetTool
| JSON 表示法 |
|---|
{ "toolset": string, "toolId": string } |
| 欄位 | |
|---|---|
toolset |
這是必要旗標,衍生此工具的工具集資源名稱。格式: |
toolId |
選用。用於篩選工具的工具 ID,可擷取結構定義。 |
LatencyMetrics
| JSON 表示法 |
|---|
{ "p50Latency": string, "p90Latency": string, "p99Latency": string, "callCount": integer } |
| 欄位 | |
|---|---|
p50Latency |
僅供輸出。第 50 個百分位數的延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
p90Latency |
僅供輸出。第 90 個百分位數的延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
p99Latency |
僅供輸出。第 99 個百分位數的延遲時間。 時間長度以秒為單位,最多可有 9 個小數位數,並應以「 |
callCount |
僅供輸出。資源的呼叫次數。 |
時間長度
| JSON 表示法 |
|---|
{ "seconds": string, "nanos": integer } |
| 欄位 | |
|---|---|
seconds |
時間範圍的簽署秒數。必須介於 -315,576,000,000 到 +315,576,000,000 之間 (含這兩個值)。注意:這些界限是根據以下公式計算得出:60 秒/分鐘 * 60 分鐘/小時 * 24 小時/天 * 365.25 天/年 * 10000 年 |
nanos |
時間範圍的秒數小數,以奈秒為單位。如果時間長度不到一秒,系統會以 0 |
CallbackLatency
| JSON 表示法 |
|---|
{
"stage": string,
"latencyMetrics": {
object ( |
| 欄位 | |
|---|---|
stage |
僅供輸出。回呼的階段。 |
latencyMetrics |
僅供輸出。回呼的延遲指標。 |
GuardrailLatency
| JSON 表示法 |
|---|
{
"guardrail": string,
"guardrailDisplayName": string,
"latencyMetrics": {
object ( |
| 欄位 | |
|---|---|
guardrail |
僅供輸出。防護措施名稱。格式: |
guardrailDisplayName |
僅供輸出。防護措施的顯示名稱。 |
latencyMetrics |
僅供輸出。護欄的延遲指標。 |
LlmCallLatency
| JSON 表示法 |
|---|
{
"model": string,
"latencyMetrics": {
object ( |
| 欄位 | |
|---|---|
model |
僅供輸出。模型的名稱。 |
latencyMetrics |
僅供輸出。LLM 呼叫的延遲指標。 |
PersonaRunConfig
| JSON 表示法 |
|---|
{ "persona": string, "taskCount": integer } |
| 欄位 | |
|---|---|
persona |
選用。用於評估的角色。格式: |
taskCount |
選用。要為角色執行的工作數。 |
OptimizationConfig
| JSON 表示法 |
|---|
{
"generateLossReport": boolean,
"assistantSession": string,
"reportSummary": string,
"shouldSuggestFix": boolean,
"status": enum ( |
| 欄位 | |
|---|---|
generateLossReport |
選用。是否要產生損失報告。 |
assistantSession |
僅供輸出。根據這項評估作業進行最佳化時要使用的助理工作階段。格式: |
reportSummary |
僅供輸出。損失報告摘要。 |
shouldSuggestFix |
僅供輸出。是否建議修正損失。 |
status |
僅供輸出。最佳化執行的狀態。 |
errorMessage |
僅供輸出。最佳化作業失敗時的錯誤訊息。 |
lossReport |
僅供輸出。產生的損失報告。 |
結構
| JSON 表示法 |
|---|
{ "fields": { string: value, ... } } |
| 欄位 | |
|---|---|
fields |
動態型別值的無序對應。 包含 |
FieldsEntry
| JSON 表示法 |
|---|
{ "key": string, "value": value } |
| 欄位 | |
|---|---|
key |
|
value |
|
值
| JSON 表示法 |
|---|
{ // Union field |
| 欄位 | |
|---|---|
聯集欄位 kind。值的類型。kind 只能是下列其中一個設定: |
|
nullValue |
代表空值。 |
numberValue |
表示雙精度浮點數值。 |
stringValue |
代表字串值。 |
boolValue |
表示布林值。 |
structValue |
代表結構化值。 |
listValue |
代表重複的 |
ListValue
| JSON 表示法 |
|---|
{ "values": [ value ] } |
| 欄位 | |
|---|---|
values[] |
動態型別值的重複欄位。 |
工具註解
破壞性提示:❌ | 等冪提示:✅ | 唯讀提示:✅ | 開放世界提示:❌