도구: get_evaluation_dataset
지정된 평가 데이터 세트의 세부정보를 가져옵니다.
다음 샘플은 curl를 사용하여 get_evaluation_dataset MCP 도구를 호출하는 방법을 보여줍니다.
| curl 요청 |
|---|
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "get_evaluation_dataset", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
입력 스키마
EvaluationService.GetEvaluationDataset에 대한 요청 메시지입니다.
GetEvaluationDatasetRequest
| JSON 표현 |
|---|
{ "name": string } |
| 필드 | |
|---|---|
name |
필수 항목입니다. 가져올 평가 데이터 세트의 리소스 이름입니다. |
출력 스키마
평가 데이터 세트는 공유 태그를 기반으로 그룹화된 평가 세트를 나타냅니다.
EvaluationDataset
| JSON 표현 |
|---|
{
"name": string,
"displayName": string,
"evaluations": [
string
],
"createTime": string,
"updateTime": string,
"etag": string,
"createdBy": string,
"lastUpdatedBy": string,
"aggregatedMetrics": {
object ( |
| 필드 | |
|---|---|
name |
식별자. 이 평가 데이터 세트의 고유 식별자입니다. 형식: |
displayName |
필수 항목입니다. 평가 데이터 세트의 사용자 정의 표시 이름입니다. 앱 내에서 고유합니다. |
evaluations[] |
선택사항입니다. 이 데이터 세트에 포함된 평가입니다. |
createTime |
출력 전용입니다. 평가 데이터 세트가 생성된 타임스탬프입니다. 생성된 출력은 항상 Z-정규화되고 소수점 이하 0, 3, 6 또는 9자리인 RFC 3339를 사용합니다. 'Z' 이외의 오프셋도 허용됩니다. 예를 들면 |
updateTime |
출력 전용입니다. 평가 데이터 세트가 마지막으로 업데이트된 타임스탬프입니다. 생성된 출력은 항상 Z-정규화되고 소수점 이하 0, 3, 6 또는 9자리인 RFC 3339를 사용합니다. 'Z' 이외의 오프셋도 허용됩니다. 예를 들면 |
etag |
출력 전용입니다. 읽기-수정-쓰기 작업 중에 객체가 변경되지 않았는지 확인하는 데 사용되는 Etag입니다. etag가 비어 있으면 업데이트가 동시에 발생한 변경사항을 덮어씁니다. |
createdBy |
출력 전용입니다. 평가 데이터 세트를 만든 사용자입니다. |
lastUpdatedBy |
출력 전용입니다. 평가 데이터 세트를 마지막으로 업데이트한 사용자입니다. |
aggregatedMetrics |
출력 전용입니다. 모든 실행에서 이 평가 데이터 세트에 대해 집계된 측정항목입니다. |
타임스탬프
| JSON 표현 |
|---|
{ "seconds": string, "nanos": integer } |
| 필드 | |
|---|---|
seconds |
Unix epoch 1970-01-01T00:00:00Z 이후 UTC 시간의 초 단위로 표현합니다. -62135596800~253402300799 (0001-01-01T00:00:00Z~9999-12-31T23:59:59Z에 해당) 사이여야 합니다. |
nanos |
나노초 단위의 음수가 아닌 초수입니다. 이 필드는 기간의 나노초 부분이며 초의 대안이 아닙니다. 음수의 초수 값에는 시간에 반영되는 음수가 아닌 나노초 값이 있어야 합니다. 0~999,999,999(포함) 사이여야 합니다. |
AggregatedMetrics
| JSON 표현 |
|---|
{
"metricsByAppVersion": [
{
object ( |
| 필드 | |
|---|---|
metricsByAppVersion[] |
출력 전용입니다. 앱 버전 ID별로 그룹화된 집계 측정항목입니다. |
MetricsByAppVersion
| JSON 표현 |
|---|
{ "appVersionId": string, "toolMetrics": [ { object ( |
| 필드 | |
|---|---|
appVersionId |
출력 전용입니다. 앱 버전 ID입니다. |
toolMetrics[] |
출력 전용입니다. 이 앱 버전 내 각 도구의 측정항목입니다. |
semanticSimilarityMetrics[] |
출력 전용입니다. 이 앱 버전 내의 의미 유사성 측정항목입니다. |
hallucinationMetrics[] |
출력 전용입니다. 이 앱 버전 내의 환각에 대한 측정항목입니다. |
toolCallLatencyMetrics[] |
출력 전용입니다. 이 앱 버전 내의 도구 호출 지연 시간 측정항목입니다. |
turnLatencyMetrics[] |
출력 전용입니다. 이 앱 버전 내의 턴 지연 시간 측정항목입니다. |
passCount |
출력 전용입니다. 평가를 통과한 횟수입니다. |
failCount |
출력 전용입니다. 평가에 실패한 횟수입니다. |
metricsByTurn[] |
출력 전용입니다. 이 앱 버전 내에서 턴별로 집계된 측정항목입니다. |
ToolMetrics
| JSON 표현 |
|---|
{ "tool": string, "passCount": integer, "failCount": integer } |
| 필드 | |
|---|---|
tool |
출력 전용입니다. 도구의 이름입니다. |
passCount |
출력 전용입니다. 도구가 통과한 횟수입니다. |
failCount |
출력 전용입니다. 도구가 실패한 횟수입니다. |
SemanticSimilarityMetrics
| JSON 표현 |
|---|
{ "score": number } |
| 필드 | |
|---|---|
score |
출력 전용입니다. 평균 시맨틱 유사성 점수 (0~4)입니다. |
HallucinationMetrics
| JSON 표현 |
|---|
{ "score": number } |
| 필드 | |
|---|---|
score |
출력 전용입니다. 평균 환각 점수 (0~1)입니다. |
ToolCallLatencyMetrics
| JSON 표현 |
|---|
{ "tool": string, "averageLatency": string } |
| 필드 | |
|---|---|
tool |
출력 전용입니다. 도구의 이름입니다. |
averageLatency |
출력 전용입니다. 도구 호출의 평균 지연 시간입니다. 소수점 아래가 최대 9자리까지이고 ' |
기간
| JSON 표현 |
|---|
{ "seconds": string, "nanos": integer } |
| 필드 | |
|---|---|
seconds |
시간 범위의 부호가 있는 초입니다. -315,576,000,000~+315,576,000,000(포함) 사이여야 합니다. 참고: 이 범위는 60초/분 * 60분/시간 * 24시간/일 * 365.25일/년 * 10,000년에서 계산됩니다. |
nanos |
시간 범위의 나노초 단위의 부호가 있는 초수입니다. 1초 미만의 기간은 0 |
TurnLatencyMetrics
| JSON 표현 |
|---|
{ "averageLatency": string } |
| 필드 | |
|---|---|
averageLatency |
출력 전용입니다. 턴의 평균 지연 시간입니다. 소수점 아래가 최대 9자리까지이고 ' |
MetricsByTurn
| JSON 표현 |
|---|
{ "turnIndex": integer, "toolMetrics": [ { object ( |
| 필드 | |
|---|---|
turnIndex |
출력 전용입니다. 턴 색인 (0부터 시작)입니다. |
toolMetrics[] |
출력 전용입니다. 이 턴 내 각 도구의 측정항목입니다. |
semanticSimilarityMetrics[] |
출력 전용입니다. 이 턴 내의 의미 유사성 측정항목입니다. |
hallucinationMetrics[] |
출력 전용입니다. 이 턴 내의 환각에 대한 측정항목입니다. |
toolCallLatencyMetrics[] |
출력 전용입니다. 이 턴 내의 도구 호출 지연 시간 측정항목입니다. |
turnLatencyMetrics[] |
출력 전용입니다. 이 턴 내의 턴 지연 시간 측정항목입니다. |
도구 주석
파괴적 힌트: ❌ | 동일한 힌트: ✅ | 읽기 전용 힌트: ✅ | 오픈 월드 힌트: ❌