Alat: list_evaluation_runs
Mencantumkan proses evaluasi.
Contoh berikut menunjukkan cara menggunakan curl untuk memanggil alat MCP list_evaluation_runs.
| Permintaan Curl |
|---|
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "list_evaluation_runs", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
Skema Input
Pesan permintaan untuk EvaluationService.ListEvaluationRuns.
ListEvaluationRunsRequest
| Representasi JSON |
|---|
{ "parent": string, "pageSize": integer, "pageToken": string, "filter": string, "orderBy": string } |
| Kolom | |
|---|---|
parent |
Wajib. Nama resource aplikasi untuk mencantumkan proses evaluasi. |
pageSize |
Opsional. Ukuran halaman yang diminta. Server dapat menampilkan lebih sedikit item daripada yang diminta. Jika tidak ditentukan, server akan memilih default yang sesuai. |
pageToken |
Opsional. Nilai |
filter |
Opsional. Filter yang akan diterapkan saat mencantumkan proses evaluasi. Lihat https://google.aip.dev/160 untuk mengetahui detail selengkapnya. |
orderBy |
Opsional. Kolom yang akan diurutkan. Hanya "name", "create_time", dan "update_time" yang didukung. Kolom waktu diurutkan dalam urutan menurun, dan kolom nama diurutkan dalam urutan menaik. Jika tidak disertakan, "update_time" akan menjadi default. Lihat https://google.aip.dev/132#ordering untuk mengetahui detail selengkapnya. |
Skema Output
Pesan respons untuk EvaluationService.ListEvaluationRuns.
ListEvaluationRunsResponse
| Representasi JSON |
|---|
{
"evaluationRuns": [
{
object ( |
| Kolom | |
|---|---|
evaluationRuns[] |
Daftar operasi evaluasi. |
nextPageToken |
Token yang dapat dikirim sebagai |
EvaluationRun
| Representasi JSON |
|---|
{ "name": string, "displayName": string, "evaluationResults": [ string ], "createTime": string, "initiatedBy": string, "appVersion": string, "appVersionDisplayName": string, "changelog": string, "changelogCreateTime": string, "evaluations": [ string ], "evaluationDataset": string, "evaluationType": enum ( |
| Kolom | |
|---|---|
name |
ID. ID unik dari proses evaluasi. Format: |
displayName |
Opsional. Nama tampilan yang ditentukan pengguna untuk proses evaluasi. Default: " |
evaluationResults[] |
Hanya output. Hasil evaluasi yang merupakan bagian dari operasi ini. Format: |
createTime |
Hanya output. Stempel waktu saat eksekusi evaluasi dibuat. Menggunakan RFC 3339 yang outputnya akan selalu dinormalisasi Z dan menggunakan 0, 3, 6, atau 9 digit pecahan. Offset selain "Z" juga diterima. Contoh: |
initiatedBy |
Hanya output. Pengguna yang memulai proses evaluasi. |
appVersion |
Hanya output. Versi aplikasi yang akan dievaluasi. Format: |
appVersionDisplayName |
Hanya output. Nama tampilan |
changelog |
Hanya output. Log perubahan versi aplikasi yang digunakan untuk menjalankan evaluasi. Kolom ini diisi jika pengguna menjalankan evaluasi pada versi terbaru/draf. |
changelogCreateTime |
Hanya output. Waktu pembuatan log perubahan versi aplikasi yang digunakan untuk menjalankan evaluasi. Kolom ini diisi jika pengguna menjalankan evaluasi pada versi terbaru/draf. Menggunakan RFC 3339 yang outputnya akan selalu dinormalisasi Z dan menggunakan 0, 3, 6, atau 9 digit pecahan. Offset selain "Z" juga diterima. Contoh: |
evaluations[] |
Hanya output. Evaluasi yang merupakan bagian dari proses ini. Daftar dapat berisi evaluasi dari salah satu jenis. Kolom ini sama eksklusifnya dengan |
evaluationDataset |
Hanya output. Set data evaluasi yang terkait dengan proses ini. Kolom ini sama eksklusifnya dengan |
evaluationType |
Hanya output. Jenis evaluasi dalam proses ini. |
state |
Hanya output. Status proses evaluasi. |
progress |
Hanya output. Progres proses evaluasi. |
config |
Hanya output. Konfigurasi yang digunakan dalam run. |
error |
Hanya output. Tidak digunakan lagi: Gunakan error_info sebagai gantinya. Terjadi error selama eksekusi. |
errorInfo |
Hanya output. Informasi error untuk proses evaluasi. |
evaluationRunSummaries |
Hanya output. Peta nama evaluasi ke EvaluationRunSummary. Objek yang berisi daftar pasangan |
latencyReport |
Hanya output. Laporan latensi untuk proses evaluasi. |
runCount |
Hanya output. Jumlah evaluasi di dalam proses yang dijalankan. |
personaRunConfigs[] |
Hanya output. Konfigurasi yang akan digunakan untuk menjalankan per persona. |
optimizationConfig |
Opsional. Konfigurasi untuk menjalankan langkah pengoptimalan setelah menjalankan evaluasi. Jika tidak disetel, langkah pengoptimalan tidak akan dijalankan. |
scheduledEvaluationRun |
Hanya output. Nama resource eksekusi evaluasi terjadwal yang membuat eksekusi evaluasi ini. Kolom ini hanya disetel jika eksekusi evaluasi dibuat oleh eksekusi evaluasi terjadwal. Format: |
goldenRunMethod |
Hanya output. Metode yang digunakan untuk menjalankan evaluasi. |
Stempel waktu
| Representasi JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Kolom | |
|---|---|
seconds |
Mewakili detik waktu UTC sejak epoch Unix 1970-01-01T00:00:00Z. Harus antara -62135596800 dan 253402300799 inklusif (yang sesuai dengan 0001-01-01T00:00:00Z hingga 9999-12-31T23:59:59Z). |
nanos |
Pecahan detik non-negatif pada resolusi nanodetik. Kolom ini adalah bagian nanodetik dari durasi, bukan alternatif untuk detik. Nilai detik negatif dengan pecahan harus tetap memiliki nilai nano non-negatif yang dihitung maju dalam waktu. Harus antara 0 dan 999.999.999 inklusif. |
Progres
| Representasi JSON |
|---|
{ "totalCount": integer, "failedCount": integer, "errorCount": integer, "completedCount": integer, "passedCount": integer } |
| Kolom | |
|---|---|
totalCount |
Hanya output. Jumlah total hasil evaluasi dalam proses ini. |
failedCount |
Hanya output. Jumlah hasil evaluasi yang selesai dengan hasil GAGAL. (EvaluationResult.execution_state adalah COMPLETED dan EvaluationResult.evaluation_status adalah FAIL). |
errorCount |
Hanya output. Jumlah hasil evaluasi yang gagal dieksekusi. (EvaluationResult.execution_state adalah ERROR). |
completedCount |
Hanya output. Jumlah hasil evaluasi yang berhasil diselesaikan. (EvaluationResult.execution_state adalah COMPLETED). |
passedCount |
Hanya output. Jumlah hasil evaluasi yang selesai dengan hasil LULUS. (EvaluationResult.execution_state adalah COMPLETED dan EvaluationResult.evaluation_status adalah PASS). |
EvaluationConfig
| Representasi JSON |
|---|
{ "inputAudioConfig": { object ( |
| Kolom | |
|---|---|
inputAudioConfig |
Opsional. Konfigurasi untuk memproses audio input. |
outputAudioConfig |
Opsional. Konfigurasi untuk membuat audio output. |
evaluationChannel |
Opsional. Saluran yang akan dievaluasi. |
toolCallBehaviour |
Opsional. Menentukan apakah evaluasi harus menggunakan panggilan alat asli atau alat palsu. |
InputAudioConfig
| Representasi JSON |
|---|
{
"audioEncoding": enum ( |
| Kolom | |
|---|---|
audioEncoding |
Wajib. Encoding data audio input. |
sampleRateHertz |
Wajib. Frekuensi sampel (dalam Hertz) data audio input. |
noiseSuppressionLevel |
Opsional. Apakah akan mengaktifkan peredam bising pada audio input. Nilai yang tersedia adalah "low", "moderate", "high", "very_high". |
OutputAudioConfig
| Representasi JSON |
|---|
{
"audioEncoding": enum ( |
| Kolom | |
|---|---|
audioEncoding |
Wajib. Encoding data audio output. |
sampleRateHertz |
Wajib. Frekuensi sampel (dalam Hertz) data audio output. |
Status
| Representasi JSON |
|---|
{ "code": integer, "message": string, "details": [ { "@type": string, field1: ..., ... } ] } |
| Kolom | |
|---|---|
code |
Kode status, harus berupa nilai enum dari |
message |
Pesan error yang ditampilkan ke developer dan seharusnya dalam bahasa Inggris. Setiap pesan error yang ditampilkan kepada pengguna harus dilokalkan dan dikirim di kolom |
details[] |
Daftar pesan yang membawa detail error. Ada seperangkat jenis pesan umum untuk digunakan API. Objek yang berisi kolom tipe arbitrer. Kolom tambahan |
Semua
| Representasi JSON |
|---|
{ "typeUrl": string, "value": string } |
| Kolom | |
|---|---|
typeUrl |
Mengidentifikasi jenis pesan Protobuf yang diserialkan dengan referensi URI yang terdiri dari awalan yang diakhiri dengan garis miring dan nama jenis yang sepenuhnya memenuhi syarat. Contoh: type.googleapis.com/google.protobuf.StringValue String ini harus berisi setidaknya satu karakter Awalan bersifat arbitrer dan implementasi Protobuf diharapkan cukup menghapus semua yang ada hingga dan termasuk Semua string URL jenis harus berupa referensi URI yang valid dengan batasan tambahan (untuk format teks) bahwa konten referensi hanya boleh terdiri dari karakter alfanumerik, escape yang dienkode persen, dan karakter dalam set berikut (tidak termasuk tanda petik terbalik luar): Dalam desain asli |
value |
Berisi serialisasi Protobuf dari jenis yang dijelaskan oleh type_url. String berenkode base64. |
EvaluationErrorInfo
| Representasi JSON |
|---|
{
"errorType": enum ( |
| Kolom | |
|---|---|
errorType |
Hanya output. Jenis error. |
errorMessage |
Hanya output. Pesan error. |
sessionId |
Hanya output. ID sesi untuk percakapan yang menyebabkan error. |
EvaluationRunSummariesEntry
| Representasi JSON |
|---|
{
"key": string,
"value": {
object ( |
| Kolom | |
|---|---|
key |
|
value |
|
EvaluationRunSummary
| Representasi JSON |
|---|
{ "passedCount": integer, "failedCount": integer, "errorCount": integer } |
| Kolom | |
|---|---|
passedCount |
Hanya output. Jumlah hasil lulus untuk Evaluasi terkait dalam proses ini. |
failedCount |
Hanya output. Jumlah hasil yang gagal untuk Evaluasi terkait dalam operasi ini. |
errorCount |
Hanya output. Jumlah hasil error untuk Evaluasi terkait dalam proses ini. |
LatencyReport
| Representasi JSON |
|---|
{ "toolLatencies": [ { object ( |
| Kolom | |
|---|---|
toolLatencies[] |
Hanya output. Daftar yang tidak diurutkan. Metrik latensi untuk setiap alat. |
callbackLatencies[] |
Hanya output. Daftar yang tidak diurutkan. Metrik latensi untuk setiap callback. |
guardrailLatencies[] |
Hanya output. Daftar yang tidak diurutkan. Metrik latensi untuk setiap pembatasan. |
llmCallLatencies[] |
Hanya output. Daftar yang tidak diurutkan. Metrik latensi untuk setiap panggilan LLM. |
sessionCount |
Hanya output. Jumlah total sesi yang dipertimbangkan dalam laporan latensi. |
ToolLatency
| Representasi JSON |
|---|
{ "toolDisplayName": string, "latencyMetrics": { object ( |
| Kolom | |
|---|---|
toolDisplayName |
Hanya output. Nama tampilan alat. |
latencyMetrics |
Hanya output. Metrik latensi untuk alat. |
Kolom union tool_identifier. ID alat. tool_identifier hanya ada berupa salah satu diantara berikut: |
|
tool |
Hanya output. Format: |
toolsetTool |
Hanya output. ID alat toolset. |
ToolsetTool
| Representasi JSON |
|---|
{ "toolset": string, "toolId": string } |
| Kolom | |
|---|---|
toolset |
Wajib. Nama resource Toolset dari mana alat ini berasal. Format: |
toolId |
Opsional. ID alat untuk memfilter alat guna mengambil skemanya. |
LatencyMetrics
| Representasi JSON |
|---|
{ "p50Latency": string, "p90Latency": string, "p99Latency": string, "callCount": integer } |
| Kolom | |
|---|---|
p50Latency |
Hanya output. Latensi persentil ke-50. Durasi dalam detik dengan maksimal sembilan digit pecahan, yang diakhiri dengan ' |
p90Latency |
Hanya output. Latensi persentil ke-90. Durasi dalam detik dengan maksimal sembilan digit pecahan, yang diakhiri dengan ' |
p99Latency |
Hanya output. Latensi persentil ke-99. Durasi dalam detik dengan maksimal sembilan digit pecahan, yang diakhiri dengan ' |
callCount |
Hanya output. Frekuensi resource dipanggil. |
Durasi
| Representasi JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Kolom | |
|---|---|
seconds |
Detik yang ditandatangani dari rentang waktu. Harus dari -315.576.000.000 hingga +315.576.000.000 inklusif. Catatan: batas ini dihitung dari: 60 dtk/mnt * 60 mnt/j * 24 j/hr * 365,25 hr/thn * 10.000 thn |
nanos |
Pecahan detik bertanda pada resolusi nanodetik rentang waktu. Durasi kurang dari satu detik ditampilkan dengan kolom |
CallbackLatency
| Representasi JSON |
|---|
{
"stage": string,
"latencyMetrics": {
object ( |
| Kolom | |
|---|---|
stage |
Hanya output. Tahap callback. |
latencyMetrics |
Hanya output. Metrik latensi untuk callback. |
GuardrailLatency
| Representasi JSON |
|---|
{
"guardrail": string,
"guardrailDisplayName": string,
"latencyMetrics": {
object ( |
| Kolom | |
|---|---|
guardrail |
Hanya output. Nama pembatas. Format: |
guardrailDisplayName |
Hanya output. Nama tampilan pembatas. |
latencyMetrics |
Hanya output. Metrik latensi untuk pembatasan. |
LlmCallLatency
| Representasi JSON |
|---|
{
"model": string,
"latencyMetrics": {
object ( |
| Kolom | |
|---|---|
model |
Hanya output. Nama model. |
latencyMetrics |
Hanya output. Metrik latensi untuk panggilan LLM. |
PersonaRunConfig
| Representasi JSON |
|---|
{ "persona": string, "taskCount": integer } |
| Kolom | |
|---|---|
persona |
Opsional. Persona yang akan digunakan untuk evaluasi. Format: |
taskCount |
Opsional. Jumlah tugas yang akan dijalankan untuk persona. |
OptimizationConfig
| Representasi JSON |
|---|
{
"generateLossReport": boolean,
"assistantSession": string,
"reportSummary": string,
"shouldSuggestFix": boolean,
"status": enum ( |
| Kolom | |
|---|---|
generateLossReport |
Opsional. Apakah akan membuat laporan kehilangan. |
assistantSession |
Hanya output. Sesi asisten yang akan digunakan untuk pengoptimalan berdasarkan eksekusi evaluasi ini. Format: |
reportSummary |
Hanya output. Ringkasan laporan kehilangan. |
shouldSuggestFix |
Hanya output. Apakah akan menyarankan perbaikan untuk kerugian. |
status |
Hanya output. Status proses pengoptimalan. |
errorMessage |
Hanya output. Pesan error jika proses pengoptimalan gagal. |
lossReport |
Hanya output. Laporan kehilangan yang dibuat. |
Struct
| Representasi JSON |
|---|
{ "fields": { string: value, ... } } |
| Kolom | |
|---|---|
fields |
Peta tidak berurutan dari nilai yang diketik secara dinamis. Objek yang berisi daftar pasangan |
FieldsEntry
| Representasi JSON |
|---|
{ "key": string, "value": value } |
| Kolom | |
|---|---|
key |
|
value |
|
Nilai
| Representasi JSON |
|---|
{ // Union field |
| Kolom | |
|---|---|
Kolom union kind. Jenis nilai. kind hanya ada berupa salah satu diantara berikut: |
|
nullValue |
Mewakili nilai null. |
numberValue |
Mewakili nilai ganda. |
stringValue |
Mewakili nilai string. |
boolValue |
Mewakili nilai boolean. |
structValue |
Mewakili nilai terstruktur. |
listValue |
Merepresentasikan |
ListValue
| Representasi JSON |
|---|
{ "values": [ value ] } |
| Kolom | |
|---|---|
values[] |
Kolom berulang dari nilai yang diketik secara dinamis. |
Anotasi Alat
Petunjuk Destruktif: ❌ | Petunjuk Idempoten: ✅ | Petunjuk Hanya Baca: ✅ | Petunjuk Dunia Terbuka: ❌