MCP Tools Reference: ces.googleapis.com

Tool: `list_evaluation_datasets`

Listet Bewertungs-Datasets auf.

Im folgenden Beispiel wird gezeigt, wie Sie mit curl das MCP-Tool list_evaluation_datasets aufrufen.

Curl-Anfrage
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "list_evaluation_datasets", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }'

Curl-Anfrage

                  
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \
--header 'content-type: application/json' \
--header 'accept: application/json, text/event-stream' \
--data '{
  "method": "tools/call",
  "params": {
    "name": "list_evaluation_datasets",
    "arguments": {
      // provide these details according to the tool's MCP specification
    }
  },
  "jsonrpc": "2.0",
  "id": 1
}'

Eingabeschema

Anfragenachricht für EvaluationService.ListEvaluationDatasets.

ListEvaluationDatasetsRequest

JSON-Darstellung
{ "parent": string, "pageSize": integer, "pageToken": string, "filter": string, "orderBy": string }

Felder
`parent`	`string` Erforderlich. Der Ressourcenname der App, für die Bewertungs-Datasets aufgeführt werden sollen.
`pageSize`	`integer` Optional. Angeforderte Seitengröße. Der Server gibt möglicherweise weniger Elemente als angefordert zurück. Wenn kein Wert angegeben wurde, wählt der Server einen geeigneten Standardwert aus.
`pageToken`	`string` Optional. Der Wert `next_page_token` wurde gegebenenfalls von einem vorherigen `EvaluationService.ListEvaluationDatasets`-Listenaufruf zurückgegeben.
`filter`	`string` Optional. Filter, der beim Auflisten der Evaluierungs-Datasets angewendet werden soll. Weitere Informationen finden Sie unter https://google.aip.dev/160.
`orderBy`	`string` Optional. Feld, nach dem sortiert werden soll. Nur „name“, „create_time“ und „update_time“ werden unterstützt. Zeitfelder werden in absteigender Reihenfolge und das Namensfeld in aufsteigender Reihenfolge sortiert. Wenn nichts angegeben ist, wird standardmäßig „update_time“ verwendet. Weitere Informationen finden Sie unter https://google.aip.dev/132#ordering.

Ausgabeschema

Antwortnachricht für EvaluationService.ListEvaluationDatasets.

ListEvaluationDatasetsResponse

JSON-Darstellung
{ "evaluationDatasets": [ { object (`EvaluationDataset`) } ], "nextPageToken": string }

Felder

Felder
`evaluationDatasets[]`	`object (EvaluationDataset)` Die Liste der Bewertungs-Datasets.
`nextPageToken`	`string` Ein Token, das als `ListEvaluationDatasetsRequest.page_token` gesendet werden kann, um die nächste Seite abzurufen. Wenn dieses Feld fehlt, gibt es keine nachfolgenden Seiten.

evaluationDatasets[]

object (EvaluationDataset)

Die Liste der Bewertungs-Datasets.

nextPageToken

string

Ein Token, das als ListEvaluationDatasetsRequest.page_token gesendet werden kann, um die nächste Seite abzurufen. Wenn dieses Feld fehlt, gibt es keine nachfolgenden Seiten.

EvaluationDataset

JSON-Darstellung

JSON-Darstellung
{ "name": string, "displayName": string, "evaluations": [ string ], "createTime": string, "updateTime": string, "etag": string, "createdBy": string, "lastUpdatedBy": string, "aggregatedMetrics": { object (`AggregatedMetrics`) } }

{
  "name": string,
  "displayName": string,
  "evaluations": [
    string
  ],
  "createTime": string,
  "updateTime": string,
  "etag": string,
  "createdBy": string,
  "lastUpdatedBy": string,
  "aggregatedMetrics": {
    object (AggregatedMetrics)
  }
}

Felder
`name`	`string` ID. Die eindeutige Kennung dieses Auswertungs-Datasets. Format: `projects/{project}/locations/{location}/apps/{app}/evaluationDatasets/{evaluationDataset}`
`displayName`	`string` Erforderlich. Benutzerdefinierter Anzeigename des Bewertungs-Datasets. Eindeutig innerhalb einer App.
`evaluations[]`	`string` Optional. Bewertungen, die in diesem Dataset enthalten sind.
`createTime`	`string (Timestamp format)` Nur Ausgabe. Zeitstempel für die Erstellung des Auswertungs-Datasets. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` oder `"2014-10-02T15:01:23+05:30"`
`updateTime`	`string (Timestamp format)` Nur Ausgabe. Zeitstempel der letzten Aktualisierung des Auswertungsdatensatzes. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: `"2014-10-02T15:01:23Z"`, `"2014-10-02T15:01:23.045123456Z"` oder `"2014-10-02T15:01:23+05:30"`
`etag`	`string` Nur Ausgabe. Etag, das verwendet wird, um sicherzustellen, dass sich das Objekt während eines Read-Modify-Write-Vorgangs nicht geändert hat. Wenn das ETag leer ist, werden alle gleichzeitigen Änderungen durch das Update überschrieben.
`createdBy`	`string` Nur Ausgabe. Der Nutzer, der das Evaluationsdataset erstellt hat.
`lastUpdatedBy`	`string` Nur Ausgabe. Der Nutzer, der das Auswertungs-Dataset zuletzt aktualisiert hat.
`aggregatedMetrics`	`object (AggregatedMetrics)` Nur Ausgabe. Die aggregierten Messwerte für dieses Auswertungs-Dataset über alle Läufe hinweg.

Zeitstempel

JSON-Darstellung
{ "seconds": string, "nanos": integer }

Felder

Felder
`seconds`	`string (int64 format)` Stellt Sekunden der UTC-Zeit seit Unix-Epoche 1970-01-01T00:00:00Z dar. Muss einschließlich zwischen -62135596800 und 253402300799 liegen (entspricht 0001-01-01T00:00:00Z bis 9999-12-31T23:59:59Z).
`nanos`	`integer` Nicht negative Sekundenbruchteile Nanosekunden-Auflösung. Dieses Feld enthält den Nanosekundenanteil der Dauer und ist keine Alternative zu Sekunden. Negative Sekundenwerte mit Bruchteilen müssen weiterhin nicht negative Nano-Werte haben, die zeitlich vorwärts gezählt werden. Muss zwischen 0 und 999.999.999 liegen.

seconds

string (int64 format)

Stellt Sekunden der UTC-Zeit seit Unix-Epoche 1970-01-01T00:00:00Z dar. Muss einschließlich zwischen -62135596800 und 253402300799 liegen (entspricht 0001-01-01T00:00:00Z bis 9999-12-31T23:59:59Z).

nanos

integer

Nicht negative Sekundenbruchteile Nanosekunden-Auflösung. Dieses Feld enthält den Nanosekundenanteil der Dauer und ist keine Alternative zu Sekunden. Negative Sekundenwerte mit Bruchteilen müssen weiterhin nicht negative Nano-Werte haben, die zeitlich vorwärts gezählt werden. Muss zwischen 0 und 999.999.999 liegen.

AggregatedMetrics

JSON-Darstellung
{ "metricsByAppVersion": [ { object (`MetricsByAppVersion`) } ] }

Felder

Felder
`metricsByAppVersion[]`	`object (MetricsByAppVersion)` Nur Ausgabe. Zusammengefasste Messwerte, gruppiert nach App-Versions-ID.

metricsByAppVersion[]

object (MetricsByAppVersion)

Nur Ausgabe. Zusammengefasste Messwerte, gruppiert nach App-Versions-ID.

MetricsByAppVersion

JSON-Darstellung

JSON-Darstellung
{ "appVersionId": string, "toolMetrics": [ { object (`ToolMetrics`) } ], "semanticSimilarityMetrics": [ { object (`SemanticSimilarityMetrics`) } ], "hallucinationMetrics": [ { object (`HallucinationMetrics`) } ], "toolCallLatencyMetrics": [ { object (`ToolCallLatencyMetrics`) } ], "turnLatencyMetrics": [ { object (`TurnLatencyMetrics`) } ], "passCount": integer, "failCount": integer, "metricsByTurn": [ { object (`MetricsByTurn`) } ] }

{
  "appVersionId": string,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ],
  "passCount": integer,
  "failCount": integer,
  "metricsByTurn": [
    {
      object (MetricsByTurn)
    }
  ]
}

Felder
`appVersionId`	`string` Nur Ausgabe. Die App-Versions-ID.
`toolMetrics[]`	`object (ToolMetrics)` Nur Ausgabe. Messwerte für jedes Tool in dieser App-Version.
`semanticSimilarityMetrics[]`	`object (SemanticSimilarityMetrics)` Nur Ausgabe. Messwerte für die semantische Ähnlichkeit in dieser App-Version.
`hallucinationMetrics[]`	`object (HallucinationMetrics)` Nur Ausgabe. Messwerte für Halluzinationen in dieser App-Version.
`toolCallLatencyMetrics[]`	`object (ToolCallLatencyMetrics)` Nur Ausgabe. Messwerte für die Latenz von Tool-Aufrufen in dieser App-Version.
`turnLatencyMetrics[]`	`object (TurnLatencyMetrics)` Nur Ausgabe. Messwerte für die Zuglatenz in dieser App-Version.
`passCount`	`integer` Nur Ausgabe. Die Anzahl der bestandenen Auswertungen.
`failCount`	`integer` Nur Ausgabe. Die Anzahl der fehlgeschlagenen Auswertungen.
`metricsByTurn[]`	`object (MetricsByTurn)` Nur Ausgabe. Messwerte, die pro Zug in dieser App-Version zusammengefasst werden.

ToolMetrics

JSON-Darstellung
{ "tool": string, "passCount": integer, "failCount": integer }

Felder

Felder
`tool`	`string` Nur Ausgabe. Der Name des Tools.
`passCount`	`integer` Nur Ausgabe. Die Anzahl der bestandenen Tests.
`failCount`	`integer` Nur Ausgabe. Die Anzahl der fehlgeschlagenen Versuche.

tool

string

Nur Ausgabe. Der Name des Tools.

passCount

integer

Nur Ausgabe. Die Anzahl der bestandenen Tests.

failCount

integer

Nur Ausgabe. Die Anzahl der fehlgeschlagenen Versuche.

SemanticSimilarityMetrics

JSON-Darstellung
{ "score": number }

Felder

Felder
`score`	`number` Nur Ausgabe. Der durchschnittliche Wert für die semantische Ähnlichkeit (0–4).

score

number

Nur Ausgabe. Der durchschnittliche Wert für die semantische Ähnlichkeit (0–4).

HallucinationMetrics

JSON-Darstellung
{ "score": number }

Felder

Felder
`score`	`number` Nur Ausgabe. Der durchschnittliche Halluzinationswert (0 bis 1).

score

number

Nur Ausgabe. Der durchschnittliche Halluzinationswert (0 bis 1).

ToolCallLatencyMetrics

JSON-Darstellung
{ "tool": string, "averageLatency": string }

Felder

Felder
`tool`	`string` Nur Ausgabe. Der Name des Tools.
`averageLatency`	`string (Duration format)` Nur Ausgabe. Die durchschnittliche Latenz der Tool-Aufrufe. Die Dauer in Sekunden mit bis zu neun Nachkommastellen und am Ende mit „`s`“. Beispiel: `"3.5s"`.

tool

string

Nur Ausgabe. Der Name des Tools.

averageLatency

string (Duration format)

Nur Ausgabe. Die durchschnittliche Latenz der Tool-Aufrufe.

Die Dauer in Sekunden mit bis zu neun Nachkommastellen und am Ende mit „s“. Beispiel: "3.5s".

Dauer

JSON-Darstellung
{ "seconds": string, "nanos": integer }

Felder

Felder
`seconds`	`string (int64 format)` Vorzeichenbehaftete Sekunden des Zeitraums. Muss zwischen -315.576.000.000 und +315.576.000.000 (einschließlich) liegen. Hinweis: Diese Grenzen werden so berechnet: 60 Sek./Min. × 60 Min./Std. × 24 Std./Tag × 365,25 Tage/Jahr × 10.000 Jahre
`nanos`	`integer` Signierte Sekundenbruchteile mit Nanosekunden-Auflösung des Zeitraums. Dauern von weniger als einer Sekunde werden mit dem Feld `seconds` = 0 und einem positiven oder negativen Feld `nanos` dargestellt. Bei Zeiträumen von einer Sekunde oder mehr muss ein Wert ungleich null für das Feld `nanos` dasselbe Vorzeichen wie das Feld `seconds` haben. Muss zwischen -999.999.999 und +999.999.999 liegen (einschließlich).

seconds

string (int64 format)

Vorzeichenbehaftete Sekunden des Zeitraums. Muss zwischen -315.576.000.000 und +315.576.000.000 (einschließlich) liegen. Hinweis: Diese Grenzen werden so berechnet: 60 Sek./Min. × 60 Min./Std. × 24 Std./Tag × 365,25 Tage/Jahr × 10.000 Jahre

nanos

integer

Signierte Sekundenbruchteile mit Nanosekunden-Auflösung des Zeitraums. Dauern von weniger als einer Sekunde werden mit dem Feld seconds = 0 und einem positiven oder negativen Feld nanos dargestellt. Bei Zeiträumen von einer Sekunde oder mehr muss ein Wert ungleich null für das Feld nanos dasselbe Vorzeichen wie das Feld seconds haben. Muss zwischen -999.999.999 und +999.999.999 liegen (einschließlich).

TurnLatencyMetrics

JSON-Darstellung
{ "averageLatency": string }

Felder

Felder
`averageLatency`	`string (Duration format)` Nur Ausgabe. Die durchschnittliche Latenz der Züge. Die Dauer in Sekunden mit bis zu neun Nachkommastellen und am Ende mit „`s`“. Beispiel: `"3.5s"`.

averageLatency

string (Duration format)

Nur Ausgabe. Die durchschnittliche Latenz der Züge.

Die Dauer in Sekunden mit bis zu neun Nachkommastellen und am Ende mit „s“. Beispiel: "3.5s".

MetricsByTurn

JSON-Darstellung

JSON-Darstellung
{ "turnIndex": integer, "toolMetrics": [ { object (`ToolMetrics`) } ], "semanticSimilarityMetrics": [ { object (`SemanticSimilarityMetrics`) } ], "hallucinationMetrics": [ { object (`HallucinationMetrics`) } ], "toolCallLatencyMetrics": [ { object (`ToolCallLatencyMetrics`) } ], "turnLatencyMetrics": [ { object (`TurnLatencyMetrics`) } ] }

{
  "turnIndex": integer,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ]
}

Felder
`turnIndex`	`integer` Nur Ausgabe. Der Zugindex (0-basiert).
`toolMetrics[]`	`object (ToolMetrics)` Nur Ausgabe. Messwerte für jedes Tool in diesem Zug.
`semanticSimilarityMetrics[]`	`object (SemanticSimilarityMetrics)` Nur Ausgabe. Messwerte für die semantische Ähnlichkeit in diesem Turn.
`hallucinationMetrics[]`	`object (HallucinationMetrics)` Nur Ausgabe. Messwerte für Halluzinationen in diesem Turn.
`toolCallLatencyMetrics[]`	`object (ToolCallLatencyMetrics)` Nur Ausgabe. Messwerte für die Latenz von Tool-Aufrufen in diesem Zug.
`turnLatencyMetrics[]`	`object (TurnLatencyMetrics)` Nur Ausgabe. Messwerte für die Antwortlatenz in diesem Zug.

Tool-Annotationen

Destruktiver Hinweis: ❌ | Idempotenter Hinweis: ✅ | Nur-Lese-Hinweis: ✅ | Open-World-Hinweis: ❌

MCP Tools Reference: ces.googleapis.com Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Tool: list_evaluation_datasets

Eingabeschema

ListEvaluationDatasetsRequest

Ausgabeschema

ListEvaluationDatasetsResponse

EvaluationDataset

Zeitstempel

AggregatedMetrics

MetricsByAppVersion

ToolMetrics

SemanticSimilarityMetrics

HallucinationMetrics

ToolCallLatencyMetrics

Dauer

TurnLatencyMetrics

MetricsByTurn

Tool-Annotationen

MCP Tools Reference: ces.googleapis.com

Tool: `list_evaluation_datasets`