MCP Tools Reference: ces.googleapis.com

ツール: update_evaluation_dataset

指定された評価データセットを更新します。入力で常に更新マスクを渡してください。

次のサンプルは、curl を使用して update_evaluation_dataset MCP ツールを呼び出す方法を示しています。

Curl リクエスト
                  
curl --location 'https://ces.[REGION].rep.googleapis.com/mcp' \
--header 'content-type: application/json' \
--header 'accept: application/json, text/event-stream' \
--data '{
  "method": "tools/call",
  "params": {
    "name": "update_evaluation_dataset",
    "arguments": {
      // provide these details according to the tool's MCP specification
    }
  },
  "jsonrpc": "2.0",
  "id": 1
}'
                

入力スキーマ

EvaluationService.UpdateEvaluationDataset のリクエスト メッセージです。

UpdateEvaluationDatasetRequest

JSON 表現
{
  "evaluationDataset": {
    object (EvaluationDataset)
  },
  "updateMask": string
}
フィールド
evaluationDataset

object (EvaluationDataset)

必須。更新する評価データセット。

updateMask

string (FieldMask format)

省略可。フィールド マスクは、更新するフィールドを制御するために使用されます。マスクが存在しない場合は、すべてのフィールドが更新されます。

完全修飾フィールド名のカンマ区切りリスト。例: "user.displayName,photo"

EvaluationDataset

JSON 表現
{
  "name": string,
  "displayName": string,
  "evaluations": [
    string
  ],
  "createTime": string,
  "updateTime": string,
  "etag": string,
  "createdBy": string,
  "lastUpdatedBy": string,
  "aggregatedMetrics": {
    object (AggregatedMetrics)
  }
}
フィールド
name

string

ID。この評価データセットの固有識別子。形式: projects/{project}/locations/{location}/apps/{app}/evaluationDatasets/{evaluationDataset}

displayName

string

必須。評価データセットのユーザー定義の表示名。アプリ内で一意。

evaluations[]

string

省略可。このデータセットに含まれる評価。

createTime

string (Timestamp format)

出力専用。評価データセットが作成されたときのタイムスタンプ。

RFC 3339 を使用します。生成された出力は常に Z 正規化され、小数点以下は 0、3、6、または 9 桁になります。「Z」以外のオフセットも使用できます。例: "2014-10-02T15:01:23Z""2014-10-02T15:01:23.045123456Z""2014-10-02T15:01:23+05:30"

updateTime

string (Timestamp format)

出力専用。評価データセットが最後に更新されたときのタイムスタンプ。

RFC 3339 を使用します。生成された出力は常に Z 正規化され、小数点以下は 0、3、6、または 9 桁になります。「Z」以外のオフセットも使用できます。例: "2014-10-02T15:01:23Z""2014-10-02T15:01:23.045123456Z""2014-10-02T15:01:23+05:30"

etag

string

出力専用。読み取り、変更、書き込みオペレーション中にオブジェクトが変更されていないことを確認するために使用される ETag。etag が空の場合、更新によって同時変更が上書きされます。

createdBy

string

出力専用。評価データセットを作成したユーザー。

lastUpdatedBy

string

出力専用。評価データセットを最後に更新したユーザー。

aggregatedMetrics

object (AggregatedMetrics)

出力専用。すべての実行にわたるこの評価データセットの集計指標。

タイムスタンプ

JSON 表現
{
  "seconds": string,
  "nanos": integer
}
フィールド
seconds

string (int64 format)

UNIX エポック 1970-01-01T00:00:00Z からの UTC 時刻の秒数を表します。-62135596800~253402300799 の範囲(両端を含む)にする必要があります(これは 0001-01-01T00:00:00Z~9999-12-31T23:59:59Z に対応します)。

nanos

integer

ナノ秒分解能による、秒の負ではない小数以下部分。このフィールドは、秒の代替ではなく、期間のナノ秒部分です。小数以下を含む負の秒の値は、時間を前方にカウントする負ではない nanos 値を持つ必要があります。0~999,999,999 にする必要があります(両端を含む)。

AggregatedMetrics

JSON 表現
{
  "metricsByAppVersion": [
    {
      object (MetricsByAppVersion)
    }
  ]
}
フィールド
metricsByAppVersion[]

object (MetricsByAppVersion)

出力専用。アプリのバージョン ID でグループ化された集計指標。

MetricsByAppVersion

JSON 表現
{
  "appVersionId": string,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ],
  "passCount": integer,
  "failCount": integer,
  "metricsByTurn": [
    {
      object (MetricsByTurn)
    }
  ]
}
フィールド
appVersionId

string

出力専用。アプリのバージョン ID。

toolMetrics[]

object (ToolMetrics)

出力専用。このアプリ バージョン内の各ツールの指標。

semanticSimilarityMetrics[]

object (SemanticSimilarityMetrics)

出力専用。このアプリ バージョン内のセマンティック類似性の指標。

hallucinationMetrics[]

object (HallucinationMetrics)

出力専用。このアプリ バージョン内のハルシネーションの指標。

toolCallLatencyMetrics[]

object (ToolCallLatencyMetrics)

出力専用。このアプリ バージョン内のツール呼び出しレイテンシの指標。

turnLatencyMetrics[]

object (TurnLatencyMetrics)

出力専用。このアプリ バージョン内のターン レイテンシの指標。

passCount

integer

出力専用。評価に合格した回数。

failCount

integer

出力専用。評価が失敗した回数。

metricsByTurn[]

object (MetricsByTurn)

出力専用。このアプリ バージョン内のターンごとに集計された指標。

ToolMetrics

JSON 表現
{
  "tool": string,
  "passCount": integer,
  "failCount": integer
}
フィールド
tool

string

出力専用。ツールの名前。

passCount

integer

出力専用。ツールが合格した回数。

failCount

integer

出力専用。ツールが失敗した回数。

SemanticSimilarityMetrics

JSON 表現
{
  "score": number
}
フィールド
score

number

出力専用。平均意味的類似性スコア(0 ~ 4)。

HallucinationMetrics

JSON 表現
{
  "score": number
}
フィールド
score

number

出力専用。平均ハルシネーション スコア(0 ~ 1)。

ToolCallLatencyMetrics

JSON 表現
{
  "tool": string,
  "averageLatency": string
}
フィールド
tool

string

出力専用。ツールの名前。

averageLatency

string (Duration format)

出力専用。ツール呼び出しの平均レイテンシ。

s で終わる小数 9 桁までの秒単位の期間。例: "3.5s"

所要時間

JSON 表現
{
  "seconds": string,
  "nanos": integer
}
フィールド
seconds

string (int64 format)

期間の符号付き秒数。-315,576,000,000 ~+315,576,000,000 の範囲(両端を含む)にする必要があります。注: これらの境界は、60 秒/分 * 60 分/時間 * 24 時間/日 * 365.25 日/年 * 10,000 年から計算されます。

nanos

integer

期間のナノ秒分解能による、秒の符号付き小数以下部分。1 秒未満の期間は、0 の seconds フィールドと正または負の nanos フィールドで表されます。1 秒以上の期間の場合、nanos フィールドのゼロ以外の値は、seconds フィールドと同じ符号である必要があります。-999,999,999~+999,999,999 の範囲内(境界含む)である必要があります。

TurnLatencyMetrics

JSON 表現
{
  "averageLatency": string
}
フィールド
averageLatency

string (Duration format)

出力専用。ターンの平均レイテンシ。

s で終わる小数 9 桁までの秒単位の期間。例: "3.5s"

MetricsByTurn

JSON 表現
{
  "turnIndex": integer,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ]
}
フィールド
turnIndex

integer

出力専用。ターン インデックス(0 ベース)。

toolMetrics[]

object (ToolMetrics)

出力専用。このターンの各ツールの指標。

semanticSimilarityMetrics[]

object (SemanticSimilarityMetrics)

出力専用。このターンの意味的類似性の指標。

hallucinationMetrics[]

object (HallucinationMetrics)

出力専用。このターンのハルシネーションの指標。

toolCallLatencyMetrics[]

object (ToolCallLatencyMetrics)

出力専用。このターンのツール呼び出しレイテンシの指標。

turnLatencyMetrics[]

object (TurnLatencyMetrics)

出力専用。このターンのターン レイテンシの指標。

FieldMask

JSON 表現
{
  "paths": [
    string
  ]
}
フィールド
paths[]

string

フィールド マスクパスのセット。

出力スキーマ

評価データセットは、共有タグに基づいてグループ化された一連の評価を表します。

EvaluationDataset

JSON 表現
{
  "name": string,
  "displayName": string,
  "evaluations": [
    string
  ],
  "createTime": string,
  "updateTime": string,
  "etag": string,
  "createdBy": string,
  "lastUpdatedBy": string,
  "aggregatedMetrics": {
    object (AggregatedMetrics)
  }
}
フィールド
name

string

ID。この評価データセットの固有識別子。形式: projects/{project}/locations/{location}/apps/{app}/evaluationDatasets/{evaluationDataset}

displayName

string

必須。評価データセットのユーザー定義の表示名。アプリ内で一意。

evaluations[]

string

省略可。このデータセットに含まれる評価。

createTime

string (Timestamp format)

出力専用。評価データセットが作成されたときのタイムスタンプ。

RFC 3339 を使用します。生成された出力は常に Z 正規化され、小数点以下は 0、3、6、または 9 桁になります。「Z」以外のオフセットも使用できます。例: "2014-10-02T15:01:23Z""2014-10-02T15:01:23.045123456Z""2014-10-02T15:01:23+05:30"

updateTime

string (Timestamp format)

出力専用。評価データセットが最後に更新されたときのタイムスタンプ。

RFC 3339 を使用します。生成された出力は常に Z 正規化され、小数点以下は 0、3、6、または 9 桁になります。「Z」以外のオフセットも使用できます。例: "2014-10-02T15:01:23Z""2014-10-02T15:01:23.045123456Z""2014-10-02T15:01:23+05:30"

etag

string

出力専用。読み取り、変更、書き込みオペレーション中にオブジェクトが変更されていないことを確認するために使用される ETag。etag が空の場合、更新によって同時変更が上書きされます。

createdBy

string

出力専用。評価データセットを作成したユーザー。

lastUpdatedBy

string

出力専用。評価データセットを最後に更新したユーザー。

aggregatedMetrics

object (AggregatedMetrics)

出力専用。すべての実行にわたるこの評価データセットの集計指標。

タイムスタンプ

JSON 表現
{
  "seconds": string,
  "nanos": integer
}
フィールド
seconds

string (int64 format)

UNIX エポック 1970-01-01T00:00:00Z からの UTC 時刻の秒数を表します。-62135596800~253402300799 の範囲(両端を含む)にする必要があります(これは 0001-01-01T00:00:00Z~9999-12-31T23:59:59Z に対応します)。

nanos

integer

ナノ秒分解能による、秒の負ではない小数以下部分。このフィールドは、秒の代替ではなく、期間のナノ秒部分です。小数以下を含む負の秒の値は、時間を前方にカウントする負ではない nanos 値を持つ必要があります。0~999,999,999 にする必要があります(両端を含む)。

AggregatedMetrics

JSON 表現
{
  "metricsByAppVersion": [
    {
      object (MetricsByAppVersion)
    }
  ]
}
フィールド
metricsByAppVersion[]

object (MetricsByAppVersion)

出力専用。アプリのバージョン ID でグループ化された集計指標。

MetricsByAppVersion

JSON 表現
{
  "appVersionId": string,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ],
  "passCount": integer,
  "failCount": integer,
  "metricsByTurn": [
    {
      object (MetricsByTurn)
    }
  ]
}
フィールド
appVersionId

string

出力専用。アプリのバージョン ID。

toolMetrics[]

object (ToolMetrics)

出力専用。このアプリ バージョン内の各ツールの指標。

semanticSimilarityMetrics[]

object (SemanticSimilarityMetrics)

出力専用。このアプリ バージョン内のセマンティック類似性の指標。

hallucinationMetrics[]

object (HallucinationMetrics)

出力専用。このアプリ バージョン内のハルシネーションの指標。

toolCallLatencyMetrics[]

object (ToolCallLatencyMetrics)

出力専用。このアプリ バージョン内のツール呼び出しレイテンシの指標。

turnLatencyMetrics[]

object (TurnLatencyMetrics)

出力専用。このアプリ バージョン内のターン レイテンシの指標。

passCount

integer

出力専用。評価に合格した回数。

failCount

integer

出力専用。評価が失敗した回数。

metricsByTurn[]

object (MetricsByTurn)

出力専用。このアプリ バージョン内のターンごとに集計された指標。

ToolMetrics

JSON 表現
{
  "tool": string,
  "passCount": integer,
  "failCount": integer
}
フィールド
tool

string

出力専用。ツールの名前。

passCount

integer

出力専用。ツールが合格した回数。

failCount

integer

出力専用。ツールが失敗した回数。

SemanticSimilarityMetrics

JSON 表現
{
  "score": number
}
フィールド
score

number

出力専用。平均意味的類似性スコア(0 ~ 4)。

HallucinationMetrics

JSON 表現
{
  "score": number
}
フィールド
score

number

出力専用。平均ハルシネーション スコア(0 ~ 1)。

ToolCallLatencyMetrics

JSON 表現
{
  "tool": string,
  "averageLatency": string
}
フィールド
tool

string

出力専用。ツールの名前。

averageLatency

string (Duration format)

出力専用。ツール呼び出しの平均レイテンシ。

s で終わる小数 9 桁までの秒単位の期間。例: "3.5s"

所要時間

JSON 表現
{
  "seconds": string,
  "nanos": integer
}
フィールド
seconds

string (int64 format)

期間の符号付き秒数。-315,576,000,000 ~+315,576,000,000 の範囲(両端を含む)にする必要があります。注: これらの境界は、60 秒/分 * 60 分/時間 * 24 時間/日 * 365.25 日/年 * 10,000 年から計算されます。

nanos

integer

期間のナノ秒分解能による、秒の符号付き小数以下部分。1 秒未満の期間は、0 の seconds フィールドと正または負の nanos フィールドで表されます。1 秒以上の期間の場合、nanos フィールドのゼロ以外の値は、seconds フィールドと同じ符号である必要があります。-999,999,999~+999,999,999 の範囲内(境界含む)である必要があります。

TurnLatencyMetrics

JSON 表現
{
  "averageLatency": string
}
フィールド
averageLatency

string (Duration format)

出力専用。ターンの平均レイテンシ。

s で終わる小数 9 桁までの秒単位の期間。例: "3.5s"

MetricsByTurn

JSON 表現
{
  "turnIndex": integer,
  "toolMetrics": [
    {
      object (ToolMetrics)
    }
  ],
  "semanticSimilarityMetrics": [
    {
      object (SemanticSimilarityMetrics)
    }
  ],
  "hallucinationMetrics": [
    {
      object (HallucinationMetrics)
    }
  ],
  "toolCallLatencyMetrics": [
    {
      object (ToolCallLatencyMetrics)
    }
  ],
  "turnLatencyMetrics": [
    {
      object (TurnLatencyMetrics)
    }
  ]
}
フィールド
turnIndex

integer

出力専用。ターン インデックス(0 ベース)。

toolMetrics[]

object (ToolMetrics)

出力専用。このターンの各ツールの指標。

semanticSimilarityMetrics[]

object (SemanticSimilarityMetrics)

出力専用。このターンの意味的類似性の指標。

hallucinationMetrics[]

object (HallucinationMetrics)

出力専用。このターンのハルシネーションの指標。

toolCallLatencyMetrics[]

object (ToolCallLatencyMetrics)

出力専用。このターンのツール呼び出しレイテンシの指標。

turnLatencyMetrics[]

object (TurnLatencyMetrics)

出力専用。このターンのターン レイテンシの指標。

ツールのアノテーション

破壊的ヒント: ❌ | べき等ヒント: ❌ | 読み取り専用ヒント: ❌ | オープン ワールド ヒント: ❌