Caricamento batch della valutazione

Questa pagina descrive il formato richiesto per caricare le valutazioni di riferimento in un file CSV. Per informazioni dettagliate sulle valutazioni di riferimento, consulta la documentazione sulle valutazioni di riferimento.

Scarica il modello

  • Vai alla scheda Valuta e fai clic su + Aggiungi caso di test -> Golden.
  • Nel menu visualizzato, fai clic su Scarica modello.
  • Dopo aver utilizzato il modello per creare un file CSV contenente le valutazioni di riferimento, puoi caricarlo facendo clic su Carica file nello stesso menu.

Struttura generale

  • Un singolo file CSV può contenere più valutazioni. Ogni valutazione può estendersi su più righe.
  • La prima riga di una valutazione è la riga di valutazione e definisce le sue proprietà generali (nome e metadati).
  • Ogni riga successiva è una riga di conversazione e definisce un singolo turno di conversazione nella valutazione (ad esempio, un utente finale dice qualcosa, l'agente deve rispondere o è prevista una chiamata allo strumento).
  • Puoi avviare un nuovo scenario di test fornendo un nuovo nome nella colonna display_name. Ogni nuovo valore di display_name definisce l'inizio di una nuova valutazione.

Riga di intestazione

Il file CSV deve avere una riga di intestazione come prima riga. Questa intestazione definisce una variabile di dati in ogni colonna. Tutte le variabili diverse da quelle obbligatorie sono facoltative, a meno che non siano richieste da un valore action_type. Le colonne delle variabili facoltative possono essere in qualsiasi ordine dopo le variabili obbligatorie.

  • Variabili obbligatorie: display_name, turn_index, action_type.

Definire una valutazione della conversazione

Ogni nuova valutazione inizia in una riga di valutazione. Ogni riga di conversazione sotto la riga di valutazione corrisponde a un turno di conversazione, fino alla riga di valutazione successiva.

Riga di valutazione

La prima riga dopo la riga di intestazione deve essere una riga di valutazione. Ogni riga di valutazione definisce una nuova valutazione.

  • Obbligatorio:inserisci un nome univoco e leggibile per la valutazione nel campo display_name.
  • (Facoltativo) Puoi aggiungere facoltativamente qualsiasi dato della variabile dei metadati in questa riga.

Riga della conversazione

Ogni riga corrisponde ai dati di un turno di conversazione.

  • Obbligatorio:inserisci i valori nei campi turn_index e action_type. display_name deve essere lasciato vuoto.
  • (Facoltativo) Inserisci i valori per le colonne di intestazione diverse dalle variabili dei metadati o display_name.

Variabili

Le tabelle seguenti descrivono le variabili di dati disponibili. Tutte le variabili diverse da quelle obbligatorie sono facoltative, a meno che non siano richieste da un valore action_type. Tutte le variabili devono essere definite nella riga di intestazione, una per colonna. Le colonne delle variabili facoltative possono essere in qualsiasi ordine dopo le colonne obbligatorie.

Variabili di intestazione obbligatorie

Nome colonna Descrizione
display_name Il nome leggibile della tua valutazione. Questo campo viene compilato solo per la prima riga di una nuova valutazione. Ogni nuovo valore di display_name definisce una nuova valutazione.
turn_index Un numero (1, 2, 3...) che indica l'ordine sequenziale del turno di conversazione. Tutte le righe di un turno condividono il valore dell'indice. I valori devono iniziare da 1 per ogni valutazione. Ogni riga successiva deve avere un valore uguale o superiore a quello della riga precedente.
action_type Specifica cosa rappresentano i dati di questa riga. Ogni valore ha valori di variabili facoltativi che devono essere compilati (come indicato) affinché il turno di conversazione venga inserito correttamente. Il valore di input deve essere uno dei seguenti:

INPUT_TEXT: un input di testo dell'utente finale.
- (obbligatorio) text_content.

INPUT_IMAGE: un input di immagine dell'utente finale.
- (obbligatorio) image_mime_type, image_content.

INPUT_TOOL_RESPONSE: un input di risposta dello strumento.
- (Obbligatorio) tool_name.
- (Facoltativo) tool_response_json.

INPUT_UPDATED_VARIABLES: aggiorna le variabili da un input.
- (Obbligatorio) updated_variables_json

EXPECTATION_TEXT: output previsto da una risposta di testo dell'agente.
- (Obbligatorio) response_agent, text_content.
- (Facoltativo) expectation_note.

EXPECTATION_TOOL_CALL: Chiamata allo strumento prevista.
- (Obbligatorio) tool_name.
- (Facoltativo) tool_call_args_json, expectation_note.

EXPECTATION_TOOL_RESPONSE: risposta prevista dello strumento.
- (Obbligatorio) tool_name.
- (Facoltativo) expectation_note.

EXPECTATION_AGENT_TRANSFER: Expected agent transfer.
- (Obbligatorio) agent_transfer_target.
- (Facoltativo) expectation_note.

Variabili dei metadati

Nome colonna Descrizione
evaluation_id Un ID univoco per la valutazione. Ogni valore evaluation_id deve essere univoco per l'agente Customer Experience Agent Studio. Se non viene inserito manualmente alcun valore in questa colonna, verrà generato automaticamente un ID univoco.
description Note in formato libero o una descrizione dello scopo della valutazione.
tags Tag separati da punto e virgola per organizzare le valutazioni (ad esempio "tag1;tag2").
evaluation_groups Nomi separati da punto e virgola di eventuali gruppi di valutazione a cui appartiene la valutazione (ad esempio "nome gruppo 1;nome gruppo 2"). Eventuali valori evaluation_groups inseriti in questa colonna ma non definiti nell'intestazione verranno ignorati.

Variabili del turno di conversazione

Nome colonna Descrizione
response_agent Nome dell'agente che ha fornito la risposta. Previsto solo per EXPECTATION_TEXT.
text_content Il testo per INPUT_TEXT o EXPECTATION_TEXT.
image_mime_type Il tipo MIME standard IANA dell'immagine di origine. Valori supportati: image/png, image/jpeg, image/webp, image/heic, image/heif.
image_content Stringa di byte di INPUT_IMAGE.
tool_name Il display_name per lo strumento chiamato o che risponde. Previsto per INPUT_TOOL_RESPONSE,EXPECTATION_TOOL_CALL o EXPECTATION_TOOL_RESPONSE.
tool_call_args_json Gli argomenti JSON per un EXPECTATION_TOOL_CALL.
tool_response_json I contenuti JSON di un INPUT_TOOL_RESPONSE.
updated_variables_json I contenuti JSON per INPUT_UPDATED_VARIABLES.
agent_transfer_target Nome visualizzato dell'agente di destinazione per un EXPECTATION_AGENT_TRANSFER.
expectation_note Nota o descrizione dell'aspettativa.