Importation groupée des évaluations

Cette page décrit le format requis pour importer des évaluations de référence dans un fichier CSV. Pour en savoir plus sur les évaluations de référence, consultez la documentation sur les évaluations de référence.

Télécharger le modèle

  • Accédez à l'onglet Évaluer, puis cliquez sur + Ajouter un cas de test > Golden.
  • Dans le menu qui s'affiche, cliquez sur Télécharger le modèle.
  • Une fois que vous avez utilisé le modèle pour créer un fichier CSV contenant vos évaluations de référence, vous pouvez l'importer en cliquant sur Importer un fichier dans le même menu.

Structure générale

  • Un même fichier CSV peut contenir plusieurs évaluations. Chaque évaluation peut s'étendre sur plusieurs lignes.
  • La première ligne d'une évaluation est la ligne d'évaluation et définit ses propriétés générales (nom et métadonnées).
  • Chaque ligne suivante est une ligne de conversation et définit un seul tour de conversation dans l'évaluation (par exemple, un utilisateur final dit quelque chose, l'agent est censé répondre ou un appel d'outil est attendu).
  • Vous pouvez créer un cas de test en saisissant un nouveau nom dans la colonne display_name. Chaque nouvelle valeur display_name définit le début d'une nouvelle évaluation.

Ligne d'en-tête

La première ligne de votre fichier CSV doit être une ligne d'en-tête. Cet en-tête définit une variable de données dans chaque colonne. Toutes les variables autres que les variables obligatoires sont facultatives, sauf si une valeur action_type est requise. Les colonnes de variables facultatives peuvent être dans n'importe quel ordre après les variables obligatoires.

  • Variables requises : display_name, turn_index, action_type.

Définir une évaluation de conversation

Chaque nouvelle évaluation commence sur une ligne d'évaluation. Chaque ligne de conversation sous la ligne d'évaluation correspond à un tour de conversation, jusqu'à la ligne d'évaluation suivante.

Ligne d'évaluation

La première ligne après la ligne d'en-tête doit être une ligne d'évaluation. Chaque ligne d'évaluation définit une nouvelle évaluation.

  • Obligatoire : saisissez un nom unique et lisible pour l'évaluation dans le champ display_name.
  • Facultatif : vous pouvez ajouter des données de variables de métadonnées dans cette ligne.

Ligne de conversation

Chaque ligne correspond aux données d'un tour de conversation.

  • Obligatoire : saisissez des valeurs dans les champs turn_index et action_type. Le champ display_name doit être laissé vide.
  • Facultatif : Saisissez les valeurs des colonnes d'en-tête autres que les variables de métadonnées ou display_name.

Variables

Les tableaux suivants décrivent les variables de données disponibles. Toutes les variables autres que celles requises sont facultatives, sauf si une valeur action_type l'exige. Toutes les variables doivent être définies dans la ligne d'en-tête, une par colonne. Les colonnes de variables facultatives peuvent être dans n'importe quel ordre après les colonnes obligatoires.

Variables d'en-tête requises

Nom de la colonne Description
display_name Nom lisible de votre évaluation. Ce champ n'est renseigné que pour la première ligne d'une nouvelle évaluation. Chaque nouvelle valeur display_name définit une nouvelle évaluation.
turn_index Nombre (1, 2, 3, etc.) indiquant l'ordre séquentiel du tour de conversation. Toutes les lignes d'un même tour partagent la même valeur d'index. Les valeurs doivent commencer à 1 pour chaque évaluation. La valeur de chaque ligne suivante doit être égale ou supérieure à celle de la ligne précédente.
action_type Indique ce que représentent les données de cette ligne. Chaque valeur comporte des valeurs de variables facultatives qui doivent également être renseignées (comme indiqué) pour que le tour de conversation soit correctement saisi. La valeur d'entrée doit être l'une des suivantes :

INPUT_TEXT : saisie de texte par l'utilisateur final.
 : obligatoire. text_content

INPUT_IMAGE : entrée d'image de l'utilisateur final.
 – (Obligatoire) image_mime_type, image_content.

INPUT_TOOL_RESPONSE : entrée de réponse de l'outil.
- (Obligatoire) tool_name.
- (Facultatif) tool_response_json.

INPUT_UPDATED_VARIABLES : met à jour les variables à partir d'une entrée.
- (Obligatoire) updated_variables_json

EXPECTATION_TEXT : résultat attendu d'une réponse textuelle de l'agent.
- (Obligatoire) response_agent, text_content.
- (Facultatif) expectation_note.

EXPECTATION_TOOL_CALL : appel d'outil attendu.
- (Obligatoire) tool_name.
- (Facultatif) tool_call_args_json, expectation_note.

EXPECTATION_TOOL_RESPONSE : réponse attendue de l'outil.
- (Obligatoire) tool_name.
- (Facultatif) expectation_note.

EXPECTATION_AGENT_TRANSFER : transfert d'agent attendu.
- (Obligatoire) agent_transfer_target.
- (Facultatif) expectation_note.

Variables de métadonnées

Nom de la colonne Description
evaluation_id Identifiant unique de l'évaluation. Chaque valeur evaluation_id doit être unique pour votre agent Customer Experience Agent Studio. Si aucune valeur n'est saisie manuellement dans cette colonne, un ID unique est généré automatiquement.
description Notes en texte libre ou description de l'objectif de l'évaluation.
tags Tags séparés par un point-virgule pour organiser les évaluations (par exemple, "tag1;tag2").
evaluation_groups Noms des groupes d'évaluation auxquels appartient l'évaluation, séparés par des points-virgules (par exemple, "nom du groupe 1;nom du groupe 2"). Toutes les valeurs evaluation_groups saisies dans cette colonne, mais non définies dans l'en-tête, seront ignorées.

Variables de tour de conversation

Nom de la colonne Description
response_agent Nom de l'agent ayant fourni la réponse. Attendu uniquement pour EXPECTATION_TEXT.
text_content Texte pour INPUT_TEXT ou EXPECTATION_TEXT.
image_mime_type Type MIME standard IANA de l'image source. Valeurs autorisées : image/png, image/jpeg, image/webp, image/heic, image/heif.
image_content Chaîne d'octets de INPUT_IMAGE.
tool_name display_name de l'outil appelé ou qui répond. Valeur attendue pour INPUT_TOOL_RESPONSE,EXPECTATION_TOOL_CALL ou EXPECTATION_TOOL_RESPONSE.
tool_call_args_json Arguments JSON pour un EXPECTATION_TOOL_CALL.
tool_response_json Contenu JSON d'un INPUT_TOOL_RESPONSE.
updated_variables_json Contenu JSON pour INPUT_UPDATED_VARIABLES.
agent_transfer_target Nom à afficher de l'agent cible pour un EXPECTATION_AGENT_TRANSFER.
expectation_note Note ou description de l'attente.