Cette page décrit le format requis pour importer des évaluations de référence dans un fichier CSV. Pour en savoir plus sur les évaluations de référence, consultez la documentation sur les évaluations de référence.
Télécharger le modèle
- Accédez à l'onglet Évaluer, puis cliquez sur + Ajouter un cas de test > Golden.
- Dans le menu qui s'affiche, cliquez sur Télécharger le modèle.
- Une fois que vous avez utilisé le modèle pour créer un fichier CSV contenant vos évaluations de référence, vous pouvez l'importer en cliquant sur Importer un fichier dans le même menu.
Structure générale
- Un même fichier CSV peut contenir plusieurs évaluations. Chaque évaluation peut s'étendre sur plusieurs lignes.
- La première ligne d'une évaluation est la ligne d'évaluation et définit ses propriétés générales (nom et métadonnées).
- Chaque ligne suivante est une ligne de conversation et définit un seul tour de conversation dans l'évaluation (par exemple, un utilisateur final dit quelque chose, l'agent est censé répondre ou un appel d'outil est attendu).
- Vous pouvez créer un cas de test en saisissant un nouveau nom dans la colonne
display_name. Chaque nouvelle valeurdisplay_namedéfinit le début d'une nouvelle évaluation.
Ligne d'en-tête
La première ligne de votre fichier CSV doit être une ligne d'en-tête. Cet en-tête définit une variable de données dans chaque colonne. Toutes les variables autres que les variables obligatoires sont facultatives, sauf si une valeur action_type est requise.
Les colonnes de variables facultatives peuvent être dans n'importe quel ordre après les variables obligatoires.
- Variables requises :
display_name,turn_index,action_type.
Définir une évaluation de conversation
Chaque nouvelle évaluation commence sur une ligne d'évaluation. Chaque ligne de conversation sous la ligne d'évaluation correspond à un tour de conversation, jusqu'à la ligne d'évaluation suivante.
Ligne d'évaluation
La première ligne après la ligne d'en-tête doit être une ligne d'évaluation. Chaque ligne d'évaluation définit une nouvelle évaluation.
- Obligatoire : saisissez un nom unique et lisible pour l'évaluation dans le champ
display_name. - Facultatif : vous pouvez ajouter des données de variables de métadonnées dans cette ligne.
Ligne de conversation
Chaque ligne correspond aux données d'un tour de conversation.
- Obligatoire : saisissez des valeurs dans les champs
turn_indexetaction_type. Le champdisplay_namedoit être laissé vide. - Facultatif : Saisissez les valeurs des colonnes d'en-tête autres que les variables de métadonnées ou
display_name.
Variables
Les tableaux suivants décrivent les variables de données disponibles. Toutes les variables autres que celles requises sont facultatives, sauf si une valeur action_type l'exige. Toutes les variables doivent être définies dans la ligne d'en-tête, une par colonne.
Les colonnes de variables facultatives peuvent être dans n'importe quel ordre après les colonnes obligatoires.
Variables d'en-tête requises
| Nom de la colonne | Description |
|---|---|
display_name |
Nom lisible de votre évaluation. Ce champ n'est renseigné que pour la première ligne d'une nouvelle évaluation. Chaque nouvelle valeur display_name définit une nouvelle évaluation. |
turn_index |
Nombre (1, 2, 3, etc.) indiquant l'ordre séquentiel du tour de conversation. Toutes les lignes d'un même tour partagent la même valeur d'index. Les valeurs doivent commencer à 1 pour chaque évaluation. La valeur de chaque ligne suivante doit être égale ou supérieure à celle de la ligne précédente. |
action_type |
Indique ce que représentent les données de cette ligne. Chaque valeur comporte des valeurs de variables facultatives qui doivent également être renseignées (comme indiqué) pour que le tour de conversation soit correctement saisi. La valeur d'entrée doit être l'une des suivantes :INPUT_TEXT : saisie de texte par l'utilisateur final.: obligatoire. text_contentINPUT_IMAGE : entrée d'image de l'utilisateur final.– (Obligatoire) image_mime_type, image_content.INPUT_TOOL_RESPONSE : entrée de réponse de l'outil.- (Obligatoire) tool_name.- (Facultatif) tool_response_json.INPUT_UPDATED_VARIABLES : met à jour les variables à partir d'une entrée.- (Obligatoire) updated_variables_jsonEXPECTATION_TEXT : résultat attendu d'une réponse textuelle de l'agent.- (Obligatoire) response_agent, text_content.- (Facultatif) expectation_note.EXPECTATION_TOOL_CALL : appel d'outil attendu.- (Obligatoire) tool_name.- (Facultatif) tool_call_args_json, expectation_note.EXPECTATION_TOOL_RESPONSE : réponse attendue de l'outil.- (Obligatoire) tool_name.- (Facultatif) expectation_note.EXPECTATION_AGENT_TRANSFER : transfert d'agent attendu.- (Obligatoire) agent_transfer_target.- (Facultatif) expectation_note. |
Variables de métadonnées
| Nom de la colonne | Description |
|---|---|
evaluation_id |
Identifiant unique de l'évaluation. Chaque valeur evaluation_id doit être unique pour votre agent Customer Experience Agent Studio. Si aucune valeur n'est saisie manuellement dans cette colonne, un ID unique est généré automatiquement. |
description |
Notes en texte libre ou description de l'objectif de l'évaluation. |
tags |
Tags séparés par un point-virgule pour organiser les évaluations (par exemple, "tag1;tag2"). |
evaluation_groups |
Noms des groupes d'évaluation auxquels appartient l'évaluation, séparés par des points-virgules (par exemple, "nom du groupe 1;nom du groupe 2"). Toutes les valeurs evaluation_groups saisies dans cette colonne, mais non définies dans l'en-tête, seront ignorées. |
Variables de tour de conversation
| Nom de la colonne | Description |
|---|---|
response_agent |
Nom de l'agent ayant fourni la réponse. Attendu uniquement pour EXPECTATION_TEXT. |
text_content |
Texte pour INPUT_TEXT ou EXPECTATION_TEXT. |
image_mime_type |
Type MIME standard IANA de l'image source. Valeurs autorisées : image/png, image/jpeg, image/webp, image/heic, image/heif. |
image_content |
Chaîne d'octets de INPUT_IMAGE. |
tool_name |
display_name de l'outil appelé ou qui répond. Valeur attendue pour INPUT_TOOL_RESPONSE,EXPECTATION_TOOL_CALL ou EXPECTATION_TOOL_RESPONSE. |
tool_call_args_json |
Arguments JSON pour un EXPECTATION_TOOL_CALL. |
tool_response_json |
Contenu JSON d'un INPUT_TOOL_RESPONSE. |
updated_variables_json |
Contenu JSON pour INPUT_UPDATED_VARIABLES. |
agent_transfer_target |
Nom à afficher de l'agent cible pour un EXPECTATION_AGENT_TRANSFER. |
expectation_note |
Note ou description de l'attente. |