Importation groupée des évaluations

Cette page décrit le format requis pour importer des évaluations de référence dans un fichier CSV. Pour en savoir plus sur les évaluations de référence, consultez la documentation sur les évaluations de référence.

Télécharger le modèle

Accédez à l'onglet Évaluer, puis cliquez sur + Ajouter un cas de test > Golden.
Dans le menu qui s'affiche, cliquez sur Télécharger le modèle.
Une fois que vous avez utilisé le modèle pour créer un fichier CSV contenant vos évaluations de référence, vous pouvez l'importer en cliquant sur Importer un fichier dans le même menu.

Structure générale

Un même fichier CSV peut contenir plusieurs évaluations. Chaque évaluation peut s'étendre sur plusieurs lignes.
La première ligne d'une évaluation est la ligne d'évaluation et définit ses propriétés générales (nom et métadonnées).
Chaque ligne suivante est une ligne de conversation et définit un seul tour de conversation dans l'évaluation (par exemple, un utilisateur final dit quelque chose, l'agent est censé répondre ou un appel d'outil est attendu).
Vous pouvez créer un cas de test en saisissant un nouveau nom dans la colonne display_name. Chaque nouvelle valeur display_name définit le début d'une nouvelle évaluation.

Ligne d'en-tête

La première ligne de votre fichier CSV doit être une ligne d'en-tête. Cet en-tête définit une variable de données dans chaque colonne. Toutes les variables autres que les variables obligatoires sont facultatives, sauf si une valeur action_type est requise. Les colonnes de variables facultatives peuvent être dans n'importe quel ordre après les variables obligatoires.

Variables requises : display_name, turn_index, action_type.

Définir une évaluation de conversation

Chaque nouvelle évaluation commence sur une ligne d'évaluation. Chaque ligne de conversation sous la ligne d'évaluation correspond à un tour de conversation, jusqu'à la ligne d'évaluation suivante.

Ligne d'évaluation

La première ligne après la ligne d'en-tête doit être une ligne d'évaluation. Chaque ligne d'évaluation définit une nouvelle évaluation.

Obligatoire : saisissez un nom unique et lisible pour l'évaluation dans le champ display_name.
Facultatif : vous pouvez ajouter des données de variables de métadonnées dans cette ligne.

Ligne de conversation

Chaque ligne correspond aux données d'un tour de conversation.

Obligatoire : saisissez des valeurs dans les champs turn_index et action_type. Le champ display_name doit être laissé vide.
Facultatif : Saisissez les valeurs des colonnes d'en-tête autres que les variables de métadonnées ou display_name.

Variables

Les tableaux suivants décrivent les variables de données disponibles. Toutes les variables autres que celles requises sont facultatives, sauf si une valeur action_type l'exige. Toutes les variables doivent être définies dans la ligne d'en-tête, une par colonne. Les colonnes de variables facultatives peuvent être dans n'importe quel ordre après les colonnes obligatoires.

Variables d'en-tête requises

Nom de la colonne	Description
`display_name`	Nom lisible de votre évaluation. Ce champ n'est renseigné que pour la première ligne d'une nouvelle évaluation. Chaque nouvelle valeur `display_name` définit une nouvelle évaluation.
`turn_index`	Nombre (1, 2, 3, etc.) indiquant l'ordre séquentiel du tour de conversation. Toutes les lignes d'un même tour partagent la même valeur d'index. Les valeurs doivent commencer à 1 pour chaque évaluation. La valeur de chaque ligne suivante doit être égale ou supérieure à celle de la ligne précédente.
`action_type`	Indique ce que représentent les données de cette ligne. Chaque valeur comporte des valeurs de variables facultatives qui doivent également être renseignées (comme indiqué) pour que le tour de conversation soit correctement saisi. La valeur d'entrée doit être l'une des suivantes : `INPUT_TEXT` : saisie de texte par l'utilisateur final. : obligatoire. `text_content` `INPUT_IMAGE` : entrée d'image de l'utilisateur final. – (Obligatoire) `image_mime_type`, `image_content`. `INPUT_TOOL_RESPONSE` : entrée de réponse de l'outil. - (Obligatoire) `tool_name`. - (Facultatif) `tool_response_json`. `INPUT_UPDATED_VARIABLES` : met à jour les variables à partir d'une entrée. - (Obligatoire) `updated_variables_json` `EXPECTATION_TEXT` : résultat attendu d'une réponse textuelle de l'agent. - (Obligatoire) `response_agent`, `text_content`. - (Facultatif) `expectation_note`. `EXPECTATION_TOOL_CALL` : appel d'outil attendu. - (Obligatoire) `tool_name`. - (Facultatif) `tool_call_args_json`, `expectation_note`. `EXPECTATION_TOOL_RESPONSE` : réponse attendue de l'outil. - (Obligatoire) `tool_name`. - (Facultatif) `expectation_note`. `EXPECTATION_AGENT_TRANSFER` : transfert d'agent attendu. - (Obligatoire) `agent_transfer_target`. - (Facultatif) `expectation_note`.

Variables de métadonnées

Nom de la colonne	Description
`evaluation_id`	Identifiant unique de l'évaluation. Chaque valeur `evaluation_id` doit être unique pour votre agent Customer Experience Agent Studio. Si aucune valeur n'est saisie manuellement dans cette colonne, un ID unique est généré automatiquement.
`description`	Notes en texte libre ou description de l'objectif de l'évaluation.
`tags`	Tags séparés par un point-virgule pour organiser les évaluations (par exemple, "tag1;tag2").
`evaluation_groups`	Noms des groupes d'évaluation auxquels appartient l'évaluation, séparés par des points-virgules (par exemple, "nom du groupe 1;nom du groupe 2"). Toutes les valeurs `evaluation_groups` saisies dans cette colonne, mais non définies dans l'en-tête, seront ignorées.

Variables de tour de conversation

Nom de la colonne	Description
`response_agent`	Nom de l'agent ayant fourni la réponse. Attendu uniquement pour `EXPECTATION_TEXT`.
`text_content`	Texte pour `INPUT_TEXT` ou `EXPECTATION_TEXT`.
`image_mime_type`	Type MIME standard IANA de l'image source. Valeurs autorisées : `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`.
`image_content`	Chaîne d'octets de `INPUT_IMAGE`.
`tool_name`	`display_name` de l'outil appelé ou qui répond. Valeur attendue pour `INPUT_TOOL_RESPONSE,EXPECTATION_TOOL_CALL` ou `EXPECTATION_TOOL_RESPONSE`.
`tool_call_args_json`	Arguments JSON pour un `EXPECTATION_TOOL_CALL`.
`tool_response_json`	Contenu JSON d'un `INPUT_TOOL_RESPONSE`.
`updated_variables_json`	Contenu JSON pour `INPUT_UPDATED_VARIABLES`.
`agent_transfer_target`	Nom à afficher de l'agent cible pour un `EXPECTATION_AGENT_TRANSFER`.
`expectation_note`	Note ou description de l'attente.