Bonnes pratiques de modélisation thématique

Suivez ces bonnes pratiques pour exploiter tout le potentiel de vos modèles thématiques.

Affiner un modèle de sujet

Le meilleur moyen d'améliorer l'attribution des thèmes est d'affiner votre modèle. Suivez ces consignes pour optimiser votre modèle thématique lorsque vous ajoutez, modifiez et supprimez des thèmes.

Ajouter ou modifier un thème

Évitez d'ajouter des thèmes en double ou similaires, car ils auront un impact négatif sur la qualité des inférences de thèmes. Lorsque vous créez ou modifiez un sujet, appliquez les consignes suivantes concernant le nom et la description.

Nom

  • Utilisez des sujets courts et descriptifs de trois à six mots, comme dépannage de la télécommande ou demande d'informations sur la politique de facturation.

  • Évitez les noms génériques ou abstraits, tels que Ventes.

Vous pouvez également suivre les bonnes pratiques suivantes :

  • Utilisez des noms de thèmes personnalisés facilement disponibles, tels que Facturation.

  • Ajoutez une brève description au nom de la rubrique, par exemple "Erreurs de facturation et remboursements".

  • Choisissez une configuration de modèle adaptée en fonction des résultats souhaités.

Exemple

Le centre d'assistance d'une société de cartes de crédit effectue une modélisation thématique sur les journaux d'appels d'assistance archivés. La modélisation crée un thème à partir d'un groupe de conversations et le nomme Demandes concernant le dépassement de la limite de la carte de crédit. L'entreprise raccourcit le nom en Demandes concernant la limite de crédit.

Description

  • Utilisez une description générale suivie de quelques exemples.

  • Évitez d'inclure des informations personnelles telles que des noms, des dates ou des lieux.

  • Trop de détails, comme "n'incluez pas le thème X", peuvent avoir un impact négatif sur l'inférence de thèmes.

Exemples
  • Le client s'interroge sur son service de téléphonie fixe. Il peut souhaiter l'annuler ou obtenir des informations sur la facturation en cours.

  • Le client s'interroge sur sa facture. Il voudra peut-être connaître le montant ou la date limite.

Supprimer des thèmes secondaires

Une fois votre modèle thématique déployé et une analyse effectuée, vérifiez la distribution des thèmes sur la page Données du modèle thématique déployé. Les thèmes secondaires peuvent être le thème dominant dans les résultats déployés, car ils peuvent être courants et avoir des correspondances plus fortes. Les thèmes qui correspondent à une forte proportion (plus de 30 %) de vos exemples de conversations sont probablement des thèmes secondaires. Examinez attentivement ces thèmes et supprimez-les s'ils ne sont pas pertinents.

L'existence de thèmes secondaires non pertinents dépend fortement des données d'entrée. Si tous les principaux thèmes de la page Données déployées sont répartis de manière relativement uniforme et que chaque thème ne correspond qu'à une petite partie des conversations (moins de 20 %), il n'y a probablement pas de thèmes secondaires à supprimer.

Données d'entraînement

Pour les données vocales, la qualité des sorties Speech-to-Text est essentielle aux performances du modèle thématique. Suivez ces consignes pour améliorer la qualité de vos données d'entraînement.

Conversations

  • Évitez d'utiliser des conversations en double dans l'ensemble de données.

  • Chaque conversation doit comporter au moins 10 tours au total, dont 5 de l'agent et 5 du client.

  • Utilisez des conversations masquées, mais vérifiez la qualité du masquage Cloud Data Loss Prevention. Parfois, la rédaction supprime des informations importantes des transcriptions, ce qui peut affecter la durée de vos conversations d'entraînement.

  • Assurez-vous que presque toutes les conversations sont dans la même langue.

Rôles de l'orateur

Assurez-vous que les rôles des intervenants de la conversation sont correctement attribués après l'ingestion de la conversation.

  • Identifier avec précision les tours de parole comme provenant d'un client ou d'un agent Les conversations avec un seul rôle ne seront pas utilisées pour l'entraînement.

  • Utilisez AGENT pour les rôles humains et AUTOMATED_AGENT pour les rôles virtuels.

  • Utilisez END_USER ou CUSTOMER pour les rôles client.