Mit diesen Best Practices können Sie Ihre Themenmodelle optimal nutzen.
Themenmodell abstimmen
Die beste Möglichkeit, die Themenzuweisung zu verbessern, besteht darin, Ihr Modell abzustimmen. Beachten Sie die folgenden Richtlinien, um Ihr Themenmodell zu optimieren, wenn Sie Themen hinzufügen, bearbeiten oder entfernen.
Thema hinzufügen oder bearbeiten
Fügen Sie keine doppelten oder ähnlichen Themen hinzu, da dies die Qualität der Themenableitungen beeinträchtigt. Beachten Sie beim Erstellen oder Ändern eines Themas die folgenden Richtlinien für Namen und Beschreibungen.
Name
Verwenden Sie kurze, beschreibende Themen mit drei bis sechs Wörtern, z. B. Fehlerbehebung bei der Fernbedienung oder Frage zur Abrechnungsrichtlinie.
Vermeiden Sie allgemeine oder abstrakte Namen wie Umsatz.
Optional können Sie diese Best Practices befolgen:
Verwenden Sie leicht verfügbare benutzerdefinierte Themennamen wie Abrechnung.
Fügen Sie dem Namen des Themas eine kurze Beschreibung hinzu, z. B. „Abrechnungsfehler und Erstattungen“.
Wählen Sie eine geeignete Modellkonfiguration basierend auf den gewünschten Ergebnissen aus.
Beispiel
Das Supportcenter eines Kreditkartenunternehmens führt Topic Modeling für seine archivierten Supportanrufprotokolle durch. Bei der Modellierung wird aus einem Cluster von Unterhaltungen ein Thema erstellt und mit dem Namen Anfragen zu Kreditkartenlimits versehen. Das Unternehmen kürzt den Namen auf Anfragen zum Kreditlimit.
Beschreibung
Verwenden Sie eine allgemeine Beschreibung, gefolgt von einigen Beispielen.
Vermeiden Sie die Angabe personenbezogener Daten wie Namen, Daten oder Orte.
Zu viele Details, z. B. „Schließe das Thema X aus“, können sich negativ auf die Themenableitung auswirken.
Beispiele
Der Kunde erkundigt sich nach seinem Festnetztelefoniedienst. Möglicherweise möchten sie das Abo kündigen oder sich über die aktuelle Abrechnung informieren.
Der Kunde fragt nach seiner Rechnung. Möglicherweise möchten sie den Betrag oder das Fälligkeitsdatum wissen.
Sekundäre Themen entfernen
Nachdem Sie Ihr Themenmodell bereitgestellt und eine Analyse abgeschlossen haben, können Sie die Themenverteilung auf der Seite Daten zum bereitgestellten Themenmodell ansehen. Sekundäre Themen können das dominierende Thema in bereitgestellten Ergebnissen sein, da sie häufig vorkommen und besser übereinstimmen. Themen, die zu einem hohen Prozentsatz (mehr als 30%) Ihrer Beispielunterhaltungen passen, sind wahrscheinlich sekundäre Themen. Sehen Sie sich diese Themen genau an und löschen Sie sie, wenn sie nicht relevant sind.
Ob irrelevante sekundäre Themen vorhanden sind, hängt stark von den Eingabedaten ab. Wenn alle wichtigen Themen auf der Seite Bereitgestellte Daten relativ gleichmäßig verteilt sind und jedes Thema nur einem kleinen Teil (weniger als 20%) der Unterhaltungen entspricht, gibt es wahrscheinlich keine sekundären Themen, die gelöscht werden müssen.
Trainingsdaten
Bei Sprachdaten ist die Qualität der Speech-to-Text-Ausgaben entscheidend für die Leistung des Themenmodells. Wenn Sie diese Richtlinien befolgen, können Sie die Qualität Ihrer Trainingsdaten verbessern.
Unterhaltungen
Vermeiden Sie doppelte Unterhaltungen im Datensatz.
Jede Unterhaltung sollte mindestens 10 Gesprächsrunden umfassen, davon 5 vom Kundenservicemitarbeiter und 5 vom Kunden.
Verwenden Sie anonymisierte Unterhaltungen, prüfen Sie aber die Qualität der Anonymisierung durch Cloud Data Loss Prevention. Durch die Schwärzung werden manchmal wichtige Informationen aus den Transkripten entfernt, was sich auf die Länge Ihrer Trainingsunterhaltungen auswirken kann.
Achten Sie darauf, dass fast alle Unterhaltungen in derselben Sprache geführt werden.
Sprecherrollen
Achten Sie darauf, dass die Rollen der Sprecher in der Unterhaltung nach der Aufnahme richtig zugewiesen werden.
Kennzeichnen Sie Gesprächsrunden genau als vom Kunden oder vom Kundenservicemitarbeiter stammend. Unterhaltungen mit nur einer Rolle werden nicht für das Training verwendet.
Verwenden Sie
AGENTfür menschliche Rollen undAUTOMATED_AGENTfür virtuelle Rollen.Verwenden Sie
END_USERoderCUSTOMERfür Kundenrollen.