Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Unterhaltungs-Dataset erstellen

Ein Unterhaltungs-Dataset enthält Transkriptdaten von Unterhaltungen und wird verwendet, um ein benutzerdefiniertes Modell für „Intelligente Antwort“ oder „Zusammenfassung“ zu trainieren. Intelligente Antwort verwendet die Unterhaltungstranskripte um menschlichen Kundenservicemitarbeitern, die mit einem Endnutzer interagieren, Textantworten zu empfehlen. Benutzerdefinierte Modelle für die Zusammenfassung werden mit Unterhaltungs-Datasets trainiert, die sowohl Transkripte als auch Anmerkungsdaten enthalten. Sie verwenden die Anmerkungen, um nach Abschluss einer Unterhaltung Zusammenfassungen für menschliche Kundenservicemitarbeiter zu erstellen.

Es gibt zwei Möglichkeiten, ein Dataset zu erstellen: mit den Console-Anleitungen, oder manuell in der Console über den Tab Daten -> Datasets. Wir empfehlen, zuerst die Console-Anleitungen zu verwenden. Wenn Sie die Console-Anleitungen verwenden möchten, rufen Sie die Agent Assist Console auf und klicken Sie unter der Funktion, die Sie testen möchten, auf die Schaltfläche Jetzt starten.

Auf dieser Seite wird gezeigt, wie Sie ein Dataset manuell erstellen.

Hinweis

Folgen Sie der Anleitung unter Dialogflow einrichten , um Dialogflow in einem Google Cloud Platform-Projekt zu aktivieren.
Wir empfehlen, die Seite Grundlagen zu Agent Assist basics zu lesen, bevor Sie mit dieser Anleitung beginnen.
Wenn Sie „Intelligente Antwort“ mit Ihren eigenen Transkriptdaten implementieren, achten Sie darauf, dass die Transkripte in JSON im angegebenen Format vorliegen und in einem Google Cloud Storage-Bucket gespeichert sind. Ein Unterhaltungs-Dataset muss mindestens 30.000 Unterhaltungen enthalten, andernfalls schlägt das Modelltraining fehl. Als allgemeine Regel gilt: Je mehr Unterhaltungen, desto besser ist die Modellqualität. Es wird empfohlen, Unterhaltungen mit weniger als 20 Nachrichten oder drei Unterhaltungsrunden zu entfernen (Änderungen, bei denen der Teilnehmer eine Äußerung macht). Außerdem sollten Sie alle Bot-Nachrichten oder Nachrichten entfernen, die automatisch von Systemen generiert wurden (z. B. „Der Kundenservicemitarbeiter betritt den Chatroom“). Sie sollten Unterhaltungen aus einem Zeitraum von mindestens drei Monaten hochladen, damit möglichst viele Anwendungsfälle abgedeckt sind. Die maximale Anzahl an Unterhaltungen in einem Unterhaltungs-Dataset beträgt 1.000.000.
Wenn Sie die Zusammenfassung mit Ihren eigenen Transkript- und Anmerkungsdaten implementieren, achten Sie darauf, dass die Transkripte im angegebenen Format vorliegen und in einem Google Cloud Storage-Bucketgespeichert sind. Die empfohlene Mindestanzahl an Trainingsanmerkungen beträgt 1.000. Die erzwungene Mindestanzahl beträgt 100.
Öffnen Sie die Agent Assist Console. Wählen Sie Ihr Google Cloud Platform-Projekt aus und klicken Sie dann am linken Rand der Seite auf die Menüoption Daten. Im Menü Daten werden alle Ihre Daten angezeigt. Es gibt zwei Tabs, einen für Unterhaltungs-Datasets und einen für Wissensdatenbanken.
Klicken Sie auf den Tab Unterhaltungs-Datasets und dann rechts oben auf der Seite „Unterhaltungs-Datasets“ auf die Schaltfläche + Neu erstellen.