Un set di dati conversazione contiene i dati delle trascrizioni delle conversazioni e viene utilizzato per addestrare un modello personalizzato di Risposta rapida o di riepilogo. Risposta rapida utilizza le trascrizioni delle conversazioni per consigliare risposte di testo agli agenti umani che conversano con un utente finale. I modelli personalizzati di riepilogo vengono addestrati su set di dati conversazione che contengono sia trascrizioni sia dati di annotazione data. Utilizzano le annotazioni per generare riepiloghi delle conversazioni per gli agenti umani al termine di una conversazione.
Esistono due modi per creare un set di dati: utilizzando i flussi di lavoro dei tutorial della console, o creando manualmente un set di dati nella console utilizzando la scheda Dati -> Set di dati. Ti consigliamo di utilizzare i tutorial della console come prima opzione. Per utilizzare i tutorial della console, vai alla console Agent Assist e fai clic sul pulsante Inizia sotto la funzionalità che vuoi testare.
Questa pagina mostra come creare manualmente un set di dati.
Prima di iniziare
Segui le istruzioni di configurazione di Dialogflow per attivare Dialogflow su un progetto Google Cloud Platform.
Ti consigliamo di leggere la pagina Nozioni di base di Agent Assist prima di iniziare questo tutorial.
Se implementi Risposta rapida utilizzando i tuoi dati di trascrizione, assicura ti che le trascrizioni siano in
JSONnel formato specificato formato e archiviate in un bucket Cloud Storage. Un set di dati conversazione deve contenere almeno 30.000 conversazioni, altrimenti l'addestramento del modello non andrà a buon fine. In generale, più conversazioni hai, migliore sarà la qualità del modello. Ti suggeriamo di rimuovere le conversazioni con meno di 20 messaggi o 3 turni di conversazione (modifiche al partecipante che sta pronunciando un'espressione). Ti suggeriamo inoltre di rimuovere tutti i messaggi dei bot o i messaggi generati automaticamente dai sistemi (ad esempio "L'agente entra nella stanza virtuale"). Ti consigliamo di caricare almeno 3 mesi di conversazioni per garantire la copertura del maggior numero possibile di casi d'uso. Il numero massimo di conversazioni in un set di dati conversazione è 1.000.000.Se implementi il riepilogo utilizzando i tuoi dati di trascrizione e annotazione, assicurati che le trascrizioni siano nel formato specificato formato e archiviate in un bucket Cloud Storage. Il numero minimo consigliato di annotazioni di addestramento è 1000. Il numero minimo applicato è 100.
Vai alla console Agent Assist. Seleziona il progetto Google Cloud Platform, quindi fai clic sull'opzione di menu Dati sul margine più a sinistra della pagina. Il menu Dati mostra tutti i tuoi dati. Sono presenti due schede, una per i set di dati conversazione e una per le knowledge base.
Fai clic sulla scheda Set di dati conversazione, quindi sul pulsante +Crea nuovo in alto a destra nella pagina dei set di dati conversazione.
Creare un set di dati conversazione
Inserisci un Nome e una Descrizione facoltativa per il nuovo set di dati. Nel campo Dati conversazione, inserisci l'URI del bucket di archiviazione che contiene le trascrizioni delle conversazioni. Agent Assist supporta l'utilizzo del simbolo
*per la corrispondenza con caratteri jolly. L'URI deve avere il seguente formato:gs://<bucket name>/<object name>Ad esempio:
gs://mydata/conversationjsons/conv0*.json gs://mydatabucket/test/conv.jsonFai clic su Crea. Il nuovo set di dati viene visualizzato nell'elenco dei set di dati nella pagina del menu Dati nella scheda Set di dati conversazione.
Passaggi successivi
Addestra un modello di Risposta rapida o di riepilogo su uno o più set di dati conversazione utilizzando la console Agent Assist.