Impostazioni avanzate per il parlato

Questa guida fornisce impostazioni avanzate aggiuntive per le funzionalità vocali. Puoi attivare e disattivare queste impostazioni avanzate andando in Impostazioni agente > Voce e IVR > Speech-to-Text > Impostazioni vocali avanzate.

Queste impostazioni sono disponibili nelle impostazioni dell'agente (si applicano all'intero agente), nelle impostazioni del flusso (si applicano all'intero flusso e sostituiscono le impostazioni dell'agente), nelle impostazioni della pagina (si applicano alla pagina e sostituiscono le impostazioni del flusso e dell'agente) e nelle impostazioni del fulfillment (si applicano al fulfillment e sostituiscono le impostazioni della pagina, del flusso e dell'agente). Un sottoinsieme di queste impostazioni è disponibile a ogni livello, a seconda della pertinenza dell'impostazione per il livello. *Prima di poter configurare queste impostazioni a un livello inferiore, devi prima selezionare la casella Attiva impostazioni vocali avanzate a livello di agente (Impostazioni agente > Voce e IVR > Speech-to-Text > Impostazioni vocali avanzate)*.

Le impostazioni aggiornate a livello di agente non vengono propagate a livello di flusso, pagina e fulfillment quando l'opzione Personalizza è selezionata a questi livelli inferiori. Se l'opzione Personalizza comprende più impostazioni e vuoi aggiornarne solo alcune, potresti dover aggiornare anche altre impostazioni se vuoi che siano uguali a quelle a livello di agente.

Disponibilità delle impostazioni per livello

La tabella seguente indica quali impostazioni vocali avanzate sono disponibili a ogni livello:

Nome impostazione Agente Flusso Pagina Fulfillment
Selezione del modello (Speech-to-Text)
Fine della sensibilità vocale
Fine della sensibilità vocale avanzata basata sul timeout
Attiva endpointing intelligente
Timeout senza voce
Barge-in
Consenti l'annullamento della riproduzione della risposta parziale
Bucket di esportazione audio
DTMF

Selezione del modello (Speech-to-Text)

Può essere impostata a livello di agente, flusso e pagina.

Imposta il modello vocale utilizzato per il riconoscimento vocale. Questa impostazione è specifica per la lingua, quindi puoi selezionare modelli diversi per lingue diverse. Puoi anche selezionare Esegui l'override del modello vocale a livello di richiesta, in modo che il modello selezionato venga utilizzato anche se una chiamata API di runtime specifica un modello diverso.

Per Dialogflow CX Phone Gateway, consulta le limitazioni. Per ulteriori informazioni, consulta Modelli vocali.

Fine della sensibilità vocale

Può essere impostata a livello di agente, flusso e pagina.

Controlla la sensibilità per il riconoscimento della fine della voce nell'input audio dell'utente finale. Il valore varia da 0 (sensibilità bassa, meno probabile che la voce termini) a 100 (sensibilità alta, più probabile che la voce termini).

Fine della sensibilità vocale avanzata basata sul timeout

Può essere impostata a livello di agente e disattivata a livello di flusso e pagina.

Se questa impostazione è attiva, il valore dell'impostazione Fine della sensibilità vocale viene utilizzato come indicatore per stabilire un timeout relativo del silenzio audio per determinare la fine della voce. Se questa impostazione è disattivata (impostazione predefinita), il valore dell'impostazione Fine della sensibilità vocale viene utilizzato per determinare la fine della voce dal modello di machine learning fornito da Google Cloud Speech-to-Text.

Mentre l'impostazione Fine della sensibilità vocale supporta per impostazione predefinita solo il phone_call modello vocale per il en-US tag di lingua, l'impostazione Attiva la fine della sensibilità vocale avanzata basata sul timeout consente di configurare la fine della sensibilità vocale per tutte le lingue e i modelli vocali supportati da Dialogflow.

Attiva endpointing intelligente

Può essere impostata solo a livello di agente.

Se questa impostazione è attiva, Dialogflow CX analizzerà l'input utente parziale per determinare la fine della voce. Ad esempio, se l'utente dice "Vorrei" e si ferma, Dialogflow CX attenderà che l'utente continui la frase.

Questa impostazione è particolarmente utile per la raccolta di parametri numerici, in cui l'utente potrebbe dire "1234" e fermarsi prima di dire "5678". Per applicare questa impostazione a un parametro specifico, devi configurare l'endpointing intelligente in nel modulo del parametro.

Questa impostazione è disponibile solo per il tag di lingua en-US ed è disattivata per impostazione predefinita.

Timeout senza voce

Può essere impostata a livello di agente, flusso e pagina.

La durata in secondi per cui Dialogflow CX smetterà di attendere l'input audio dell'utente finale. Il valore predefinito è 5 secondi e il valore massimo è 60 secondi. Per questo timeout, Dialogflow CX richiama un evento senza input.

Barge-in

Può essere impostata a livello di agente, flusso e fulfillment.

Se questa opzione è attiva, un utente finale può interrompere l'audio della risposta di Dialogflow CX. Quando viene interrotto, Dialogflow CX smetterà di inviare audio ed elaborerà l'input utente finale successivo.

Se nella coda dei messaggi sono presenti più messaggi, e un messaggio è stato messo in coda da un fulfillment associato a una pagina, un flusso o un agente con la funzionalità barge-in attivata, anche tutti i messaggi successivi nella coda avranno la funzionalità barge-in attivata. In questo caso, l'integrazione interromperà la riproduzione dell'audio per tutti i messaggi in coda con la funzionalità barge-in attivata.

Consenti l'annullamento della riproduzione della risposta parziale

Può essere impostata solo a livello di fulfillment.

Puoi attivare questa impostazione quando la casella Attiva impostazioni vocali avanzate è selezionata in Impostazioni agente > Voce e IVR e la risposta parziale è attivata a livello di fulfillment. Questa impostazione consente di annullare la riproduzione di una risposta parziale.

Se un messaggio nella coda dei messaggi viene creato da un fulfillment che consente l'annullamento, la riproduzione del messaggio viene annullata se viene aggiunto un altro messaggio alla coda. Questa opzione è utile quando vuoi che un messaggio iniziale inizi la riproduzione, ma che questa venga annullata se un webhook funzionante produce un altro messaggio prima che la riproduzione del messaggio iniziale venga completata.

Bucket di esportazione audio

Può essere impostata a livello di agente e flusso.

Se forniti, tutti i dati audio associati a una richiesta verranno salvati nel bucket Cloud Storage:

Audio salvato Richieste applicabili
Input audio dell'utente finale DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent
Audio di Text-to-Speech (TTS) sintetizzato per una risposta AnalyzeContent, StreamingAnalyzeContent

Concedi il ruolo Storage Object Creator ai seguenti service account nel tuo progetto:

  • Al account di servizio nel formato one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com se utilizzi un'integrazione di telefonia integrata del partner.

  • Al account di servizio nel formato service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com se utilizzi l'integrazione di Dialogflow CX Phone Gateway. Per trovare questo account di servizio in IAM, seleziona l'opzione Includi concessioni di ruoli fornite da Google.

DTMF

Per ulteriori informazioni su questa funzionalità, consulta la documentazione DTMF (Dual-tone multi-frequency signaling).