Questa guida fornisce impostazioni avanzate aggiuntive per le funzionalità vocali. Puoi attivare e disattivare queste impostazioni avanzate andando in Impostazioni agente > Voce e IVR > Speech-to-Text > Impostazioni vocali avanzate.
Queste impostazioni sono disponibili nelle impostazioni dell'agente (si applicano all'intero agente), nelle impostazioni del flusso (si applicano all'intero flusso e sostituiscono le impostazioni dell'agente), nelle impostazioni della pagina (si applicano alla pagina e sostituiscono le impostazioni del flusso e dell'agente) e nelle impostazioni del fulfillment (si applicano al fulfillment e sostituiscono le impostazioni della pagina, del flusso e dell'agente). Un sottoinsieme di queste impostazioni è disponibile a ogni livello, a seconda della pertinenza dell'impostazione per il livello. *Prima di poter configurare queste impostazioni a un livello inferiore, devi prima selezionare la casella Attiva impostazioni vocali avanzate a livello di agente (Impostazioni agente > Voce e IVR > Speech-to-Text > Impostazioni vocali avanzate)*.
Le impostazioni aggiornate a livello di agente non vengono propagate a livello di flusso, pagina e fulfillment quando l'opzione Personalizza è selezionata a questi livelli inferiori. Se l'opzione Personalizza comprende più impostazioni e vuoi aggiornarne solo alcune, potresti dover aggiornare anche altre impostazioni se vuoi che siano uguali a quelle a livello di agente.
Disponibilità delle impostazioni per livello
La tabella seguente indica quali impostazioni vocali avanzate sono disponibili a ogni livello:
| Nome impostazione | Agente | Flusso | Pagina | Fulfillment |
|---|---|---|---|---|
| Selezione del modello (Speech-to-Text) | ✔ | ✔ | ✔ | |
| Fine della sensibilità vocale | ✔ | ✔ | ✔ | |
| Fine della sensibilità vocale avanzata basata sul timeout | ✔ | ✔ | ✔ | |
| Attiva endpointing intelligente | ✔ | |||
| Timeout senza voce | ✔ | ✔ | ✔ | |
| Barge-in | ✔ | ✔ | ✔ | |
| Consenti l'annullamento della riproduzione della risposta parziale | ✔ | |||
| Bucket di esportazione audio | ✔ | ✔ | ||
| DTMF | ✔ | ✔ | ✔ |
Selezione del modello (Speech-to-Text)
Può essere impostata a livello di agente, flusso e pagina.
Imposta il modello vocale utilizzato per il riconoscimento vocale. Questa impostazione è specifica per la lingua, quindi puoi selezionare modelli diversi per lingue diverse. Puoi anche selezionare Esegui l'override del modello vocale a livello di richiesta, in modo che il modello selezionato venga utilizzato anche se una chiamata API di runtime specifica un modello diverso.
Per Dialogflow CX Phone Gateway, consulta le limitazioni. Per ulteriori informazioni, consulta Modelli vocali.
Fine della sensibilità vocale
Può essere impostata a livello di agente, flusso e pagina.
Controlla la sensibilità per il riconoscimento della fine della voce nell'input audio dell'utente finale. Il valore varia da 0 (sensibilità bassa, meno probabile che la voce termini) a 100 (sensibilità alta, più probabile che la voce termini).
Fine della sensibilità vocale avanzata basata sul timeout
Può essere impostata a livello di agente e disattivata a livello di flusso e pagina.
Se questa impostazione è attiva, il valore dell'impostazione Fine della sensibilità vocale viene utilizzato come indicatore per stabilire un timeout relativo del silenzio audio per determinare la fine della voce. Se questa impostazione è disattivata (impostazione predefinita), il valore dell'impostazione Fine della sensibilità vocale viene utilizzato per determinare la fine della voce dal modello di machine learning fornito da Google Cloud Speech-to-Text.
Mentre l'impostazione Fine della sensibilità vocale supporta per impostazione predefinita solo il phone_call
modello vocale per il en-US tag
di lingua, l'impostazione Attiva la fine della sensibilità vocale avanzata basata sul timeout
consente di configurare la fine della sensibilità vocale per tutte le lingue e i
modelli vocali supportati da Dialogflow.
Attiva endpointing intelligente
Può essere impostata solo a livello di agente.
Se questa impostazione è attiva, Dialogflow CX analizzerà l'input utente parziale per determinare la fine della voce. Ad esempio, se l'utente dice "Vorrei" e si ferma, Dialogflow CX attenderà che l'utente continui la frase.
Questa impostazione è particolarmente utile per la raccolta di parametri numerici, in cui l'utente potrebbe dire "1234" e fermarsi prima di dire "5678". Per applicare questa impostazione a un parametro specifico, devi configurare l'endpointing intelligente in nel modulo del parametro.
Questa impostazione è disponibile solo per il tag di lingua en-US ed è disattivata per impostazione predefinita.
Timeout senza voce
Può essere impostata a livello di agente, flusso e pagina.
La durata in secondi per cui Dialogflow CX smetterà di attendere l'input audio dell'utente finale. Il valore predefinito è 5 secondi e il valore massimo è 60 secondi. Per questo timeout, Dialogflow CX richiama un evento senza input.
Barge-in
Può essere impostata a livello di agente, flusso e fulfillment.
Se questa opzione è attiva, un utente finale può interrompere l'audio della risposta di Dialogflow CX. Quando viene interrotto, Dialogflow CX smetterà di inviare audio ed elaborerà l'input utente finale successivo.
Se nella coda dei messaggi sono presenti più messaggi, e un messaggio è stato messo in coda da un fulfillment associato a una pagina, un flusso o un agente con la funzionalità barge-in attivata, anche tutti i messaggi successivi nella coda avranno la funzionalità barge-in attivata. In questo caso, l'integrazione interromperà la riproduzione dell'audio per tutti i messaggi in coda con la funzionalità barge-in attivata.
Consenti l'annullamento della riproduzione della risposta parziale
Può essere impostata solo a livello di fulfillment.
Puoi attivare questa impostazione quando la casella Attiva impostazioni vocali avanzate è selezionata in Impostazioni agente > Voce e IVR e la risposta parziale è attivata a livello di fulfillment. Questa impostazione consente di annullare la riproduzione di una risposta parziale.
Se un messaggio nella coda dei messaggi viene creato da un fulfillment che consente l'annullamento, la riproduzione del messaggio viene annullata se viene aggiunto un altro messaggio alla coda. Questa opzione è utile quando vuoi che un messaggio iniziale inizi la riproduzione, ma che questa venga annullata se un webhook funzionante produce un altro messaggio prima che la riproduzione del messaggio iniziale venga completata.
Bucket di esportazione audio
Può essere impostata a livello di agente e flusso.
Se forniti, tutti i dati audio associati a una richiesta verranno salvati nel bucket Cloud Storage:
| Audio salvato | Richieste applicabili |
|---|---|
| Input audio dell'utente finale | DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent |
| Audio di Text-to-Speech (TTS) sintetizzato per una risposta | AnalyzeContent, StreamingAnalyzeContent |
Concedi il ruolo Storage Object Creator ai seguenti service account nel tuo progetto:
Al account di servizio nel formato
one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.comse utilizzi un'integrazione di telefonia integrata del partner.Al account di servizio nel formato
service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.comse utilizzi l'integrazione di Dialogflow CX Phone Gateway. Per trovare questo account di servizio in IAM, seleziona l'opzione Includi concessioni di ruoli fornite da Google.
DTMF
Per ulteriori informazioni su questa funzionalità, consulta la documentazione DTMF (Dual-tone multi-frequency signaling).