Les agents vocaux Dialogflow CX utilisent Speech-to-Text pour la reconnaissance vocale, qui est incluse dans la tarification de Dialogflow CX. Dialogflow CX sélectionne automatiquement un modèle de reconnaissance vocale pour vous, mais vous pouvez également le spécifier.
Modèles disponibles
Tous les modèles disponibles sont listés dans la section Modèles Speech-to-Text. Sélectionnez un modèle adapté à votre domaine, qui est compatible avec la langue de votre agent et qui prend en charge les fonctionnalités vocales.
Si aucun modèle n'est explicitement spécifié, Dialogflow CX en sélectionne automatiquement un en fonction de la configuration audio dans les requêtes API et des paramètres de l'agent.
Si le modèle de reconnaissance vocale amélioré est activé pour l'agent et qu'il n'existe pas de version améliorée du modèle spécifié pour la langue, la reconnaissance vocale utilise la version standard du modèle spécifié.Les modèles suivants offrent généralement les meilleures performances :
- telephony_short (idéal pour la téléphonie Dialogflow CX)
- telephony (idéal pour Agent Assist)
- phone_call (adapté à Agent Assist et à la téléphonie Dialogflow CX)
- latest_short (idéal pour Dialogflow CX non téléphonique)
- command_and_search (idéal pour les langues pour lesquelles aucun autre modèle n'est disponible)
Spécifier un modèle
Vous pouvez fournir le modèle lorsque vous appelez lesdetectIntent ou streamingDetectIntent
méthodes sur le
Sessions
type ;
ou lorsque vous configurez le
ConversationProfile
pour
Agent Assist.