Los agentes de voz de Dialogflow CX usan Speech-to-Text para el reconocimiento de voz, que se incluye en los precios de Dialogflow CX. Dialogflow CX selecciona automáticamente un modelo de reconocimiento de voz por ti, pero puedes especificar el modelo de forma opcional.
Modelos disponibles
Todos los modelos disponibles se enumeran en Modelos de Speech-to-Text. Selecciona un modelo que se adapte mejor a tu dominio y que admita el idioma y las funciones de voz de tu agente.
Si no se especifica un modelo de forma explícita, Dialogflow CX selecciona automáticamente un modelo en función de la configuración de audio en las solicitudes a la API y la configuración del agente.
Si el modelo de voz mejorado está habilitado en el agente y no existe una versión mejorada del modelo especificado para el idioma, la voz se reconoce mediante la versión estándar del modelo especificado.Por lo general, los siguientes modelos tienen el mejor rendimiento:
- telephony_short (mejor para Dialogflow CX de telefonía)
- telephony (mejor para Agent Assist)
- phone_call (bueno para Agent Assist y Dialogflow CX de telefonía)
- latest_short (mejor para Dialogflow CX que no es de telefonía)
- command_and_search (mejor para idiomas en los que no hay otros modelos disponibles)
Especifica un modelo
Puedes proporcionar el modelo cuando llames a losdetectIntent o streamingDetectIntent
métodos en el
Sessions
tipo;
o cuando configures el
ConversationProfile
para
Agent Assist.