Modelos de voz

Los agentes de voz de Dialogflow CX usan Speech-to-Text para el reconocimiento de voz, que se incluye en los precios de Dialogflow CX. Dialogflow CX selecciona automáticamente un modelo de reconocimiento de voz, pero también puedes especificarlo.

Modelos disponibles

Todos los modelos disponibles se enumeran en la página Modelos de Speech-to-Text. Selecciona el modelo que mejor se adapte a tu dominio y admita el idioma y las funciones de voz de tu agente.

Si no se especifica un modelo de forma explícita, Dialogflow CX seleccionará automáticamente un modelo en función de la configuración de audio de las solicitudes de la API y de los ajustes del agente.

Si el modelo de voz mejorado está habilitado para el agente y no existe una versión mejorada del modelo especificado para el idioma, la voz se reconoce con la versión estándar del modelo especificado.

Los siguientes modelos suelen tener el mejor rendimiento:

  • telephony_short (la mejor opción para Dialogflow CX de telefonía)
  • Telefonía (la mejor opción para Agent Assist)
  • phone_call (adecuado para Asistente del agente y Dialogflow CX de telefonía)
  • latest_short (la mejor opción para Dialogflow CX sin telefonía)
  • command_and_search (la mejor opción para los idiomas en los que no hay otros modelos disponibles)

Especificar un modelo

Puedes proporcionar el modelo al llamar a los métodos detectIntent o streamingDetectIntent en el tipo Sessions o al configurar ConversationProfile para Asistencia del agente.