Modelos de voz

Los agentes de voz de Dialogflow CX usan Speech-to-Text para el reconocimiento de voz, que se incluye en los precios de Dialogflow CX. Dialogflow CX selecciona automáticamente un modelo de reconocimiento de voz por ti, pero puedes especificar el modelo de forma opcional.

Modelos disponibles

Todos los modelos disponibles se enumeran en Modelos de Speech-to-Text. Selecciona un modelo que se adapte mejor a tu dominio y que admita las funciones de voz y el idioma de tu agente.

Si no se especifica un modelo de forma explícita, Dialogflow CX selecciona automáticamente un modelo según la configuración de audio en las solicitudes de la API y la configuración del agente.

Si el modelo de voz mejorado está habilitado para el agente y no existe una versión mejorada del modelo especificado para el idioma, la voz se reconoce con la versión estándar del modelo especificado.

Por lo general, los siguientes modelos tienen el mejor rendimiento:

  • telephony_short (ideal para Dialogflow CX telefónico)
  • Telefonía (ideal para Agent Assist)
  • phone_call (adecuado para Agent Assist y Dialogflow CX de telefonía)
  • latest_short (mejor para Dialogflow CX que no es de telefonía)
  • command_and_search (mejor para idiomas en los que no hay otros modelos disponibles)

Cómo especificar un modelo

Puedes proporcionar el modelo cuando llamas a los métodos detectIntent o streamingDetectIntent en el tipo Sessions, o bien cuando configuras ConversationProfile para Agent Assist.