Modelos de voz

Los agentes de voz de Dialogflow CX usan Speech-to-Text para el reconocimiento de voz, que se incluye en los precios de Dialogflow CX. Dialogflow CX selecciona automáticamente un modelo de reconocimiento de voz por ti, pero puedes especificar el modelo de forma opcional.

Modelos disponibles

Todos los modelos disponibles se enumeran en Modelos de Speech-to-Text. Selecciona un modelo que se adapte mejor a tu dominio y que admita las funciones de voz y el idioma de tu agente.

Si no se especifica un modelo de forma explícita, Dialogflow CX selecciona automáticamente un modelo según la configuración de audio en las solicitudes de la API y la configuración del agente.

Por lo general, los siguientes modelos tienen el mejor rendimiento:

  • telephony_short (ideal para Dialogflow CX telefónico)
  • Telefonía (ideal para Agent Assist) (también es adecuado para Dialogflow CX de telefonía cuando se habilita la sensibilidad avanzada de fin de voz basada en el tiempo de espera)
  • phone_call (adecuado para Agent Assist y Dialogflow CX de telefonía)
  • latest_short (mejor para Dialogflow CX que no es de telefonía)
  • command_and_search (mejor para idiomas en los que no hay otros modelos disponibles)

Cómo especificar un modelo

Puedes proporcionar el modelo para un agente, un flujo o una página con el parámetro de configuración de selección del modelo.

También puedes proporcionar el modelo cuando llames a los métodos Sessions.detectIntent o Sessions.streamingDetectIntent.

Selecciona un protocolo y una versión para la referencia de sesión:

Protocolo V3 V3beta1
REST Recurso de sesión Recurso de sesión
RPC Interfaz de sesión Interfaz de sesión
C++ SessionsClient No disponible
C# SessionsClient No disponible
Go SessionsClient No disponible
Java SessionsClient SessionsClient
Node.js SessionsClient SessionsClient
PHP No disponible No disponible
Python SessionsClient SessionsClient
Ruby No disponible No disponible
o cuando configures ConversationProfile para Agent Assist. Si especificas el modelo en una llamada a la API de detección de intención o perfil de conversación, se anulará cualquier selección de modelo que se haya aplicado al agente, al flujo o a la página, a menos que habilites el parámetro de configuración Anular el modelo de voz a nivel de la solicitud.