Os agentes de voz do Dialogflow usam o Speech-to-Text para o reconhecimento de voz, que está incluído nos preços do Dialogflow. O Dialogflow seleciona automaticamente um modelo de reconhecimento de voz para si, mas pode especificar o modelo opcionalmente.
Modelos disponíveis
Todos os modelos disponíveis estão listados em Modelos de conversão de voz em texto. Selecione um modelo mais adequado ao seu domínio e que suporte o idioma do agente e as funcionalidades de voz.
Se um modelo não for especificado explicitamente, o Dialogflow seleciona automaticamente um modelo com base na configuração de áudio nos pedidos da API e nas definições do agente.
Se o modelo de voz melhorado estiver ativado para o agente e não existir uma versão melhorada do modelo especificado para o idioma, a voz é reconhecida através da versão padrão do modelo especificado.Normalmente, os seguintes modelos têm o melhor desempenho:
- telefonia_short (melhor para o Dialogflow de telefonia)
- Telefonia (melhor para o Agent Assist)
- phone_call (adequado para o Agent Assist e o Dialogflow de telefonia)
- latest_short (melhor para o Dialogflow não telefónico)
- command_and_search (ideal para idiomas em que outros modelos não estão disponíveis)
Especificar um modelo
Pode fornecer o modelo quando chamar os métodosdetectIntent
ou streamingDetectIntent
no tipo Sessions
ou quando configurar o ConversationProfile
para o Agent Assist.