Modelos de voz

Os agentes de voz do Dialogflow usam o Speech-to-Text para o reconhecimento de voz, que está incluído nos preços do Dialogflow. O Dialogflow seleciona automaticamente um modelo de reconhecimento de voz para si, mas pode especificar o modelo opcionalmente.

Modelos disponíveis

Todos os modelos disponíveis estão listados em Modelos de conversão de voz em texto. Selecione um modelo mais adequado ao seu domínio e que suporte o idioma do agente e as funcionalidades de voz.

Se um modelo não for especificado explicitamente, o Dialogflow seleciona automaticamente um modelo com base na configuração de áudio nos pedidos da API e nas definições do agente.

Normalmente, os seguintes modelos têm o melhor desempenho:

  • telefonia_short (melhor para o Dialogflow de telefonia)
  • telefonia (melhor para o Agent Assist) (também bom para o Dialogflow de telefonia quando a sensibilidade avançada de fim de discurso baseada em tempo limite está ativada)
  • phone_call (adequado para o Agent Assist e o Dialogflow de telefonia)
  • latest_short (melhor para o Dialogflow não telefónico)
  • command_and_search (ideal para idiomas em que outros modelos não estão disponíveis)

Especificar um modelo

Pode fornecer o modelo para um agente, um fluxo ou uma página com a definição de seleção de modelos.

Também pode fornecer o modelo quando chamar os métodos Sessions.detectIntent ou Sessions.streamingDetectIntent;

Selecione um protocolo e uma versão para a referência da sessão:

Protocolo V3 V3beta1
REST Recurso de sessão Recurso de sessão
RPC Interface de sessão Interface de sessão
C++ SessionsClient Não disponível
C# SessionsClient Não disponível
Ir SessionsClient Não disponível
Java SessionsClient SessionsClient
Node.js SessionsClient SessionsClient
PHP Não disponível Não disponível
Python SessionsClient SessionsClient
Ruby Não disponível Não disponível
ou quando configurar o ConversationProfile para o Agent Assist. A especificação do modelo numa chamada API de intenção de deteção ou perfil de conversa substitui todas as seleções de modelos aplicadas ao agente, fluxo ou página, a menos que ative a definição Substituir modelo de voz ao nível do pedido.