Modelos de fala

Os agentes de voz do Dialogflow CX usam o Speech-to-Text para reconhecimento de fala, que está incluído nos preços do Dialogflow CX. O Dialogflow CX seleciona automaticamente um modelo de reconhecimento de fala para você, mas é possível especificar o modelo.

Modelos disponíveis

Todos os modelos disponíveis estão listados em Modelos da Speech-to-Text. Selecione um modelo mais adequado ao seu domínio e que ofereça suporte aos recursos de fala e idioma do seu agente.

Se um modelo não for especificado, o Dialogflow CX vai selecionar automaticamente um modelo com base na configuração de áudio nas solicitações de API e nas configurações do agente.

Os modelos a seguir geralmente têm o melhor desempenho:

  • telephony_short (melhor para telefonia do Dialogflow CX)
  • telefonia (ideal para o Agent Assist) (também é bom para o Dialogflow CX de telefonia quando a sensibilidade avançada de fim de fala com base em tempo limite está ativada)
  • phone_call (bom para o Agent Assist e o Dialogflow CX de telefonia)
  • latest_short (melhor para Dialogflow CX não telefônico)
  • command_and_search (melhor para idiomas em que outros modelos não estão disponíveis)

Especificar um modelo

É possível fornecer o modelo para um agente, fluxo ou página com a configuração de seleção de modelo.

Também é possível fornecer o modelo ao chamar os métodos Sessions.detectIntent ou Sessions.streamingDetectIntent.

Selecione um protocolo e uma versão para a referência de sessão:

Protocolo V3 V3beta1
REST Recurso da sessão Recurso da sessão
RPC (remote procedure call) Interface da sessão Interface da sessão
C++ SessionsClient Indisponível
C# SessionsClient Indisponível
Go SessionsClient Indisponível
Java SessionsClient SessionsClient
Node.js SessionsClient SessionsClient
PHP Indisponível Indisponível
Python SessionsClient SessionsClient
Ruby Indisponível Indisponível
ou ao configurar o ConversationProfile para o Assistente de IA. Especificar o modelo em uma chamada de API de detecção de intenção ou perfil de conversa vai substituir qualquer seleção de modelo aplicada ao agente, fluxo ou página, a menos que você ative a configuração Substituir modelo de fala no nível da solicitação.