Os agentes de voz do Dialogflow usam o Speech-to-Text para o reconhecimento de voz, que está incluído nos preços do Dialogflow. O Dialogflow seleciona automaticamente um modelo de reconhecimento de voz para si, mas pode especificar o modelo opcionalmente.
Modelos disponíveis
Todos os modelos disponíveis estão listados em Modelos de conversão de voz em texto. Selecione um modelo mais adequado ao seu domínio e que suporte o idioma do agente e as funcionalidades de voz.
Se um modelo não for especificado explicitamente, o Dialogflow seleciona automaticamente um modelo com base na configuração de áudio nos pedidos da API e nas definições do agente.
Normalmente, os seguintes modelos têm o melhor desempenho:
- telefonia_short (melhor para o Dialogflow de telefonia)
- telefonia (melhor para o Agent Assist) (também bom para o Dialogflow de telefonia quando a sensibilidade avançada de fim de discurso baseada em tempo limite está ativada)
- phone_call (adequado para o Agent Assist e o Dialogflow de telefonia)
- latest_short (melhor para o Dialogflow não telefónico)
- command_and_search (ideal para idiomas em que outros modelos não estão disponíveis)
Especificar um modelo
Pode fornecer o modelo para um agente, um fluxo ou uma página com a definição de seleção de modelos.Também pode fornecer o modelo quando chamar os métodos Sessions.detectIntent
ou Sessions.streamingDetectIntent
;
Selecione um protocolo e uma versão para a referência da sessão:
Protocolo | V3 | V3beta1 |
---|---|---|
REST | Recurso de sessão | Recurso de sessão |
RPC | Interface de sessão | Interface de sessão |
C++ | SessionsClient | Não disponível |
C# | SessionsClient | Não disponível |
Ir | SessionsClient | Não disponível |
Java | SessionsClient | SessionsClient |
Node.js | SessionsClient | SessionsClient |
PHP | Não disponível | Não disponível |
Python | SessionsClient | SessionsClient |
Ruby | Não disponível | Não disponível |
ConversationProfile
para o
Agent Assist.
A especificação do modelo numa chamada API de intenção de deteção ou perfil de conversa
substitui todas as seleções de modelos aplicadas ao agente, fluxo ou página, a menos que
ative a definição Substituir modelo de voz ao nível do pedido.