Alguns produtos e recursos estão sendo renomeados. Os recursos de playbook generativo e de fluxo também estão sendo migrados para um único console consolidado. Confira os detalhes.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Adaptação de fala

Ao executar uma solicitação de detecção de intent, é possível fornecer phrase_hints para dar dicas ao reconhecedor de fala. Essas dicas podem ajudar no reconhecimento em um estado de conversa específico.

Adaptação automática de fala

O recurso de adaptação automática de fala melhora a precisão do reconhecimento de fala do seu agente usando o estado da conversa automaticamente para transmitir entidades relevantes e frases de treinamento como dicas de contexto da fala para todas as solicitações de detecção de intent. Esse recurso é desativado por padrão.

Ativar ou desativar a adaptação automática de fala

Para ativar ou desativar a adaptação automática de fala:

Console

Abra o console do Dialogflow CX.
Escolha seu projeto do GCP.
Selecione seu agente.
Clique em Configurações do agente.
Clique na guia Speech and IVR.
Ative ou desative a opção Ativar a adaptação automática de fala.
Clique em Salvar.

API

Veja os métodos get e patch/update para o tipo Agent.

Selecione um protocolo e uma versão para a referência do agente:

Protocolo	V3	V3beta1
REST	Recurso do agente	Recurso do agente
RPC (remote procedure call)	Interface do agente	Interface do agente
C++	AgentsClient (em inglês)	Indisponível
C#	AgentsClient (em inglês)	Indisponível
Go	AgentsClient (em inglês)	Indisponível
Java	AgentsClient (em inglês)	AgentsClient (em inglês)
Node.js	AgentsClient (em inglês)	AgentsClient (em inglês)
PHP	Indisponível	Indisponível
Python	AgentsClient (em inglês)	AgentsClient (em inglês)
Ruby	Indisponível	Indisponível

Design de agente para melhorias no reconhecimento de fala

Com a adaptação automática de fala ativada, é possível criar seu agente de forma a tirar proveito dela. As seções a seguir explicam como é possível melhorar o reconhecimento de fala com algumas alterações nas frases de treinamento, nos contextos e nas entidades do seu agente.

Frases de treinamento

Se você definir frases de treinamento com uma frase como "nariz entupido", uma expressão sonora do usuário similar é reconhecida como "nariz entupido" e não como "nariz entope pia".

Quando você tem um parâmetro obrigatório que força o Dialogflow a solicitações de preenchimento de formulário, a adaptação automática de fala tende a achar a entidade que está sendo preenchida.

Em todos os casos, a adaptação automática de fala está apenas direcionando o reconhecimento de fala, não o limitando. Por exemplo, mesmo que o Dialogflow esteja solicitando ao usuário um parâmetro obrigatório, os usuários ainda poderão acionar outras intents, como uma intent "conversar com um agente" de nível superior.

Entidades do sistema

Se você definir uma frase de treinamento que use a entidade do sistema @sys.number e o usuário final disser "Quero dois", ela poderá ser reconhecida como "dos", "2" ou "dois".

Com a adaptação automática de fala ativada, o Dialogflow usa a entidade @sys.number como uma dica durante o reconhecimento de fala, e o parâmetro tem mais chances de ser extraído como "2".

Entidades personalizadas

Se você definir uma entidade personalizada para nomes de produtos ou serviços oferecidos pela sua empresa, e o usuário final mencionar esses termos em um enunciado, eles terão mais chances de serem reconhecidos. Uma frase de treinamento "Adoro o Dialogflow", em que "Dialogflow" é anotada como a entidade @product, adapta a adaptação automática de falas para o direcionamento de "Adoro Dialogflow", "Adoro o Cloud Speech" e todas outras entradas na entidade @product.
É importante definir sinônimos de entidades limpas ao usar o Dialogflow para detectar a fala. Imagine que você tenha duas entradas de entidade do @product, "Dialogflow" e "Dataflow". Seus sinônimos de "Dialogflow" podem ser "Dialogflow", "dialogue flow" ou "dialogue builder", "Speakoit", "speak to it", "API.ai", "API dot AI". Eles são bons sinônimos porque abrangem as variações mais comuns. Não é preciso adicionar "the dialogue flow builder" porque o "dialogue flow" já abrange isso.

Observação: por que isso é importante? Considere que você tem duas entidades "Dialogflow" e "Dataflow", e dois sinônimos são "the dialogue flow builder" e "Google Cloud Dataflow". Um usuário final pode dizer que é possível dizer "Google Cloud Dialogflow", mas como não há um termo "Google Cloud Dialogflow" como sinônimos, o reconhecimento de fala provavelmente ouvirá "Google Cloud Dataflow" porque as definições de entidade são tendenciosas para essa frase. Da mesma forma, se alguém disser "the dataflow builder" provavelmente ouvirá "the dialogue flow builder" porque é a única entidade definida com "builder". Em vez disso, você terá um desempenho melhor definindo apenas as frases-chave, conforme listado no tópico acima. Em resumo, tenha cuidado para não adicionar dados genéricos às definições de entidade porque é para isso que as frases de treinamento de intent são projetadas. Uma frase de treinamento "Google Cloud Dataflow", em que "Dataflow" é anotada como a entidade @product permite a adaptação automática de fala para detectar "Google Cloud Dataflow" e "Google Cloud Dialogflow" com o mesmo peso. Consulte Projeto do agente para ver mais práticas recomendadas.

Os enunciados do usuário com entidades numéricas consecutivas, mas distintas, podem ser ambíguos. Por exemplo, "Quero dois 16 pacotes" pode significar 2 quantidades de 16 pacotes ou 216 quantidades em pacotes. A adaptação de fala pode ajudar a tirar a ambiguidade desses casos se você configurar entidades com valores ortográficos:
- Defina uma entidade quantity com entradas:
  zero
  one
  ...
  twenty
- Defina uma entidade product ou size com entradas:
  sixteen pack
  two ounce
  ...
  five liter
- Somente sinônimos de entidade são usados na adaptação de fala. Assim, você pode definir uma entidade com o valor de referência 1 e um único sinônimo one para simplificar a lógica de fulfillment.

Entidades regexp

As entidades regexp podem acionar a adaptação automática de fala para sequências alfanuméricas e de dígitos como "ABC123" ou "12345" quando configuradas e testadas corretamente.

Para reconhecer essas sequências por voz, implemente todos os quatro requisitos abaixo:

1. Requisito de entrada de regex

Embora qualquer expressão regular possa ser usada para extrair entidades de entradas de texto, somente algumas expressões informam a adaptação automática de fala a fim de polarizar sequências alfanuméricas ou dígitos numeradas ao reconhecer a fala.

Na entidade regexp, pelo menos uma entrada precisa seguir todas estas regras:

Precisa corresponder a alguns caracteres alfanuméricos, por exemplo: \d, \w, [a-zA-Z0-9]
Não pode conter espaços em branco ou \s, embora \s* e \s? sejam permitidos
Não deve conter grupos de captura ou não captura ()
Não tente corresponder caracteres ou pontuação especiais, como: ` ~ ! @ # $ % ^ & * ( ) - _ = + , . < > / ? ; ' : " [ ] { } \ |

Essa entrada pode ter conjuntos de caracteres [] e quantificadores de repetição, como *, ?, +, {3,5}.

Confira Exemplos.

2. Requisito de definição de parâmetro

Marque a entidade regexp como parâmetro de formulário obrigatório para que ela seja coletada durante preenchimento. Isso permite que a adaptação automática de fala polarize o reconhecimento de sequências em vez de tentar reconhecer uma intent e uma sequência ao mesmo tempo. Caso contrário, "Onde está meu pacote para ABC123" pode ser reconhecido incorretamente como "Onde está meu pacote 4ABC123".

3. Requisito de anotação de frases de treinamento

Não use a entidade regexp em uma anotação de frase de treinamento de intent. Isso garante que o parâmetro seja resolvido como parte do preenchimento do formulário.

4. Requisito de teste

Consulte Testar a adaptação de fala.

Exemplos

Por exemplo, uma entidade regexp com uma única entrada ([a-zA-Z0-9]\s?){5,9} não acionará o reconhecedor da sequência de fala porque ele contém um grupo de captura. Para corrigir isso, basta adicionar outra entrada para [a-zA-Z0-9]{5,9}. Agora você vai se beneficiar do reconhecedor de sequência ao corresponder a "ABC123". No entanto, a NLU ainda vai corresponder a entradas como "ABC 123", graças à regra original que permite espaços.

Os seguintes exemplos de expressões regulares se adaptam para sequências alfanuméricas:

^[A-Za-z0-9]{1,10}$
WAC\d+
215[2-8]{3}[A-Z]+
[a-zA-Z]\s?[a-zA-Z]\s?[0-9]\s?[0-9]\s?[0-9]\s?[a-zA-Z]\s?[a-zA-Z]

Os seguintes exemplos de expressões regulares se adaptam para sequências de dígitos:

\d{2,8}
^[0-9]+$
2[0-9]{7}
[2-9]\d{2}[0-8]{3}\d{4}

Solução alternativa para regexp

A compatibilidade integrada da adaptação automática de fala para entidades regexp varia de acordo com o idioma. Confira os idiomas compatíveis com Tokens de classe de fala $OOV_CLASS_ALPHANUMERIC_SEQUENCE e $OOV_CLASS_DIGIT_SEQUENCE.

Se seu idioma não estiver listado, você poderá contornar essa limitação. Por exemplo, se você quiser que um ID de funcionário com três letras e três dígitos seja reconhecido com precisão, crie seu agente com as seguintes entidades e parâmetros:

Defina uma entidade digit que contenha 10 entradas de entidade (com sinônimos):
0, 0
1, 1
...
9, 9
Defina uma entidade letter que contenha 26 entradas de entidade (com sinônimos):
A, A
B, B
...
Z, Z
Defina uma entidade employee-id que contenha uma única entrada de entidade (sem sinônimos):
@letter @letter @letter @digit @digit @digit
Use @employee-id como parâmetro em uma frase de treinamento.

Adaptação manual de fala

Com a adaptação manual de fala, é possível configurar manualmente frases de adaptação de fala para um fluxo ou uma página. Ela também substitui os contextos de fala implícitos gerados pela adaptação automática de fala quando esta está ativada.

As configurações de adaptação da fala no nível do fluxo e da página têm uma relação hierárquica. Isso significa que, por padrão, uma página herda as configurações de adaptação da fala do nível do fluxo, e o nível da página mais refinado sempre substitui o nível do fluxo se a página tiver uma configuração personalizada.

As configurações de adaptação de fala, de fluxo e de página podem ser ativadas de forma independente. Se a configuração de adaptação no nível do fluxo não estiver ativada, você ainda poderá escolher Personalizar no nível da página para ativar a adaptação manual de voz nessa página específica. Da mesma forma, se você desativar a adaptação manual da fala na configuração do nível do fluxo, as páginas do fluxo com a opção Personalizar selecionada não serão afetadas.

No entanto, as configurações no nível do fluxo e da página não podem ser desativadas de forma independente. Se um fluxo tiver a adaptação manual de fala ativada, não será possível desativá-la para uma página no fluxo usando a opção Personalizar. Portanto, se você quiser ter um uso misto de adaptação manual e automática de fala para páginas em um fluxo, não ative a adaptação manual no nível do fluxo. Use apenas as configurações de adaptação no nível da página. Consulte a tabela abaixo para entender qual combinação de fluxo e configuração de página usar no seu caso de adaptação.

Efeito de destino	Uso recomendado das configurações de adaptação
Desativar a adaptação automática para um fluxo	Fluxo ativado sem conjuntos de frases (as páginas dentro do fluxo usam a configuração do fluxo por padrão).
Desativar a adaptação automática para uma página	Fluxo desativado e página ativada (Personalizar escolhido) sem conjuntos de frases.
Usar apenas a adaptação manual de fala em todas as páginas de um fluxo	Fluxo ativado. Personalize as páginas que precisam usar conjuntos de frases diferentes do fluxo.
Misturar o uso da adaptação automática e manual em um fluxo	Fluxo desativado. Personalize as páginas em que você quer aplicar a adaptação manual.
Usar a adaptação automática de fala apenas para todas as páginas em um fluxo	Fluxo desativado.

Ativar ou desativar a adaptação manual de fala

Para ativar ou desativar a adaptação manual de fala no nível do fluxo ou da página:

Configurações de fluxo

Abra o console do Dialogflow CX.
Escolha seu projeto do GCP.
Passe o cursor do mouse sobre o fluxo na seção Fluxos.
Clique no botão de opções .
Selecione Configurações de fluxo no menu suspenso.
Marque ou desmarque a caixa de seleção Ativar adaptação manual de voz.
Editar, adicionar ou excluir conjuntos de frases na tabela
Clique em Salvar.

Configurações da página

Abra o console do Dialogflow CX.
Escolha seu projeto do GCP.
Passe o cursor do mouse sobre a página na seção Páginas.
Clique no botão de opções .
Selecione Configurações da página no menu suspenso.
A opção Usar nível de fluxo é escolhida por padrão. Quando selecionada, as frases de adaptação no nível do fluxo são reutilizadas para essa página. Escolha Personalizar para configurar frases de adaptação diferentes das configurações no nível do fluxo. Mesmo que a adaptação manual de fala esteja desativada no nível do fluxo, ainda é possível ativar e configurar a adaptação manual de fala para uma página desse fluxo usando a opção Personalizar.
Editar, adicionar ou excluir um conjunto de frases na tabela de conjuntos de frases de adaptação
Clique em Salvar.

Configuração manual de conjunto de frases para melhorias no reconhecimento de fala

1. Palavras e frases

Em um conjunto de frases de adaptação, é possível definir frases de uma ou várias palavras com referências opcionais a tokens de classe de fala. Por exemplo, você pode adicionar frases como "ótima taxa", "o número de rastreamento é $OOV_CLASS_ALPHANUMERIC_SEQUENCE" ou "$FULLPHONENUM". Essas frases aumentam a probabilidade de serem transcritas em vez de outras frases foneticamente semelhantes. Quando você adiciona uma frase com várias palavras sem aumento, o viés é aplicado à frase inteira e às partes contínuas dela. Em geral, o número de frases deve ser pequeno, e você só deve adicionar frases que o reconhecimento de fala tem dificuldade de acertar sem a adaptação de fala. Se a Speech-to-Text já reconhece uma frase corretamente, não é necessário adicioná-la às configurações de adaptação de fala. Se você notar algumas frases que a Speech-to-Text costuma reconhecer incorretamente em uma página ou fluxo, adicione as frases corretas às configurações de adaptação correspondentes.

Exemplo de correção de erros de reconhecimento

Este é um exemplo de como usar a adaptação de fala para corrigir problemas de reconhecimento. Digamos que você esteja criando um agente de troca de dispositivos móveis, e o usuário pode dizer algo incluindo as frases "vender celulares" ou "celular" depois que o agente fizer a primeira pergunta "em que posso ajudar?". Como podemos usar a adaptação de fala para melhorar a precisão do reconhecimento nas duas frases?

Se você incluir as duas frases nas configurações de adaptação, a Speech-to-Text ainda poderá ficar confusa, já que elas soam semelhantes. Se você fornecer apenas uma das duas frases, a Speech-to-Text poderá reconhecer uma frase como a outra. Para melhorar a acurácia do reconhecimento de fala para as duas frases, é necessário fornecer à Speech-to-Text mais pistas de contexto para distinguir quando ela deve ouvir "vender celulares" e quando deve ouvir "celular". Por exemplo, você pode notar que as pessoas costumam usar "vender celulares" como parte de frases como "como vender celulares", "quero vender celulares" ou "você vende celulares", enquanto "celular" como parte de frases como "comprar celular", "conta de celular" e "serviço de celular". Se você fornecer essas frases mais precisas ao modelo em vez das frases originais curtas "celular" e "vender celulares", a Speech-to-Text vai aprender que "vender celular" como uma frase verbal é mais provável de seguir palavras como "como", "quero" e "você", enquanto "celular" como uma frase nominal é mais provável de seguir palavras como "comprar" ou ser seguido por palavras como "conta" ou "serviço". Portanto, como regra geral para configurar frases de adaptação, geralmente é melhor fornecer frases mais precisas, como "como vender celulares" ou "você vende celulares", do que incluir apenas "vender celular".

2. Tokens de classe de fala

Além de palavras em linguagem natural, você também pode incorporar referências a tokens de classe de fala em uma frase. Esses tokens representam conceitos comuns que geralmente seguem um determinado formato na escrita. Por exemplo, para o número do endereço em um endereço como "123 Main Street", as pessoas geralmente esperam ver o formato numérico "123" em vez da versão por extenso "one-hundred twenty-three". Se você espera uma determinada formatação nos resultados da transcrição, especialmente para sequências alfanuméricas, consulte a lista de tokens de classe compatíveis para saber quais estão disponíveis para seu idioma e caso de uso.

Se a página já tiver rotas ou parâmetros de intent com referências a entidades do sistema, confira uma tabela de referência para mapeamentos entre entidades comuns do sistema e tokens de classe de fala:

Entidades do sistema	Tokens de classe de fala
`@sys.date`	`$MONTH $DAY $YEAR`
`@sys.date-time`	`$MONTH $DAY $YEAR`
`@sys.date-period`	`$MONTH $DAY $YEAR`
`@sys.time`	`$TIME`
`@sys.time-period`	`$TIME`
`@sys.age`	`$OPERAND`
`@sys.number`	`$OPERAND`
`@sys.number-integer`	`$OPERAND`
`@sys.cardinal`	`$OPERAND`
`@sys.ordinal`	`$OPERAND`
`@sys.percentage`	`$OPERAND`
`@sys.duration`	`$OPERAND`
`@sys.currency-name`	`$MONEY`
`@sys.unit-currency`	`$MONEY`
`@sys.phone-number`	`$FULLPHONENUM`
`@sys.zip-code`	`$POSTALCODE` ou `$OOV_CLASS_POSTALCODE`
`@sys.address`	`$ADDRESSNUM $STREET $POSTALCODE`
`@sys.street-address`	`$ADDRESSNUM $STREET $POSTALCODE`
`@sys.temperature`	`$OOV_CLASS_TEMPERATURE`
`@sys.number-sequence`	`$OOV_CLASS_DIGIT_SEQUENCE`
`@sys.flight-number`	`$OOV_CLASS_ALPHANUMERIC_SEQUENCE`

3. Otimizar valor

Se adicionar frases sem o valor de otimização não fornecer um efeito de viés forte o suficiente, use o valor de otimização para fortalecer ainda mais o efeito de viés da adaptação de fala.

O reforço aplica um viés adicional quando definido com valores maiores que 0 e não mais que 20. Quando o reforço está vazio ou é 0, o efeito de viés padrão ajuda a reconhecer a frase inteira e as partes contínuas dela. Por exemplo, uma frase sem reforço "você está aberto para vender smartphones" ajuda a reconhecer essa frase e também frases semelhantes, como "Eu vendo smartphones" e "Olá, você está aberto".

Quando o reforço positivo é aplicado, o efeito de viés é mais forte, mas só se aplica à frase exata. Por exemplo, uma frase otimizada "vender smartphones" ajuda a reconhecer "você pode vender smartphones", mas não "você vende smartphones".

Por isso, você vai ter os melhores resultados se fornecer frases com e sem incremento.

Valores de otimização maiores podem resultar em menos falsos negativos, que são casos em que a palavra ou frase ocorreu no áudio, mas não foi reconhecida corretamente pela Speech-to-Text (subestimando). No entanto, a otimização também pode aumentar a probabilidade de falsos positivos. Ou seja, casos em que a palavra ou frase aparece na transcrição, mesmo que não tenha ocorrido no áudio (excesso de viés). Normalmente, é necessário ajustar as frases de viés para encontrar um bom ponto de troca entre os dois problemas de viés.

Saiba mais sobre como ajustar o valor de reforço para frases no documento do Cloud Speech sobre reforço.

Quando usar a adaptação automática ou manual de fala

Em geral, se você não tiver certeza se a adaptação de fala vai melhorar a qualidade do reconhecimento de fala do seu agente (sem padrões claros de erros de transcrição em mente), tente primeiro a adaptação automática de fala antes de recorrer à adaptação manual. Para decisões mais sutis, considere os seguintes fatores para decidir entre a adaptação automática ou manual de fala:

1. Preenchimento de formulário

A adaptação automática de voz funciona muito bem com o preenchimento de formulários, já que usa o contexto da gramática ABNF para os parâmetros do formulário e aplica regras gramaticais com base nos tipos de entidades. Como a adaptação manual de fala ainda não é compatível com gramáticas ABNF, a adaptação automática de fala geralmente é preferível à manual para uma página de preenchimento de formulário. Ainda para páginas com apenas parâmetros de entidade do sistema e entidades regexp simples compatíveis com tokens de classe de fala, você também pode usar a adaptação manual de fala para conseguir um efeito de viés semelhante à adaptação automática de fala sem precisar ajustar entidades regexp.

2. Complexidade da transição de página ou fluxo

Para uma página ou um fluxo simples com algumas rotas de intenção, a adaptação automática de fala provavelmente vai gerar frases de viés representativas e ter uma performance razoável.

No entanto, se uma página ou um fluxo tiver uma grande quantidade de rotas de intent (para uma página, considere também o número de rotas no nível do fluxo) ou se algum dos intents tiver frases de treinamento sem importância muito longas ou curtas (por exemplo, uma frase inteira ou uma única palavra com apenas uma ou duas sílabas), é muito provável que o modelo de adaptação de voz não funcione bem com essas frases. Primeiro, tente desativar a adaptação de fala para as páginas abertas de alta complexidade ativando a adaptação manual de fala com conjuntos de frases vazios (substituição de adaptação vazia). Depois disso, avalie se há frases especiais não ambíguas que ainda precisam ser fornecidas ao Speech-to-Text para melhorar a qualidade do reconhecimento.

Outro sintoma desse problema de complexidade é a presença de uma ampla variedade de problemas de subestimativa ou superestimativa quando a adaptação automática de fala está ativada. Assim como no caso acima, você também precisa testar com a adaptação de fala desativada para a página específica primeiro. Se os comportamentos errôneos persistirem depois de desativar a adaptação de voz, adicione as frases que você quer corrigir nas configurações de adaptação de voz e até mesmo valores de reforço para fortalecer ainda mais os efeitos de viés quando necessário.

Testando a adaptação de fala

Ao testar os recursos de adaptação de fala do seu agente para uma determinada frase de treinamento ou correspondência de entidade, não teste diretamente a correspondência com a primeira expressão de voz de uma conversa. Use apenas entradas de voz ou eventos durante toda a conversa antes da correspondência que você quer testar. O comportamento do agente quando testado dessa maneira é semelhante ao comportamento em conversas reais de produção.

Limitações

Considere as seguintes limitações:

A adaptação de fala não está disponível para todos os modelos de fala e combinações de idiomas. Consulte a página de suporte a idiomas da Cloud Speech para verificar se a "adaptação de modelo" está disponível para sua combinação de modelo de fala e idioma.

No momento, a adaptação manual de voz não é compatível com classes personalizadas ou gramática ABNF. É possível ativar a adaptação automática de fala ou usar uma solicitação de detecção de intenção em tempo de execução para aproveitar esses recursos de adaptação.
O mesmo valor de reforço pode ter desempenho diferente para modelos de fala e idiomas diferentes. Portanto, tenha cuidado ao configurar manualmente para agentes que usam vários idiomas ou modelos de fala. No momento, a adaptação manual de voz se aplica a todos os idiomas de um agente. Portanto, os agentes multilíngues só podem usar frases independentes de idioma ou dividir cada idioma em um agente separado. Como o comportamento de inclusão de viés padrão (sem otimização ou com otimização zero) geralmente funciona bem para todos os idiomas e modelos, não é necessário configurar valores de otimização específicos do idioma, a menos que seja necessário um viés mais forte para seu caso de uso de reconhecimento. Saiba mais sobre como ajustar o valor de otimização neste guia do Cloud Speech-to-Text.

Reconhecer sequências de caracteres longas é um desafio. O número de caracteres capturados em um único turno está diretamente relacionado à qualidade do áudio de entrada. Se você seguiu todas as diretrizes de entidades regexp e tentou usar tokens de classe de fala relevantes nas configurações manuais de adaptação de fala, mas ainda não consegue capturar toda a sequência em uma única rodada, considere algumas alternativas mais conversacionais:
- Ao validar a sequência em relação a um banco de dados, faça referência cruzada a outros parâmetros coletados, como datas, nomes ou números de telefone, para permitir correspondências incompletas. Por exemplo, em vez de apenas solicitar o número de pedido ao usuário, peça também um número de telefone. Agora, quando o webhook consultar o banco de dados para verificar o status do pedido, ele poderá depender do número de telefone e retornar o pedido correspondente mais próximo dessa conta. Isso pode permitir que o Dialogflow escute "ABC" como "AVC" e ainda retorne o status correto do pedido ao usuário.
- Para sequências mais longas, crie um fluxo que incentive os usuários finais a pausar no meio para que o bot possa confirmar durante o processo.

Clonagem de voz

Avançar

Configurações avançadas de fala