Transcreva voz em texto através da Google Cloud consola

Este início rápido apresenta a consola do Cloud Speech-to-Text. Neste início rápido, vai criar e refinar uma transcrição, e aprender a usar esta configuração com a API Cloud Speech-to-Text para as suas próprias aplicações.

Para saber como enviar pedidos e receber respostas através da API REST em vez da consola, consulte a página Antes de começar.

Antes de começar

Antes de poder começar a usar a Cloud Speech-to-Text Console, tem de ativar a API na Google Cloud Platform Console. Os passos abaixo explicam as seguintes ações:

  • Ative o Cloud Speech-to-Text num projeto.
  • Certifique-se de que a faturação está ativada para o Cloud Speech-to-Text.

Configure o seu Google Cloud projeto

  1. Inicie sessão na Google Cloud consola

  2. Aceda à página do seletor de projetos

    Pode escolher um projeto existente ou criar um novo. Para mais detalhes sobre a criação de um projeto, consulte a documentação da Google Cloud Platform.

  3. Se criar um novo projeto, é-lhe pedido que associe uma conta de faturação a este projeto. Se estiver a usar um projeto pré-existente, certifique-se de que tem a faturação ativada.

    Saiba como confirmar que a faturação está ativada para o seu projeto

  4. Depois de selecionar um projeto e associá-lo a uma conta de faturação, pode ativar a Cloud Speech-to-Text API. Aceda à barra Pesquisar produtos e recursos na parte superior da página e escreva "voz".

  5. Selecione a Cloud Speech-to-Text API na lista de resultados.

  6. Para experimentar o Cloud Speech-to-Text sem o associar ao seu projeto, escolha a opção EXPERIMENTAR ESTA API. Para ativar a Cloud Speech-to-Text API para utilização com o seu projeto, clique em ATIVAR.

Funções necessárias

Para receber as autorizações de que precisa para criar uma transcrição, peça ao seu administrador para lhe conceder a função de administrador de armazenamento (roles/storage.admin) do IAM no seu projeto. Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

Esta função predefinida contém as autorizações necessárias para criar uma transcrição. Para ver as autorizações exatas que são necessárias, expanda a secção Autorizações necessárias:

Autorizações necessárias

São necessárias as seguintes autorizações para criar uma transcrição:

  • storage.buckets.get
  • storage.buckets.list
  • storage.buckets.update
  • Ao nível do projeto ou do contentor:
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.update

Também pode conseguir estas autorizações com funções personalizadas ou outras funções predefinidas.

Crie uma transcrição

Use a Google Cloud consola para criar uma transcrição.

Configuração de áudio

  1. Abra a vista geral do Cloud Speech-to-Text.

    A página Vista geral do Speech-to-text na Google Cloud Console.

  2. Clique em Criar transcrição.

    • Se for a primeira vez que usa a consola, é-lhe pedido que escolha onde no Cloud Storage quer armazenar as suas configurações e transcrições.
      A página de criação de transcrição da conversão de voz em texto.
  3. Na página Criar transcrição, carregue um ficheiro de áudio de origem. Pode escolher um ficheiro que já esteja guardado no Cloud Storage ou carregar um novo para o destino do Cloud Storage especificado.

  4. Selecione o tipo de codificação do ficheiro de áudio carregado.

  5. Especifique a respetiva taxa de amostragem.

  6. Clique em Continuar. Aceda a Opções de transcrição.

Opções de transcrição

  1. Selecione o código do idioma do áudio de origem. Este é o idioma falado na gravação.

  2. Escolha o modelo de transcrição que quer usar no ficheiro. A opção Predefinição está pré-selecionada e, geralmente, não é necessária nenhuma alteração, mas a correspondência do modelo com o tipo de áudio pode resultar numa maior precisão. Tenha em atenção que os custos dos modelos variam.

    A página de criação de transcrição da conversão de voz em texto.

  3. Clique em Continuar. Aceda a Adaptação do modelo.

Adaptação do modelo (opcional)

Se o áudio de origem contiver elementos como palavras raras, nomes próprios ou termos proprietários e tiver problemas com o reconhecimento, a adaptação do modelo pode ajudar.

  1. Selecione Ativar adaptação do modelo.

  2. Escolha Recurso de adaptação único.

  3. Adicione expressões relevantes e atribua-lhes um valor de aumento.

    A página de criação de transcrição da conversão de voz em texto.

  4. Na coluna do lado esquerdo, clique em Enviar para criar a transcrição.

Reveja a transcrição

Consoante o tamanho do ficheiro de áudio, a transcrição pode demorar alguns minutos a ser criada. Depois de criada, a transcrição está pronta para revisão. A ordenação da tabela por data/hora permite-lhe localizar facilmente as transcrições recentes.

  1. Clique no Nome da transcrição que quer rever.

    A página Lista de transcrição de conversão de voz em texto.
  2. Compare o texto da transcrição com o ficheiro de áudio

    Página que apresenta os detalhes da transcrição de conversão de voz em texto concluída.
  3. Se quiser fazer alterações, clique em Reutilizar configuração. Isto direciona para o fluxo Criar transcrição com as mesmas opções pré-selecionadas, o que lhe permite alterar algumas opções, criar uma nova transcrição e comparar os resultados.

O que se segue?