Transcrever voz em texto usando o console do Google Cloud

Neste guia de início rápido, apresentamos o console da Cloud Speech-to-Text. Neste guia de início rápido, você vai criar e refinar uma transcrição e aprender a usar essa configuração com a API Cloud Speech-to-Text para seus próprios aplicativos.

Para saber como enviar solicitações e receber respostas usando a API REST em vez do console, consulte a página Antes de começar.

Antes de começar

Antes de começar a usar o console da Cloud Speech-to-Text, ative a API no console do Google Cloud Platform. As etapas abaixo mostram como realizar as seguintes ações:

  • Ativar a Cloud Speech-to-Text em um projeto.
  • Verificar se o faturamento está ativado para a Cloud Speech-to-Text.

Configurar o projeto do Google Cloud

  1. Fazer login no console do Google Cloud

  2. Acessar a página do seletor de projetos.

    É possível escolher um projeto existente ou criar um novo. Para mais detalhes sobre como criar um projeto, consulte a documentação do Google Cloud Platform.

  3. Se você criar um novo projeto, será solicitado que vincule uma conta de faturamento a esse projeto. Se você estiver usando um projeto atual, verifique se o faturamento está ativado.

    Aprenda a confirmar se o faturamento está ativado para o projeto.

  4. Depois de selecionar um projeto e vinculá-lo a uma conta de faturamento, é possível ativar a API Cloud Speech-to-Text. Acesse a barra Pesquisar produtos e recursos na parte superior da página e digite speech.

  5. Selecione a API Cloud Speech-to-Text na lista de resultados.

  6. Para testar a Cloud Speech-to-Text sem vinculá-la ao projeto, escolha a opção TESTAR ESTA API. Para ativar a API Cloud Speech-to-Text para uso com o projeto, clique em ATIVAR.

Papéis necessários

Para receber as permissões necessárias para criar uma transcrição, peça ao administrador para conceder a você o papel do IAM de Administrador do Storage (roles/storage.admin) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esse papel predefinido contém as permissões necessárias para criar uma transcrição. Para acessar as permissões exatas que são necessárias, abra a seção Permissões necessárias:

Permissões necessárias

As seguintes permissões são necessárias para criar uma transcrição:

  • storage.buckets.get
  • storage.buckets.list
  • storage.buckets.update
  • No nível do projeto ou do bucket:
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.update

Essas permissões também podem ser concedidas com papéis personalizados ou outros papéis predefinidos.

Criar uma transcrição

Use o console do Google Cloud para criar uma transcrição.

Configuração de áudio

  1. Abra a visão geral da Cloud Speech-to-Text.

    A página de visão geral da Cloud Speech-to-Text no console do Google Cloud.

  2. Clique em Criar transcrição.

    • Se esta for a primeira vez que você usa o console, será solicitado onde no Cloud Storage você quer armazenar suas configurações e transcrições.
      A página Criar transcrição da Speech-to-Text.
  3. Na página Criar transcrição, Faça upload de um arquivo de áudio de origem. É possível escolher um arquivo que já está salvo no Cloud Storage ou fazer upload de um novo para o destino especificado do Cloud Storage.

  4. Selecione o tipo de codificação do arquivo de áudio enviado.

  5. Especifique a taxa de amostragem.

  6. Clique em Continuar. Você será direcionado para Opções de transcrição.

Opções de transcrição

  1. Selecione o código do idioma do áudio de origem. Este é o idioma falado na gravação.

  2. Escolha o modelo de transcrição que você quer usar no arquivo. A opção Padrão é pré-selecionada e, geralmente, nenhuma alteração é necessária, mas fazer a correspondência do modelo com o tipo de áudio pode resultar em maior acurácia. Observe que os custos do modelo variam.

    A página Criar transcrição da Speech-to-Text.

  3. Clique em Continuar. Você será direcionado para Adaptação do modelo.

Adaptação do modelo (opcional)

Se o áudio de origem tiver itens como palavras raras, nomes próprios ou termos reservados, e você tiver problemas com o reconhecimento, a adaptação do modelo poderá ajudar.

  1. Marque Ativar a adaptação do modelo.

  2. Escolha Recurso de adaptação única.

  3. Adicione frases relevantes e atribua a elas um valor de otimização.

    A página Criar transcrição da Speech-to-Text.

  4. Na coluna à esquerda, clique em Enviar para criar a transcrição.

Revisar a transcrição

Dependendo do tamanho do arquivo de áudio, a transcrição pode levar de minutos a horas para ser criada. Depois que a transcrição for criada, ela estará pronta para revisão. Classificar a tabela por carimbo de data/hora ajuda você a localizar as transcrições recentes.

  1. Clique no Nome da transcrição que você quer revisar.

    A página Lista de transcrições da Speech-to-Text.
  2. Compare o texto da Transcrição com o arquivo de áudio.

    Página mostrando os detalhes da transcrição de voz em texto concluída.
  3. Se você quiser fazer alterações, clique em Reutilizar configuração. Isso levará ao fluxo Criar transcrição com as mesmas opções pré-selecionadas, permitindo que você altere alguns itens, crie uma nova transcrição e compare os resultados.

A seguir