Transcreva voz em texto através de bibliotecas cliente
Esta página mostra como enviar um pedido de reconhecimento de voz para o Cloud Speech-to-Text na sua linguagem de programação favorita através das Google Cloud bibliotecas cliente.
O Cloud Speech-to-Text permite a integração fácil das tecnologias de reconhecimento de voz da Google nas aplicações dos programadores. Pode enviar dados de áudio para a API Cloud Speech-to-Text, que devolve uma transcrição de texto desse ficheiro de áudio. Para mais informações sobre o serviço, consulte o artigo Noções básicas do STT na nuvem.
Antes de começar
Antes de poder enviar um pedido para a API Cloud Speech-to-Text, tem de ter concluído as seguintes ações. Consulte a página antes de começar para ver detalhes.
- Ative o Cloud Speech-to-Text num Google Cloud projeto.
- Certifique-se de que a faturação está ativada para o Cloud Speech-to-Text.
-
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud initSe estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
- Verifique se tem as autorizações necessárias para concluir este guia. Se criou um novo projeto para este guia, já tem as autorizações necessárias.
- (Opcional) Crie um novo contentor do Cloud Storage para armazenar os seus dados de áudio.
Funções necessárias
Para receber as autorizações de que
precisa para transcrever voz em texto,
peça ao seu administrador para lhe conceder a
função de IAM Consumidor de utilização de serviços (roles/serviceusage.serviceUsageConsumer)
no seu projeto.
Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.
Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.
Instale a biblioteca cliente
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code or IntelliJ, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Antes de instalar a biblioteca, certifique-se de que preparou o seu ambiente para o desenvolvimento de Node.js.
npm install @google-cloud/speech
Python
Antes de instalar a biblioteca, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
pip install --upgrade google-cloud-speech
Faça um pedido de transcrição de áudio
Agora, pode usar o STT do Google Cloud para transcrever um ficheiro de áudio
para texto. Use o seguinte código para enviar um pedido recognize à Cloud Speech-to-Text API.
Go
Java
Node.js
Antes de executar o exemplo, certifique-se de que preparou o seu ambiente para o desenvolvimento de Node.js.
Python
Antes de executar o exemplo, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
Parabéns! Enviou o seu primeiro pedido para o STT na nuvem.
Se receber um erro ou uma resposta vazia do Cloud STT, consulte os passos de resolução de problemas e mitigação de erros.
Limpar
Para evitar incorrer em cobranças na sua Google Cloud conta pelos recursos usados nesta página, siga estes passos.
- Use o ícone Google Cloud console para eliminar o projeto se não precisar dele.
O que se segue?
- Pratique a transcrição de ficheiros de áudio curtos.
- Saiba como processar em lote ficheiros de áudio longos para reconhecimento de voz.
- Saiba como transcrever áudio em streaming, como o de um microfone.
- Comece a usar o STT do Google Cloud no seu idioma preferencial através de uma biblioteca cliente do STT do Google Cloud.
- Trabalhe com as aplicações de exemplo.
- Para o melhor desempenho, precisão e outras sugestões, consulte a documentação de práticas recomendadas.