Esta página ajuda os desenvolvedores a configurar um projeto para usar o serviço Speech-to-Text. Esse processo inclui criar um projeto, ativar a API Speech-to-Text, instalar bibliotecas de cliente, definir variáveis de ambiente e autenticar suas credenciais. Se você não conhece a Vertex AI, saiba mais sobre os recursos de reconhecimento de fala.
Configure um projeto de reconhecimento de fala usando o console do GDC e a CLI gdcloud da seguinte maneira:
- Console do GDC: ative a API Speech-to-Text e confira o status do serviço e o endpoint.
- A CLI gdcloud: configure contas de serviço para interagir com a API Speech-to-Text, instale bibliotecas de cliente e autentique solicitações de API.
Criar um projeto
Criar um projeto de reconhecimento de fala na sua hierarquia de recursos do Distributed Cloud organiza seus recursos do Speech-to-Text, que incluem colaboradores, APIs ativadas, ferramentas de monitoramento, informações de faturamento, credenciais de autenticação e controles de acesso.
Para criar seu projeto, consulte Configurar um projeto para a Vertex AI. Você precisa do ID do projeto ao fazer chamadas de API.
Solicitar permissões de desenvolvedor
Você precisa ter a função de desenvolvedor da AI Speech no seu projeto para acessar recursos de reconhecimento de fala e gerar um token de API para autenticação e autorização de solicitações.
Peça ao administrador do IAM do projeto para conceder o papel de desenvolvedor da AI Speech
(ai-speech-developer) à sua conta de usuário ou de serviço
no namespace do projeto. Para mais informações sobre esse papel, consulte
Preparar permissões do IAM.
Ativar a API Speech-to-Text
É necessário ativar a API Speech-to-Text pré-treinada no projeto. Se ativada, você pode conferir o status do serviço e o endpoint da API Speech-to-Text pré-treinada.
Instalar bibliotecas de cliente
As bibliotecas de cliente estão disponíveis para a linguagem de programação Python. Recomendamos usar essas bibliotecas de cliente para fazer chamadas à API Speech-to-Text porque elas facilitam o acesso às APIs.
OBSERVAÇÃO: use o venv para isolar os ambientes Python.
Instale a biblioteca em um ambiente virtual usando venv. Essa ferramenta facilita a criação de ambientes Python isolados, cada um capaz de hospedar versões distintas de pacotes Python. Esse isolamento evita que as dependências do projeto entrem em conflito com as de outros projetos ou instalações em todo o sistema. Além disso, o uso do venv permite a instalação de bibliotecas sem exigir permissões no nível do sistema.
Instale a biblioteca de cliente da Speech-to-Text e siga estas etapas para garantir que você tenha a versão correta:
Verifique se a biblioteca de cliente da Speech-to-Text está instalada e consiga o número da versão:
pip freeze | grep speechSe a biblioteca de cliente já estiver instalada, você vai receber uma saída semelhante a este exemplo:
google-cloud-speech==2.15.0O número da versão obtido precisa corresponder à biblioteca de cliente no seguinte endpoint:
https://GDC_URL/.well-known/static/client-librariesSubstitua
GDC_URLpelo URL da sua organização no GDC.Se os números de versão não corresponderem, desinstale a biblioteca de cliente:
pip uninstall google-cloud-speechSe você desinstalou a biblioteca de cliente Speech-to-Text, é necessário reinstalá-la especificando o nome de arquivo correspondente ao seu sistema operacional.
Definir as variáveis de ambiente
Depois de instalar a biblioteca de cliente da API Speech-to-Text, você pode interagir com a API usando um script Python.
Se você configurar uma conta de serviço no projeto para fazer chamadas de API autorizadas de forma programática, poderá definir variáveis de ambiente no script Python para acessar valores como as chaves da conta de serviço durante a execução.
Siga estas etapas para definir as variáveis de ambiente necessárias em um script Python:
Crie um notebook do JupyterLab para interagir com a API Speech-to-Text pré-treinada.
Crie um script Python no notebook do JupyterLab.
Adicione o seguinte código ao script Python:
import os os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"Substitua
APPLICATION_DEFAULT_CREDENTIALS_FILENAMEpelo nome do arquivo JSON que contém as chaves da conta de serviço criadas no projeto, comomy-service-key.json.Salve o script do Python com um nome, como
speech.py.Execute o script Python para definir as variáveis de ambiente:
python SCRIPT_NAMESubstitua
SCRIPT_NAMEpelo nome que você deu ao script do Python, comospeech.py.
Configurar a autenticação
Antes de começar a usar a API Speech-to-Text, autentique suas credenciais de cliente e solicite acesso à conta dos recursos do projeto. Para mais informações, consulte Autenticar solicitações de API.