Esta página ajuda os programadores a configurar um projeto isolado do Google Distributed Cloud (GDC) para usar o serviço de reconhecimento ótico de carateres (OCR). Este processo inclui a criação de um projeto, a ativação da API OCR, a instalação de bibliotecas de clientes, a definição de variáveis de ambiente e a autenticação das suas credenciais. Se for um novo utilizador do Vertex AI, saiba mais sobre as funcionalidades de reconhecimento de carateres.
Configure um projeto de reconhecimento de carateres através da consola do GDC e da CLI gdcloud da seguinte forma:
- Consola GDC: ative a API OCR e veja o estado do serviço e o ponto final.
- A CLI gdcloud: configure contas de serviço para interagir com a API OCR, instale bibliotecas cliente e autentique pedidos de API.
Criar um projeto
A criação de um projeto de reconhecimento de carateres na sua hierarquia de recursos do Distributed Cloud organiza os seus recursos de OCR, que incluem colaboradores, APIs ativadas, ferramentas de monitorização, informações de faturação, credenciais de autenticação e controlos de acesso.
Para criar o seu projeto, consulte o artigo Configure um projeto para o Vertex AI. Precisa do ID do projeto quando faz chamadas API.
Peça autorizações de programador
Tem de ter a função de programador de OCR de IA no seu projeto para aceder às funcionalidades de reconhecimento ótico de carateres e gerar um token da API para autenticação e autorização de pedidos.
Peça ao administrador de IAM do projeto para conceder a função de programador de OCR de IA (ai-ocr-developer
) à sua conta de utilizador ou de serviço
no espaço de nomes do projeto. Para informações sobre esta função, consulte o artigo
Prepare as autorizações de IAM.
Ative a API OCR
Tem de ativar a API pré-preparada de OCR para o seu projeto. Se estiver ativada, pode ver o estado do serviço e o ponto final da API pré-preparada de OCR.
Instale bibliotecas de cliente
As bibliotecas cliente estão disponíveis para a linguagem de programação Python. Recomendamos a utilização destas bibliotecas cliente para fazer chamadas à API OCR, uma vez que facilitam o acesso às APIs.
Instale a biblioteca do cliente de OCR e siga estes passos para garantir que tem a versão correta:
Verifique se a biblioteca cliente de OCR está instalada e obtenha o número da versão:
pip freeze | grep vision
Se a biblioteca de cliente já estiver instalada, recebe um resultado semelhante ao seguinte exemplo:
google-cloud-vision==3.0.0
O número da versão que obtém tem de corresponder à biblioteca cliente no seguinte ponto final:
https://GDC_URL/.well-known/static/client-libraries
Substitua
GDC_URL
pelo URL da sua organização no GDC.Se os números das versões não corresponderem, desinstale a biblioteca de cliente:
pip uninstall google-cloud-vision
Se desinstalou a biblioteca do cliente de OCR, tem de reinstalá-la especificando o nome do ficheiro correspondente ao seu sistema operativo.
Defina as variáveis de ambiente
Depois de instalar a biblioteca cliente de OCR, pode interagir com a API a partir de um script Python.
Se configurar uma conta de serviço no seu projeto para fazer chamadas API autorizadas de forma programática, pode definir variáveis de ambiente no script Python para aceder a valores como as chaves da conta de serviço durante a execução.
Siga estes passos para definir as variáveis de ambiente necessárias num script Python:
Crie um bloco de notas do JupyterLab para interagir com a API pré-treinada de OCR.
Crie um script Python no bloco de notas do JupyterLab.
Adicione o seguinte código ao script Python:
import os os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
Substitua
APPLICATION_DEFAULT_CREDENTIALS_FILENAME
pelo nome do ficheiro JSON que contém as chaves da conta de serviço que criou no projeto, comomy-service-key.json
.Guarde o script Python com um nome, como
vision.py
.Execute o script Python para definir as variáveis de ambiente:
python SCRIPT_NAME
Substitua
SCRIPT_NAME
pelo nome que deu ao seu script Python, comovision.py
.
Configure a autenticação
Antes de poder começar a usar a API OCR, tem de autenticar as suas credenciais de cliente e pedir acesso à conta aos recursos do seu projeto. Para mais informações, consulte o artigo Autenticar pedidos de API.