Configurar um projeto de reconhecimento de caracteres

Esta página ajuda os desenvolvedores a configurar um projeto de appliance isolado do Google Distributed Cloud (GDC) para usar o serviço de reconhecimento óptico de caracteres (OCR). Esse processo inclui a criação de um projeto, a ativação da API OCR, a instalação de bibliotecas de cliente, a definição de variáveis de ambiente e a autenticação das credenciais. Se você não conhece a Vertex AI, saiba mais sobre os recursos de reconhecimento de caracteres.

Configure um projeto de reconhecimento de caracteres usando o console do GDC e a CLI gdcloud da seguinte maneira:

  • Console do GDC: ative a API OCR e confira o status do serviço e o endpoint.
  • CLI gdcloud: configure contas de serviço para interagir com a API OCR, instale bibliotecas de cliente e autentique solicitações de API.

Criar um projeto

A criação de um projeto de reconhecimento de caracteres organiza seus recursos de OCR, que incluem colaboradores, APIs ativadas, credenciais de autenticação e controles de acesso.

Para criar seu projeto, consulte Configurar um projeto para a Vertex AI. Você precisa do ID do projeto ao fazer chamadas de API.

Solicitar permissões de desenvolvedor

Você precisa ter o papel de desenvolvedor de OCR de IA no seu projeto para acessar recursos de reconhecimento óptico de caracteres e gerar um token de API para autenticação e autorização de solicitações.

Peça ao admin do IAM do projeto para conceder o papel de desenvolvedor de OCR de IA (ai-ocr-developer) à sua conta de usuário ou de serviço no namespace do projeto. Para mais informações sobre esse papel, consulte Preparar permissões do IAM.

Ativar a API OCR

É necessário ativar a API OCR pré-treinada no projeto. Se ativada, você pode conferir o status do serviço e o endpoint da API OCR pré-treinada.

Instalar bibliotecas de cliente

As bibliotecas de cliente estão disponíveis para a linguagem de programação Python. Recomendamos o uso dessas bibliotecas de cliente para fazer chamadas para a API OCR, porque elas facilitam o acesso às APIs.

Instale a biblioteca de cliente OCR e siga estas etapas para garantir que você tenha a versão correta:

  1. Verifique se a biblioteca de cliente OCR está instalada e receba o número da versão:

    pip freeze | grep vision
    

    Se a biblioteca de cliente já estiver instalada, você vai receber uma saída semelhante ao exemplo a seguir:

    google-cloud-vision==3.0.0
    

    O número da versão recebido precisa corresponder à biblioteca de cliente no endpoint a seguir:

    https://GDC_URL/.well-known/static/client-libraries
    

    Substitua GDC_URL pelo URL da sua organização no GDC.

  2. Se os números de versão não corresponderem, desinstale a biblioteca de cliente:

    pip uninstall google-cloud-vision
    
  3. Se você desinstalou a biblioteca de cliente OCR, é necessário reinstalá-la especificando o nome de arquivo correspondente ao seu sistema operacional.

Definir as variáveis de ambiente

Depois de instalar a biblioteca de cliente OCR, você pode interagir com a API de um script Python.

Se você configurar uma conta de serviço no projeto para fazer chamadas de API autorizadas de maneira programática, poderá definir variáveis de ambiente no script Python para acessar valores como as chaves da conta de serviço durante a execução.

Siga estas etapas para definir as variáveis de ambiente necessárias em um script Python:

  1. Crie um script Python.

  2. Adicione o seguinte código ao script Python:

    import os
    
    os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
    

    Substitua APPLICATION_DEFAULT_CREDENTIALS_FILENAME por o nome do arquivo JSON que contém as chaves da conta de serviço criadas no projeto, como my-service-key.json.

  3. Salve o script Python com um nome, como vision.py.

  4. Execute o script Python para definir as variáveis de ambiente:

    python SCRIPT_NAME
    

    Substitua SCRIPT_NAME pelo nome que você deu ao script Python, como vision.py.

Configurar a autenticação

Antes de começar a usar a API OCR, é necessário autenticar as credenciais do cliente e solicitar acesso à conta dos recursos do projeto. Para mais informações, consulte Autenticar solicitações de API.