Nesta página, mostramos como começar a usar as bibliotecas de cliente do Cloud para a API Document AI Toolbox. As bibliotecas de cliente facilitam o acesso a Google Cloud APIs do em uma linguagem compatível. É possível usar as APIs doGoogle Cloud diretamente fazendo solicitações brutas ao servidor, mas as bibliotecas de cliente oferecem simplificações que reduzem significativamente a quantidade de código que você precisa escrever.
Saiba mais sobre as bibliotecas de cliente do Cloud e as bibliotecas de cliente de APIs do Google mais antigas em Explicação sobre as bibliotecas de cliente.
Instale a biblioteca de cliente
Python
pip install --upgrade google-cloud-documentai-toolbox
Para mais informações, consulte Como configurar um ambiente de desenvolvimento em Python.
Configurar a autenticação
Para autenticar chamadas às APIs do Google Cloud , as bibliotecas de cliente oferecem suporte a Application Default Credentials (ADC). As bibliotecas procuram credenciais em um conjunto de locais definidos e as usam para autenticar solicitações à API. Com o ADC, é possível disponibilizar credenciais ao aplicativo em uma variedade de ambientes, como de desenvolvimento ou produção local, sem precisar modificar o código do aplicativo.Em ambientes de produção, a maneira como você configura o ADC depende do serviço e do contexto. Para mais informações, consulte Configurar o Application Default Credentials.
Para um ambiente de desenvolvimento local, é possível configurar o ADC com as credenciais associadas à sua Conta do Google:
-
Instale a Google Cloud CLI. Após a instalação, inicialize a Google Cloud CLI executando o seguinte comando:
gcloud init -
Se você estiver usando um shell local, crie credenciais de autenticação local para sua conta de usuário:
gcloud auth application-default login
Não é necessário fazer isso se você estiver usando o Cloud Shell.
Uma tela de login é exibida. Após o login, suas credenciais são armazenadas no arquivo de credenciais local usado pelo ADC.
Usar a biblioteca de cliente
O Document AI Toolbox é um SDK para Python que oferece funções de utilidade
para gerenciar, manipular e extrair informações da resposta do documento.
Ele cria um objeto de documento "encapsulado" de uma resposta de documento processada de arquivos JSON no
Cloud Storage, arquivos JSON locais ou saída diretamente do process_document()
método.
Ele pode realizar as seguintes ações:
- Combine arquivos JSON
Documentfragmentados do processamento em lote em um único documento "encapsulado". - Exporte fragmentos como um
Documentunificado. -
Receba a saída
Documentde: - Acesse o texto de
Pages,Lines,Paragraphs,FormFieldseTablessem processar informações deLayout. - Pesquise um
Pagesque contenha uma string de destino ou que corresponda a uma expressão regular. - Pesquise
FormFieldspor nome. - Pesquise
Entitiespor tipo. - Converta
Tablesem um Pandas DataFrame ou CSV. - Insira
EntitieseFormFieldsem uma BigQuery. - Divida um arquivo PDF com base na saída de um processador de divisor/classificador.
- Extraia imagem
EntitiesdeDocumentcaixas delimitadoras. -
Converta
Documentspara e de formatos usados com frequência:- API Cloud Vision
AnnotateFileResponse - hOCR
- Formatos de processamento de documentos de terceiros
- API Cloud Vision
- Crie lotes de documentos para processamento em uma pasta do Cloud Storage.
Exemplos de código
Os exemplos de código a seguir demonstram como usar o Document AI Toolbox.
Guia de início rápido
Tabelas
Exportação para o BigQuery
Divisão de PDF
Extração de imagem
Conversão de visão
Conversão de hOCR
Conversão de terceiros
Lotes de documentos
Mesclar fragmentos de documentos
Outros recursos
Python
Confira na lista a seguir os links para mais recursos relacionados à biblioteca de cliente para Python: