Esta página mostra como começar a usar as bibliotecas de cliente da Google Cloud para a API Document AI Toolbox. As bibliotecas cliente facilitam o acesso às Google Cloud APIs a partir de um idioma suportado. Embora possa usar as Google Cloud APIs diretamente fazendo pedidos não processados ao servidor, as bibliotecas cliente oferecem simplificações que reduzem significativamente a quantidade de código que tem de escrever.
Leia mais acerca das bibliotecas cliente da nuvem e das bibliotecas cliente das APIs Google mais antigas em Bibliotecas cliente explicadas.
Instale a biblioteca cliente
Python
pip install --upgrade google-cloud-documentai-toolbox
Para mais informações, consulte o artigo Configurar um ambiente de desenvolvimento Python.
Configure a autenticação
Para autenticar chamadas para Google Cloud APIs, as bibliotecas cliente suportam Credenciais padrão da aplicação (ADC); as bibliotecas procuram credenciais num conjunto de localizações definidas e usam essas credenciais para autenticar pedidos para a API. Com o ADC, pode disponibilizar credenciais à sua aplicação numa variedade de ambientes, como desenvolvimento local ou produção, sem ter de modificar o código da aplicação.Para ambientes de produção, a forma como configura o ADC depende do serviço e do contexto. Para mais informações, consulte o artigo Configure as Credenciais padrão da aplicação.
Para um ambiente de desenvolvimento local, pode configurar o ADC com as credenciais associadas à sua Conta Google:
-
Install the Google Cloud CLI. After installation, initialize the Google Cloud CLI by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
É apresentado um ecrã de início de sessão. Depois de iniciar sessão, as suas credenciais são armazenadas no ficheiro de credenciais local usado pelo ADC.
Use a biblioteca cliente
A caixa de ferramentas da IA Documental é um SDK para Python que fornece funções de utilidade para gerir, manipular e extrair informações da resposta do documento.
Cria um objeto de documento "wrapped" a partir de uma resposta de documento processada de ficheiros JSON no
Cloud Storage, ficheiros JSON locais ou saída diretamente do método process_document()
.
Pode realizar as seguintes ações:
- Combine ficheiros JSON
Document
fragmentados do processamento em lote num único documento "envolvido". - Exporte fragmentos como um
Document
unificado. -
Receba o resultado
Document
de: - Aceder a texto de
Pages
,Lines
,Paragraphs
,FormFields
eTables
sem processar informações deLayout
. - Pesquise um
Pages
que contenha uma string de destino ou que corresponda a uma expressão regular. - Pesquise
FormFields
pelo nome. - Pesquise
Entities
por tipo. - Converta
Tables
num Dataframe do Pandas ou num ficheiro CSV. - Inserir
Entities
eFormFields
numa tabela do BigQuery. - Dividir um ficheiro PDF com base no resultado de um processador de divisão/classificação.
- Extrair imagem
Entities
deDocument
caixas delimitadoras. -
Converta
Documents
para e a partir de formatos usados frequentemente:- Cloud Vision API
AnnotateFileResponse
- hOCR
- Formatos de processamento de documentos de terceiros
- Cloud Vision API
- Crie lotes de documentos para processamento a partir de uma pasta do Cloud Storage.
Exemplos de código
Os exemplos de código seguintes demonstram como usar o Document AI Toolbox.
Início rápido
Tabelas
BigQuery Export
PDF dividido
Extração de imagens
Conversão de visão
Conversão de hOCR
Conversão de terceiros
Documentos em lote
Unir fragmentos de documentos
Recursos adicionais
Python
A lista seguinte contém links para mais recursos relacionados com a biblioteca cliente para Python: