Esta página mostra como começar a usar as bibliotecas de cliente da Google Cloud para a API Document AI Toolbox. As bibliotecas cliente facilitam o acesso às Google Cloud APIs a partir de um idioma suportado. Embora possa usar as Google Cloud APIs diretamente fazendo pedidos não processados ao servidor, as bibliotecas cliente oferecem simplificações que reduzem significativamente a quantidade de código que tem de escrever.
Leia mais acerca das bibliotecas cliente da nuvem e das bibliotecas cliente das APIs Google mais antigas em Bibliotecas cliente explicadas.
Instale a biblioteca cliente
Python
pip install --upgrade google-cloud-documentai-toolbox
Para mais informações, consulte o artigo Configurar um ambiente de desenvolvimento Python.
Configure a autenticação
Para autenticar chamadas para Google Cloud APIs, as bibliotecas cliente suportam Credenciais padrão da aplicação (ADC); as bibliotecas procuram credenciais num conjunto de localizações definidas e usam essas credenciais para autenticar pedidos para a API. Com o ADC, pode disponibilizar credenciais à sua aplicação numa variedade de ambientes, como desenvolvimento local ou produção, sem ter de modificar o código da aplicação.Para ambientes de produção, a forma como configura o ADC depende do serviço e do contexto. Para mais informações, consulte o artigo Configure as Credenciais padrão da aplicação.
Para um ambiente de desenvolvimento local, pode configurar o ADC com as credenciais associadas à sua Conta Google:
-
Install the Google Cloud CLI. After installation, initialize the Google Cloud CLI by running the following command:
gcloud initIf you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
É apresentado um ecrã de início de sessão. Depois de iniciar sessão, as suas credenciais são armazenadas no ficheiro de credenciais local usado pelo ADC.
Use a biblioteca cliente
A caixa de ferramentas da IA Documental é um SDK para Python que fornece funções de utilidade para gerir, manipular e extrair informações da resposta do documento.
Cria um objeto de documento "wrapped" a partir de uma resposta de documento processada de ficheiros JSON no
Cloud Storage, ficheiros JSON locais ou saída diretamente do método process_document().
Pode realizar as seguintes ações:
- Combine ficheiros JSON
Documentfragmentados do processamento em lote num único documento "envolvido". - Exporte fragmentos como um
Documentunificado. -
Receba o resultado
Documentde: - Aceder a texto de
Pages,Lines,Paragraphs,FormFieldseTablessem processar informações deLayout. - Pesquise um
Pagesque contenha uma string de destino ou que corresponda a uma expressão regular. - Pesquise
FormFieldspelo nome. - Pesquise
Entitiespor tipo. - Converta
Tablesnum Dataframe do Pandas ou num ficheiro CSV. - Inserir
EntitieseFormFieldsnuma tabela do BigQuery. - Dividir um ficheiro PDF com base no resultado de um processador de divisão/classificação.
- Extrair imagem
EntitiesdeDocumentcaixas delimitadoras. -
Converta
Documentspara e a partir de formatos usados frequentemente:- Cloud Vision API
AnnotateFileResponse - hOCR
- Formatos de processamento de documentos de terceiros
- Cloud Vision API
- Crie lotes de documentos para processamento a partir de uma pasta do Cloud Storage.
Exemplos de código
Os exemplos de código seguintes demonstram como usar o Document AI Toolbox.
Início rápido
Tabelas
BigQuery Export
PDF dividido
Extração de imagens
Conversão de visão
Conversão de hOCR
Conversão de terceiros
Documentos em lote
Unir fragmentos de documentos
Recursos adicionais
Python
A lista seguinte contém links para mais recursos relacionados com a biblioteca cliente para Python: