Questa pagina mostra come iniziare a utilizzare le librerie client di Cloud per l'API Document AI Toolbox. Le librerie client semplificano l'accesso alle APIGoogle Cloud da una lingua supportata. Sebbene tu possa utilizzare le APIGoogle Cloud effettuando direttamente delle richieste non elaborate al server, le librerie client forniscono semplificazioni che riducono notevolmente la quantità di codice da scrivere.
Scopri di più sulle librerie client di Cloud e sulle precedenti librerie client delle API di Google in Descrizione delle librerie client.
Installa la libreria client
Python
pip install --upgrade google-cloud-documentai-toolbox
Per ulteriori informazioni, consulta Configurazione di un ambiente di sviluppo Python.
Configura l'autenticazione
Per autenticare le chiamate alle API Google Cloud , le librerie client supportano il servizio Credenziali predefinite dell'applicazione (ADC). Le librerie cercano le credenziali in una serie di località definite e le utilizzano per autenticare le richieste all'API. Con le ADC, puoi rendere disponibili le credenziali per la tua applicazione in vari ambienti, ad esempio per lo sviluppo locale o la produzione, senza dover modificare il codice dell'applicazione.Per gli ambienti di produzione, la modalità di configurazione delle credenziali ADC dipende dal servizio e dal contesto. Per ulteriori informazioni, consulta Configura le credenziali predefinite dell'applicazione.
Per un ambiente di sviluppo locale, puoi configurare come ADC le credenziali associate al tuo Account Google:
-
Install the Google Cloud CLI. After installation, initialize the Google Cloud CLI by running the following command:
gcloud initIf you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
Viene visualizzata una schermata di accesso. Dopo aver eseguito l'accesso, le tue credenziali vengono archiviate nel file delle credenziali locali utilizzato da ADC.
Utilizza la libreria client
Document AI Toolbox è un SDK per Python che fornisce funzioni di utilità per gestire, manipolare ed estrarre informazioni dalla risposta del documento.
Crea un oggetto documento "wrapped" da una risposta del documento elaborata dai file JSON in
Cloud Storage, dai file JSON locali o dall'output direttamente dal metodo process_document().
Può eseguire le seguenti azioni:
- Combina i file JSON
Documentframmentati dell'elaborazione batch in un unico documento "wrapped". - Esporta gli shard come un unico
Document. -
Ottieni l'output
Documentda: - Accedi al testo da
Pages,Lines,Paragraphs,FormFieldseTablessenza gestire le informazioniLayout. - Cerca un
Pagescontenente una stringa di destinazione o corrispondente a un'espressione regolare. - Cerca
FormFieldsper nome. - Cerca
Entitiesper tipo. - Converti
Tablesin un DataFrame Pandas o in un file CSV. - Inserisci
EntitieseFormFieldsin una tabella BigQuery. - Dividi un file PDF in base all'output di un processore Splitter/Classifier.
- Estrai l'immagine
EntitiesdaDocumentriquadri di delimitazione. -
Converti
Documentsin e da formati di uso comune:- API Cloud Vision
AnnotateFileResponse - hOCR
- Formati di elaborazione dei documenti di terze parti
- API Cloud Vision
- Crea batch di documenti da elaborare da una cartella Cloud Storage.
Esempi di codice
I seguenti esempi di codice mostrano come utilizzare Document AI Toolbox.
Guida rapida
Tabelle
Esportazione in BigQuery
Divisione del PDF
Estrazione immagini
Conversione della visione
Conversione hOCR
Conversione di terze parti
Batch di documenti
Unire gli shard del documento
Risorse aggiuntive
Python
Il seguente elenco contiene link ad altre risorse relative alla libreria client per Python: