Cette page explique comment débuter avec les bibliothèques clientes Cloud pour l'API Document AI Toolbox. Les bibliothèques clientes facilitent l'accès aux APIGoogle Cloud à l'aide d'un langage compatible. Bien que vous puissiez utiliser directement les APIGoogle Cloud en envoyant des requêtes brutes au serveur, les bibliothèques clientes vous simplifient la tâche en réduisent considérablement la quantité de code à écrire.
Pour en savoir plus sur les bibliothèques clientes Cloud et les anciennes bibliothèques clientes pour les API Google, consultez Présentation des bibliothèques clientes.
Installer la bibliothèque cliente
Python
pip install --upgrade google-cloud-documentai-toolbox
Pour en savoir plus, consultez la page Configurer un environnement de développement Python.
Configurer l'authentification
Pour authentifier les appels aux API Google Cloud , les bibliothèques clientes utilisent le service Identifiants par défaut de l'application (ADC). Les bibliothèques recherchent des identifiants dans un ensemble d'emplacements définis et les utilisent pour authentifier les requêtes adressées à l'API. Grâce à ADC, vous pouvez mettre des identifiants à disposition de votre application dans divers environnements, tels que l'environnement de développement ou de production local, sans avoir à modifier le code de votre application.Pour les environnements de production, la façon de configurer ADC dépend du service et du contexte. Pour en savoir plus, consultez Configurer le service Identifiants par défaut de l'application.
Pour un environnement de développement local, vous pouvez configurer ADC avec les identifiants associés à votre compte Google :
-
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
-
Si vous utilisez un shell local, créez des identifiants d'authentification locaux pour votre compte utilisateur :
gcloud auth application-default login
Vous n'avez pas besoin de le faire si vous utilisez Cloud Shell.
Si une erreur d'authentification est renvoyée et que vous utilisez un fournisseur d'identité (IdP) externe, vérifiez que vous vous êtes connecté à la gcloud CLI avec votre identité fédérée.
Un écran de connexion s'affiche. Une fois que vous êtes connecté, vos identifiants sont stockés dans le fichier d'identifiants local utilisé par ADC.
Utiliser la bibliothèque cliente
Document AI Toolbox est un SDK pour Python qui fournit des fonctions utilitaires permettant de gérer, de manipuler et d'extraire des informations de la réponse du document.
Il crée un objet de document "encapsulé" à partir d'une réponse de document traité provenant de fichiers JSON dans Cloud Storage, de fichiers JSON locaux ou d'une sortie directement à partir de la méthode process_document().
Il peut effectuer les actions suivantes :
- Combiner les fichiers JSON
Documentfragmentés du traitement par lot en un seul document "encapsulé". - Exporter les partitions sous forme de
Documentunifié. -
Obtenez le résultat
Documentà partir de : - Accédez au texte de
Pages,Lines,Paragraphs,FormFieldsetTablessans gérer les informationsLayout. - Recherchez un
Pagescontenant une chaîne cible ou correspondant à une expression régulière. - Recherchez
FormFieldspar nom. - Recherchez
Entitiespar type. - Convertissez
Tablesen DataFrame Pandas ou en CSV. - Insérez
EntitiesetFormFieldsdans une table BigQuery. - Divisez un fichier PDF en fonction de la sortie d'un processeur Splitter/Classifier.
- Extrais l'image
Entitiesdes cadres de délimitation deDocument. -
Convertissez
Documentsvers et depuis les formats les plus courants :- API Cloud Vision
AnnotateFileResponse - hOCR
- Formats de traitement des documents tiers
- API Cloud Vision
- Créez des lots de documents à traiter à partir d'un dossier Cloud Storage.
Exemples de code
Les exemples de code suivants montrent comment utiliser Document AI Toolbox.
Guide de démarrage rapide
Tables
BigQuery Export
Fractionner un PDF
Extraction d'images
Conversion de la vision
Conversion hOCR
Conversion tierce
Traiter des lots de documents
Fusionner les fragments de document
Autres ressources
Python
La liste suivante contient des liens vers d'autres ressources liées à la bibliothèque cliente pour Python :