Ce document est un guide des concepts fondamentaux de l'utilisation de Document AI. Nous vous conseillons d'en prendre connaissance avant de passer à d'autres documents ou aux guides de démarrage rapide.
Automatiser les workflows de traitement de documents
Les entreprises du monde entier s'appuient fortement sur les documents pour stocker et transmettre des informations. Ces informations doivent souvent être numérisées pour devenir utiles. Toutefois, cela se fait généralement par le biais de processus manuels qui prennent beaucoup de temps.
Exemple :
- Numérisation de livres pour les liseuses
- Traitement des formulaires d'admission médicale dans les cabinets médicaux
- Analyse des reçus et des factures pour la validation des notes de frais
- Authentification de l'identité à l'aide de cartes d'identité
- Extraction des informations sur les revenus à partir des formulaires fiscaux pour l'approbation des prêts
- Compréhension des contrats pour les conditions clés des accords commerciaux
Chacun de ces workflows implique d'obtenir le texte brut des documents, puis d'extraire le texte spécifique correspondant aux données nécessaires (les champs ou les entités). Toutefois, chaque type de document a une structure et une mise en page différentes, et le modèle de champs varie en fonction du cas d'utilisation spécifique.
Composants de Document AI
Document AI est une plate-forme de traitement et de compréhension de documents qui convertit les données non structurées des documents en données structurées (champs spécifiques adaptés à une base de données) afin d'en faciliter la compréhension, l'analyse et l'utilisation.
Document AI est basé sur des produits de Vertex AI avec une IA générative pour vous aider à créer des applications de traitement de documents évolutives, de bout en bout et basées sur le cloud sans expertise spécialisée en machine learning.
Avec Document AI, vous pouvez :
- Numériser des documents à l'aide de la reconnaissance optique des caractères pour obtenir du texte, une mise en page et divers modules complémentaires tels que la détection de la qualité d'image (pour la lisibilité) et la correction de la distorsion (entièrement automatique).
- Extraire des informations de texte et de mise en page à partir de fichiers de documents et normaliser les entités.
- Identifier les paires clé-valeur dans les formulaires structurés et les tableaux standards. Par exemple,
Name: Jill Smithest une paire clé-valeur. - Classer les types de documents pour piloter les processus en aval, tels que l'extraction et le stockage.
- Diviser et classer les documents par type. Par exemple, un fichier PDF contenant plusieurs documents réels.
- Préparer des ensembles de données à utiliser pour le réglage précis et les évaluations de modèles à l'aide de fonctionnalités d'étiquetage automatique, de gestion des schémas et de gestion des ensembles de données, telles que l'examen des documents et des prédictions.
- L'intégrer à des produits tels que Cloud Storage, BigQuery et Agent Search pour vous aider à stocker, rechercher, organiser, gérer et analyser des documents et des métadonnées.
Ce schéma illustre toutes les étapes clés du traitement des documents compatibles avec Document AI et comment elles peuvent être connectées les unes aux autres.

Processeur
Un processeur Document AI se situe entre le fichier de document et un modèle de machine learning qui effectue des actions de traitement et de compréhension des documents. Il peut être utilisé pour classer, diviser, analyser ou analyser un document.
Chaque Google Cloud projet doit créer ses propres instances de processeur.
Les processeurs appartiennent à l'une des catégories suivantes :
- Numériser : reconnaissance optique des caractères.
- Extraire : extracteur personnalisé, analyseur de formulaires, analyseur de mise en page et analyseurs préentraînés.
- Classer : classificateur personnalisé et séparateur personnalisé.
Pour en savoir plus sur tous les types de processeurs disponibles pour Document AI, consultez la liste complète des processeurs et des détails.
Quel processeur dois-je utiliser ?
Pour déterminer le type de processeur à utiliser pour une application spécifique, voici quelques consignes générales :
| Catégorie | Cas d'utilisation | Type de processeur |
|---|---|---|
| Numériser | Extraire des informations de texte et de mise en page à partir de documents. | Enterprise Document OCR |
| Analyser la qualité de l'image numérisée (lisibilité) d'un document. | Enterprise Document OCR avec l'analyse de la qualité d'image activée | |
| Extraire des entités d'un document personnalisé qui ne répond pas aux critères du processeur personnalisé. | ||
| Extraire | Extraire des tableaux ou des paires clé-valeur d'un formulaire structuré dans un document. | Analyseur de formulaires |
| Extraire des éléments tels que du texte, des tableaux et des listes dans un document, et renvoyer des blocs sensibles au contexte. | Analyseur de mise en page | |
| Extraire des entités d'un document personnalisé qui répond aux critères du processeur personnalisé. | Créer un extracteur personnalisé | |
| Extraire des entités d'un type de document spécialisé. | Processeur préentraîné (entraînez-le pour améliorer la qualité) | |
| Classer | Classer des documents. | Créer un classificateur personnalisé |
| Diviser des documents. | Créer un séparateur personnalisé |
Ce schéma vous aide à déterminer le processeur le mieux adapté à chaque cas d'utilisation.

Utiliser les processeurs Document AI
Voici les principales étapes à suivre pour utiliser Document AI afin de commencer à traiter des documents :
Choisissez un processeur adapté à votre cas d'utilisation.
- Pour obtenir des informations complètes sur chaque processeur, consultez la liste complète des processeurs et des détails.
Créez un processeur à l'aide de la Google Cloud console ou de l'API Document AI.
Document AI crée un point de terminaison de prédiction où vous pouvez envoyer vos documents.
Pour obtenir des instructions détaillées, consultez Créer un processeur.
Entraînez un processeur avec des données d'entraînement et de test à partir de zéro, ou entraînez une nouvelle version de processeur (préentraînée) en plus d'une version existante.
- Pour obtenir des instructions détaillées, consultez Entraîner un processeur.
Envoyez vos documents pour traitement.
Document AI traite les documents et renvoie un ou plusieurs
Documentobjets, qui contiennent les informations structurées extraites.Pour obtenir des instructions détaillées, consultez Envoyer une requête de traitement et Gérer la réponse de traitement.