Présentation de Document AI

Ce document est un guide des concepts fondamentaux de l'utilisation de Document AI. Nous vous conseillons d'en prendre connaissance avant de passer à d'autres documents ou aux guides de démarrage rapide.

Automatiser les workflows de traitement de documents

Les entreprises du monde entier s'appuient fortement sur les documents pour stocker et transmettre des informations. Ces informations doivent souvent être numérisées pour devenir utiles. Toutefois, cela se fait généralement par le biais de processus manuels qui prennent beaucoup de temps.

Exemple :

  • Numérisation de livres pour les liseuses
  • Traitement des formulaires d'admission médicale dans les cabinets médicaux
  • Analyse des reçus et des factures pour la validation des notes de frais
  • Authentification de l'identité à l'aide de cartes d'identité
  • Extraction des informations sur les revenus à partir des formulaires fiscaux pour l'approbation des prêts
  • Compréhension des contrats pour les conditions clés des accords commerciaux

Chacun de ces workflows implique d'obtenir le texte brut des documents, puis d'extraire le texte spécifique correspondant aux données nécessaires (les champs ou les entités). Toutefois, chaque type de document a une structure et une mise en page différentes, et le modèle de champs varie en fonction du cas d'utilisation spécifique.

Composants de Document AI

Document AI est une plate-forme de traitement et de compréhension de documents qui convertit les données non structurées des documents en données structurées (champs spécifiques adaptés à une base de données) afin d'en faciliter la compréhension, l'analyse et l'utilisation.

Document AI est basé sur des produits de Vertex AI avec une IA générative pour vous aider à créer des applications de traitement de documents évolutives, de bout en bout et basées sur le cloud sans expertise spécialisée en machine learning.

Avec Document AI, vous pouvez :

  • Numériser des documents à l'aide de la reconnaissance optique des caractères pour obtenir du texte, une mise en page et divers modules complémentaires tels que la détection de la qualité d'image (pour la lisibilité) et la correction de la distorsion (entièrement automatique).
  • Extraire des informations de texte et de mise en page à partir de fichiers de documents et normaliser les entités.
  • Identifier les paires clé-valeur dans les formulaires structurés et les tableaux standards. Par exemple, Name: Jill Smith est une paire clé-valeur.
  • Classer les types de documents pour piloter les processus en aval, tels que l'extraction et le stockage.
  • Diviser et classer les documents par type. Par exemple, un fichier PDF contenant plusieurs documents réels.
  • Préparer des ensembles de données à utiliser pour le réglage précis et les évaluations de modèles à l'aide de fonctionnalités d'étiquetage automatique, de gestion des schémas et de gestion des ensembles de données, telles que l'examen des documents et des prédictions.
  • L'intégrer à des produits tels que Cloud Storage, BigQuery et Agent Search pour vous aider à stocker, rechercher, organiser, gérer et analyser des documents et des métadonnées.

Ce schéma illustre toutes les étapes clés du traitement des documents compatibles avec Document AI et comment elles peuvent être connectées les unes aux autres.

docai-overview-1

Processeur

Un processeur Document AI se situe entre le fichier de document et un modèle de machine learning qui effectue des actions de traitement et de compréhension des documents. Il peut être utilisé pour classer, diviser, analyser ou analyser un document.

Chaque Google Cloud projet doit créer ses propres instances de processeur.

Les processeurs appartiennent à l'une des catégories suivantes :

  • Numériser : reconnaissance optique des caractères.
  • Extraire : extracteur personnalisé, analyseur de formulaires, analyseur de mise en page et analyseurs préentraînés.
  • Classer : classificateur personnalisé et séparateur personnalisé.

Pour en savoir plus sur tous les types de processeurs disponibles pour Document AI, consultez la liste complète des processeurs et des détails.

Quel processeur dois-je utiliser ?

Pour déterminer le type de processeur à utiliser pour une application spécifique, voici quelques consignes générales :

Catégorie Cas d'utilisation Type de processeur
Numériser Extraire des informations de texte et de mise en page à partir de documents. Enterprise Document OCR
Analyser la qualité de l'image numérisée (lisibilité) d'un document. Enterprise Document OCR avec l'analyse de la qualité d'image activée
Extraire des entités d'un document personnalisé qui ne répond pas aux critères du processeur personnalisé.
Extraire Extraire des tableaux ou des paires clé-valeur d'un formulaire structuré dans un document. Analyseur de formulaires
Extraire des éléments tels que du texte, des tableaux et des listes dans un document, et renvoyer des blocs sensibles au contexte. Analyseur de mise en page
Extraire des entités d'un document personnalisé qui répond aux critères du processeur personnalisé. Créer un extracteur personnalisé
Extraire des entités d'un type de document spécialisé. Processeur préentraîné (entraînez-le pour améliorer la qualité)
Classer Classer des documents. Créer un classificateur personnalisé
Diviser des documents. Créer un séparateur personnalisé

Ce schéma vous aide à déterminer le processeur le mieux adapté à chaque cas d'utilisation.

docai-overview-2

Utiliser les processeurs Document AI

Voici les principales étapes à suivre pour utiliser Document AI afin de commencer à traiter des documents :

  1. Choisissez un processeur adapté à votre cas d'utilisation.

  2. Créez un processeur à l'aide de la Google Cloud console ou de l'API Document AI.

    • Document AI crée un point de terminaison de prédiction où vous pouvez envoyer vos documents.

    • Pour obtenir des instructions détaillées, consultez Créer un processeur.

  3. Entraînez un processeur avec des données d'entraînement et de test à partir de zéro, ou entraînez une nouvelle version de processeur (préentraînée) en plus d'une version existante.

  4. Envoyez vos documents pour traitement.