Panoramica di Document AI

Questo documento è una guida ai concetti fondamentali dell'utilizzo di Document AI. Ti consigliamo di leggere questa pagina prima di procedere con qualsiasi altra documentazione o guida rapida.

Automatizzare i flussi di lavoro di elaborazione dei documenti

Le aziende di tutto il mondo si affidano molto ai documenti per archiviare e trasmettere informazioni. Spesso queste informazioni devono essere digitalizzate per diventare utili. Tuttavia, in genere questa operazione viene eseguita tramite processi manuali che richiedono molto tempo.

Ad esempio:

  • Digitalizzazione di libri per e-reader.
  • Elaborazione dei moduli di ammissione medica negli studi medici.
  • Analisi di ricevute e fatture per la convalida dei report sulle spese.
  • Autenticazione dell'identità in base alle carte d'identità.
  • Estrazione delle informazioni sul reddito dai moduli fiscali per l'approvazione dei prestiti.
  • Comprensione dei contratti per i termini chiave degli accordi commerciali.

Ognuno di questi flussi di lavoro prevede l'estrazione del testo non elaborato dai documenti e poi l'estrazione di testo specifico da quello che corrisponde ai dati necessari (i campi o le entità). Tuttavia, ogni tipo di documento ha una struttura e un layout diversi e il pattern dei campi varia a seconda del caso d'uso specifico.

Componenti di Document AI

Document AI è una piattaforma di elaborazione e comprensione dei documenti che prende i dati non strutturati dai documenti e li trasforma in dati strutturati (campi specifici, adatti a un database), rendendoli più facili da comprendere, analizzare e utilizzare.

Document AI è basato sui prodotti di Vertex AI con AI generativa per aiutarti a creare applicazioni di elaborazione dei documenti scalabili, end-to-end e basate sul cloud senza competenze specialistiche di machine learning.

Con Document AI puoi:

  • Digitalizzare i documenti utilizzando l'OCR per ottenere testo, layout e vari componenti aggiuntivi come il rilevamento della qualità dell'immagine (per la leggibilità) e la correzione della distorsione (completamente automatica).
  • Estrarre informazioni su testo e layout dai file di documenti e normalizzare le entità.
  • Identificare le coppie chiave-valore (KVP) nei moduli strutturati e nelle tabelle regolari. Ad esempio: Name: Jill Smith è una KVP.
  • Classificare i tipi di documenti per guidare i processi downstream come l'estrazione e l'archiviazione.
  • Dividere e classificare i documenti per tipo. Ad esempio, un file PDF con più documenti reali.
  • Preparare i set di dati da utilizzare per il perfezionamento e le valutazioni dei modelli utilizzando le funzionalità di etichettatura automatica, gestione dello schema e gestione dei set di dati, come la revisione dei documenti e delle previsioni.
  • Integrarlo con prodotti come Cloud Storage, BigQuery e Ricerca agente per aiutarti ad archiviare, cercare, organizzare, gestire e analizzare documenti e metadati.

Questo diagramma illustra tutti i passaggi chiave dell'elaborazione dei documenti supportati da Document AI e come possono essere collegati tra loro.

docai-overview-1

Processore

Un processore di Document AI si trova tra il file del documento e un modello di machine learning che esegue azioni di elaborazione e comprensione dei documenti. Possono essere utilizzati per classificare, dividere, analizzare o analizzare un documento.

Ogni Google Cloud progetto deve creare le proprie istanze del processore.

I processori rientrano in una delle seguenti categorie:

  • Digitalizzazione: OCR.
  • Estrazione: estrattore personalizzato, analizzatore sintattico di moduli, analizzatore sintattico di layout e analizzatori sintattici preaddestrati.
  • Classificazione: categoria di classificazione personalizzata e separatore personalizzato.

Per informazioni su tutti i tipi di processori disponibili per Document AI, consulta l'elenco completo dei processori e dei dettagli.

Quale processore devo utilizzare?

Per decidere quale tipo di processore utilizzare per un'applicazione specifica, ecco alcune linee guida generali:

Categoria Caso d'uso Tipo di processore
Digitalizzazione Estrai informazioni su testo e layout dai documenti. Enterprise Document OCR
Analizza la qualità dell'immagine scansionata (leggibilità) di un documento. Enterprise Document OCR con analisi della qualità dell'immagine attivata
Estrai entità da un documento personalizzato che non soddisfa i criteri del processore personalizzato.
Estrazione Estrai tabelle o KVP da un modulo strutturato in un documento. Analizzatore di moduli
Estrai elementi come testo, tabelle ed elenchi in un documento e restituisci blocchi sensibili al contesto. Analizzatore sintattico di layout
Estrai entità da un documento personalizzato che soddisfa i criteri del processore personalizzato. Crea un estrattore personalizzato
Estrai entità da un tipo di documento specializzato. Un processore preaddestrato (esegui l'uptraining per migliorare la qualità).
Classificazione Classifica i documenti. Crea un classificatore personalizzato
Dividi i documenti. Crea un separatore personalizzato

Questo diagramma ti aiuta a determinare quale processore funziona meglio per ogni caso d'uso.

docai-overview-2

Utilizzare i processori di Document AI

Di seguito sono riportati i passaggi principali per utilizzare Document AI per iniziare a elaborare i documenti:

  1. Scegli un processore adatto al tuo caso d'uso.

  2. Crea un processore utilizzando la Google Cloud console o l'API Document AI.

    • Document AI crea un endpoint di previsione in cui puoi inviare i documenti.

    • Per istruzioni dettagliate, consulta Creare un processore.

  3. Addestra un processore con dati di addestramento e test da zero oppure esegui l'uptraining di una nuova versione del processore (preaddestrata) su una esistente.

  4. Invia i documenti per l'elaborazione.