Questo documento è una guida ai concetti fondamentali dell'utilizzo di Document AI. Ti consigliamo di leggere questa pagina prima di procedere con qualsiasi altra documentazione o guida rapida.
Automatizzare i flussi di lavoro di elaborazione dei documenti
Le aziende di tutto il mondo si affidano molto ai documenti per archiviare e trasmettere informazioni. Spesso queste informazioni devono essere digitalizzate per diventare utili. Tuttavia, in genere questa operazione viene eseguita tramite processi manuali che richiedono molto tempo.
Ad esempio:
- Digitalizzazione di libri per e-reader.
- Elaborazione dei moduli di ammissione medica negli studi medici.
- Analisi di ricevute e fatture per la convalida dei report sulle spese.
- Autenticazione dell'identità in base alle carte d'identità.
- Estrazione delle informazioni sul reddito dai moduli fiscali per l'approvazione dei prestiti.
- Comprensione dei contratti per i termini chiave degli accordi commerciali.
Ognuno di questi flussi di lavoro prevede l'estrazione del testo non elaborato dai documenti e poi l'estrazione di testo specifico da quello che corrisponde ai dati necessari (i campi o le entità). Tuttavia, ogni tipo di documento ha una struttura e un layout diversi e il pattern dei campi varia a seconda del caso d'uso specifico.
Componenti di Document AI
Document AI è una piattaforma di elaborazione e comprensione dei documenti che prende i dati non strutturati dai documenti e li trasforma in dati strutturati (campi specifici, adatti a un database), rendendoli più facili da comprendere, analizzare e utilizzare.
Document AI è basato sui prodotti di Vertex AI con AI generativa per aiutarti a creare applicazioni di elaborazione dei documenti scalabili, end-to-end e basate sul cloud senza competenze specialistiche di machine learning.
Con Document AI puoi:
- Digitalizzare i documenti utilizzando l'OCR per ottenere testo, layout e vari componenti aggiuntivi come il rilevamento della qualità dell'immagine (per la leggibilità) e la correzione della distorsione (completamente automatica).
- Estrarre informazioni su testo e layout dai file di documenti e normalizzare le entità.
- Identificare le coppie chiave-valore (KVP) nei moduli strutturati e nelle tabelle regolari. Ad esempio:
Name: Jill Smithè una KVP. - Classificare i tipi di documenti per guidare i processi downstream come l'estrazione e l'archiviazione.
- Dividere e classificare i documenti per tipo. Ad esempio, un file PDF con più documenti reali.
- Preparare i set di dati da utilizzare per il perfezionamento e le valutazioni dei modelli utilizzando le funzionalità di etichettatura automatica, gestione dello schema e gestione dei set di dati, come la revisione dei documenti e delle previsioni.
- Integrarlo con prodotti come Cloud Storage, BigQuery e Ricerca agente per aiutarti ad archiviare, cercare, organizzare, gestire e analizzare documenti e metadati.
Questo diagramma illustra tutti i passaggi chiave dell'elaborazione dei documenti supportati da Document AI e come possono essere collegati tra loro.

Processore
Un processore di Document AI si trova tra il file del documento e un modello di machine learning che esegue azioni di elaborazione e comprensione dei documenti. Possono essere utilizzati per classificare, dividere, analizzare o analizzare un documento.
Ogni Google Cloud progetto deve creare le proprie istanze del processore.
I processori rientrano in una delle seguenti categorie:
- Digitalizzazione: OCR.
- Estrazione: estrattore personalizzato, analizzatore sintattico di moduli, analizzatore sintattico di layout e analizzatori sintattici preaddestrati.
- Classificazione: categoria di classificazione personalizzata e separatore personalizzato.
Per informazioni su tutti i tipi di processori disponibili per Document AI, consulta l'elenco completo dei processori e dei dettagli.
Quale processore devo utilizzare?
Per decidere quale tipo di processore utilizzare per un'applicazione specifica, ecco alcune linee guida generali:
| Categoria | Caso d'uso | Tipo di processore |
|---|---|---|
| Digitalizzazione | Estrai informazioni su testo e layout dai documenti. | Enterprise Document OCR |
| Analizza la qualità dell'immagine scansionata (leggibilità) di un documento. | Enterprise Document OCR con analisi della qualità dell'immagine attivata | |
| Estrai entità da un documento personalizzato che non soddisfa i criteri del processore personalizzato. | ||
| Estrazione | Estrai tabelle o KVP da un modulo strutturato in un documento. | Analizzatore di moduli |
| Estrai elementi come testo, tabelle ed elenchi in un documento e restituisci blocchi sensibili al contesto. | Analizzatore sintattico di layout | |
| Estrai entità da un documento personalizzato che soddisfa i criteri del processore personalizzato. | Crea un estrattore personalizzato | |
| Estrai entità da un tipo di documento specializzato. | Un processore preaddestrato (esegui l'uptraining per migliorare la qualità). | |
| Classificazione | Classifica i documenti. | Crea un classificatore personalizzato |
| Dividi i documenti. | Crea un separatore personalizzato |
Questo diagramma ti aiuta a determinare quale processore funziona meglio per ogni caso d'uso.

Utilizzare i processori di Document AI
Di seguito sono riportati i passaggi principali per utilizzare Document AI per iniziare a elaborare i documenti:
Scegli un processore adatto al tuo caso d'uso.
- Per informazioni complete su ogni processore, consulta l'elenco completo dei processori e dei dettagli.
Crea un processore utilizzando la Google Cloud console o l'API Document AI.
Document AI crea un endpoint di previsione in cui puoi inviare i documenti.
Per istruzioni dettagliate, consulta Creare un processore.
Addestra un processore con dati di addestramento e test da zero oppure esegui l'uptraining di una nuova versione del processore (preaddestrata) su una esistente.
- Per istruzioni dettagliate, consulta Addestrare il processore.
Invia i documenti per l'elaborazione.
Document AI elabora i documenti e restituisce uno o più
Documentoggetti, che contengono le informazioni strutturate estratte.Per istruzioni dettagliate, consulta Inviare una richiesta di elaborazione e Gestire la risposta di elaborazione.