Analizzatore sintattico di moduli

L'analizzatore sintattico di moduli estrae coppie chiave-valore, tabelle, segni di selezione (come le caselle di controllo), campi generici e testo per aumentare e automatizzare l'elaborazione dei documenti.

L'analizzatore sintattico di moduli può essere considerato rispetto agli altri analizzatori quando il caso d'uso prevede:

  • Gestione di moduli strutturati: è in grado di estrarre coppie chiave-valore da moduli ben definiti che assomigliano a moduli convenzionali con spazi vuoti etichettati da compilare, ad esempio name: __. Il modello preaddestrato dell'analizzatore sintattico di moduli offre un'elevata precisione per i campi comuni come nomi, date e indirizzi.
  • È necessaria l'estrazione flessibile delle tabelle: l'analizzatore sintattico di moduli estrae da tabelle semplici (senza celle che si estendono su righe o colonne) che assomigliano a tabelle. Non è necessario (né possibile) alcun addestramento. Per l'estrazione di tabelle addestrate, è possibile utilizzare l'estrattore personalizzato con un campo principale contenente campi secondari di colonne (celle).
  • È necessaria efficienza: evita di creare e gestire analizzatori sintattici di estrazione, soprattutto per attività di estrazione di moduli di grandi dimensioni e vari.

Funzionalità di estrazione dei dati

Le funzionalità dell'analizzatore sintattico di moduli comprendono:

  • Coppie chiave-valore: si tratta di insiemi di due elementi all'interno di un documento: un'etichetta o una chiave e i dati corrispondenti (un valore). Puoi utilizzare direttamente le coppie chiave-valore (se le chiavi sono coerenti) o creare una logica personalizzata per risolvere le chiavi variabili in informazioni strutturate coerenti.

  • Entità generiche: analizza 11 campi diversi dai documenti immediatamente. Questi includono:

    • email
    • phone
    • url
    • date_time
    • address
    • person
    • organization
    • quantity
    • price
    • id
    • page_number
  • Testo e layout: utilizza il nostro motore OCR più recente per estrarre il testo e le informazioni sul layout. Sono inclusi il testo incorporato da PDF digitali (solo v2.1) o il testo dalle immagini.

  • Tabelle: rileva ed estrai le tabelle da immagini e PDF.

  • Caselle di controllo: un rilevatore di segni di selezione di alta qualità, che estrae le caselle di controllo dalle immagini e dall'output PDF come coppie chiave-valore, utilizzando il testo più vicino alla casella di controllo, con un valueType che indica se è compilata o meno.

Lingue e regioni

  • L'analizzatore sintattico di moduli 2.0 supporta oltre 200 lingue. Scopri di più.
  • Forniamo il supporto delle funzionalità in otto regioni. Scopri di più.

Versioni modello

Le seguenti versioni del processore sono compatibili con questa funzionalità. Per saperne di più, consulta Gestione delle versioni del processore.

Limitazioni

  • Le compressioni JPEG precedenti per TIFF non sono supportate. Tipo di incapsulamento JPEG definito dalla specifica TIFF versione 6.0.

  • Il modello della casella di controllo non supporta l'analisi dei pulsanti di opzione. Alcune caselle di controllo rilevate potrebbero non avere chiavi corrispondenti.

  • Il modello non analizza in modo affidabile una coppia chiave-valore con un valore non compilato, ad esempio un modulo vuoto.

  • L'analisi delle coppie chiave-valore sui documenti in alcune lingue potrebbe avere una qualità inferiore rispetto alle lingue latine.

Elabora i documenti con l'analizzatore sintattico di moduli

Questa guida rapida presenta la funzionalità dell'analizzatore sintattico di moduli in Document AI. In questa guida rapida, utilizzi la Google Cloud console per configurare il Google Cloud progetto e l' autorizzazione, creare un analizzatore sintattico di moduli e inviare una richiesta affinché il Document AI elabori un modulo PDF.

Scopri come:

  1. Abilitare Document AI in un progetto Google Cloud .

  2. Creare un processore dell'analizzatore sintattico di moduli che possa identificare ed estrarre testo, coppie chiave-valore, tabelle ed entità generiche da molti tipi di documenti.

  3. Utilizzare il processore per annotare un documento di esempio.


Per seguire le indicazioni dettagliate per questa attività direttamente nella Google Cloud console, fai clic su Procedura guidata:

Procedura guidata


  1. Accedi al tuo Google Cloud account. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Document AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Document AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

Crea un processore dell'analizzatore sintattico di moduli

Utilizza la Google Cloud console per creare un processore dell'analizzatore sintattico di moduli. Per ulteriori informazioni, scopri come creare e gestire i processori.

  1. Nel Google Cloud menu di navigazione della console, fai clic su Document AI e seleziona Galleria processori.

    Galleria processori

  2. Nella Galleria processori, cerca Analizzatore sintattico di moduli e seleziona Crea.

    Opzione parser di moduli nell'interfaccia utente

  3. Nella finestra laterale, inserisci un nome processore, ad esempio quickstart-form-processor.

  4. Seleziona la regione più vicina a te.

  5. Fai clic su pulsante Crea.

Viene visualizzata la pagina Dettagli processore per il nuovo processore dell'analizzatore sintattico di moduli.

Testa il processore

Puoi inviare richieste di annotazione al processore dopo averlo creato.

  1. Scarica il documento di esempio

    È un file PDF contenente un modulo di ammissione medica di esempio scritto a mano. Questo documento è archiviato in un bucket Cloud Storage accessibile pubblicamente.

  2. Fai clic sul pulsante Carica documento di test e seleziona il documento appena scaricato.

  3. Ora dovresti trovarti nella pagina Analisi analizzatore sintattico di moduli. Puoi visualizzare il testo rilevato dall'OCR, le coppie chiave/valore, le tabelle e le entità generiche estratte dal documento.

    coppie chiave/valore del modulo di esempio nell'interfaccia utente

Libera spazio

Per evitare addebiti non necessari, utilizzaper eliminare il processore e il progetto se non ti servono. Google Cloud Google Cloud console

Passaggi successivi