Campo derivato e rilevamento della firma
La funzionalità dei campi derivati in anteprima pubblica consente ai clienti di Document AI di configurare un campo da compilare tramite inferenza o generazione intelligente in base al contesto del documento, anziché tramite l'estrazione diretta del testo.
Questa release aggiunge anche un'altra funzionalità per rilevare la presenza di firme nei documenti. Puoi utilizzare il nuovo tipo di entità signature per specificare uno schema per queste entità. Le entità della firma vengono derivate utilizzando indizi visivi dal documento.
Campi derivati nell'estrattore personalizzato
L'estrattore personalizzato supporta i campi derivati nei seguenti modelli:
pretrained-foundation-model-v1.4-2025-02-05come disponibilità generale (GA)pretrained-foundation-model-v1.5-2025-05-05come anteprimapretrained-foundation-model-v1.5-pro-2025-06-20come anteprima
Puoi attivare queste funzionalità nell'interfaccia utente della console quando crei o modifichi le etichette nello schema del documento.
Campi derivati è una funzionalità potente che ti consente di estrarre informazioni non scritte esplicitamente in un documento. In questo modo puoi configurare un campo da compilare tramite inferenza o generazione intelligente in base al contesto generale del documento. Questa funzionalità va oltre l'estrazione di testo rudimentale e supporta casi d'uso avanzati, ad esempio:
- Dedurre il paese da un indirizzo.
- Contare il numero totale di elementi in una tabella.
- Rilevare se una carta di identità è una "Real ID".
Esempio di creazione dello schema
Ecco un esempio di creazione di uno schema per i campi derivati per questi casi d'uso e l'output previsto, utilizzando una patente di guida statunitense.
Seleziona il metodo
Derivedquando crei un elemento dello schema.
Aggiungi etichette descrittive per migliorare il rendimento.

I campi derivati, come le firme, non richiedono l'impostazione di riquadri di delimitazione durante l'etichettatura dei documenti. In Valore, seleziona Rilevato.

Per i campi derivati diversi dalle firme, puoi inserire qualsiasi Valore come parte dell'etichettatura per definire gli output possibili.

L'output previsto sarà simile a questo, con la presenza di una firma restituita come "Rilevata" o "", e i campi derivati restituiti come testo come richiesto dalla descrizione dell'etichetta.

Panoramica di estrazione e derivazione
Quando definisci un'entità nello schema del processore, puoi scegliere un metodo per compilare il relativo valore.
Estrai: questo è il metodo predefinito. Funziona quando il valore dell'entità deve essere estratto direttamente dal testo del documento. Il sistema identifica il testo e compila campi come
textAnchorepageAnchorper mostrarne la posizione.Derivato: questo metodo viene utilizzato quando il valore dell'entità deve essere dedotto dal contenuto del documento. Poiché il valore non è presente direttamente nel testo, i campi
textAnchorepageAnchornon vengono compilati.
Esempio di caso d'uso: trovare un codice valuta
Supponiamo che tu debba identificare il codice valuta (ad esempio USD, CAD, EUR) per le transazioni nei tuoi documenti.
Quando utilizzare
Extract: se i documenti contengono costantemente simboli o codici di valuta non ambigui come "USD" o "€", utilizza il metodoExtractper trovare ed estrarre il testo esatto.Quando utilizzare
Derived: se un documento utilizza un simbolo ambiguo come "$" (che potrebbe fare riferimento a USD, CAD, AUD e così via) o non ha alcun simbolo, utilizza ilDerivedmetodo. Il modello analizza il contesto del documento, ad esempio un indirizzo di fatturazione o la sede dell'azienda, per dedurre il codice valuta ISO 4217 corretto.
Esempio di caso d'uso: istruzioni di normalizzazione personalizzate
Supponiamo che tu debba estrarre informazioni dal documento in un formato diverso dal resto del documento. La maggior parte dei casi d'uso dovrebbe essere già gestita dalla logica di normalizzazione. Per i casi limite non coperti, queste entità possono essere restituite in un formato di output personalizzato definito utilizzando i campi derivati. Ad esempio, puoi rimuovere i trattini dai numeri utilizzando il prompt: Restituisci il numero senza tutti i caratteri non numerici.

Allo stesso modo, la data della fattura può essere normalizzata utilizzando un campo derivato con la descrizione: Restituisci la data della fattura nel formato gg-mm-aaaa (ISO 8601). Il formato della data nella fattura sarà nel formato della data locale. Utilizza il paese di origine della fattura per derivare il formato della data locale.
Best practice per la configurazione
Per ottenere risultati ottimali con i campi derivati, ti consigliamo vivamente di
scrivere una description chiara e didattica per la proprietà nello schema
durante l'etichettatura. In questo modo il modello viene guidato nell'attività di derivazione.
Nell'esempio del codice valuta, puoi creare un campo con il nome currency_code e fornire la seguente descrizione: "Trova il codice valuta ISO 4217 dei valori degli importi nel documento, utilizzando segnali contestuali presenti nel documento, come simboli di valuta e indirizzi".
Limitazioni
I campi derivati vengono generati per pagina. Ciò significa che i casi d'uso che richiedono informazioni da più pagine non sono completamente supportati. Ad esempio, se configuri un campo derivato per riepilogare un documento, viene generato un riepilogo separato per ogni singola pagina anziché un riepilogo coeso per l'intero documento. Questa limitazione si applica a qualsiasi campo in cui il valore deve essere derivato utilizzando informazioni tra le pagine.
Rilevamento della firma nell'estrattore personalizzato
L'estrattore personalizzato di Document AI supporta il rilevamento della firma nei modelli di estrattore personalizzato pretrained-foundation-model-v1.4-2025-02-05 e pretrained-foundation-model-v1.5-2025-05-05. Puoi attivare questa funzionalità nell'interfaccia utente della console quando crei o modifichi le etichette nello schema del documento.
Il rilevamento della firma è una funzionalità che ti consente di determinare se è presente una firma nei tuoi documenti. Questa funzionalità verifica l'esistenza di una firma analizzando gli indizi visivi, anziché estraendo il testo.
Come funziona il rilevamento della firma
Per attivare questa funzionalità, è disponibile un tipo di dati signature quando definisci lo schema del processore. Il comportamento del processore dipende dal fatto che venga rilevata o meno una firma nel documento.
Se viene trovata una firma, l'estrattore restituisce un'entità della firma nella risposta.
Per un campo denominato has_signed, l'oggetto risposta ha la seguente struttura:
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
Se non viene trovata una firma, l'entità non viene restituita nella risposta del processore.
Configurare e impostare i requisiti chiave
Per configurare il rilevamento della firma:
- Definisci lo schema: nello schema del processore, aggiungi una nuova entità per la firma che vuoi rilevare.
- Imposta il tipo di dati: seleziona Firma come tipo di dati per questa nuova entità.
- Imposta il metodo su derivato: le entità con il tipo di dati
signaturepossono utilizzare solo il metodoDerived. Poiché il modello deduce visivamente la presenza della firma, non estrae un valore di testo. Pertanto, i campi cometextAnchorepageAnchornon vengono compilati per le entità della firma.
Esempio di caso d'uso
Supponiamo che tu stia elaborando contratti e debba verificare che siano stati firmati.
Puoi creare un campo dello schema denominato is_contract_signed e impostare il relativo tipo di dati su signature. Quando elabori un contratto firmato, la risposta include un'entità is_contract_signed, che conferma la presenza della firma. Se non è presente alcuna firma, questa entità non è presente nella risposta. In questo modo puoi contrassegnare rapidamente i documenti non firmati per la revisione.
Passaggi successivi
Scopri di più sull'upgrade di un processore specializzato.