Détection des signatures et des champs dérivés
La fonctionnalité de champs dérivés en prévisualisation publique permet aux clients de Document AI de configurer un champ à renseigner par inférence ou génération intelligente en fonction du contexte du document, plutôt que par extraction directe de texte.
Cette version ajoute également une autre fonctionnalité permettant de détecter la présence de signatures dans les documents. Vous pouvez utiliser le nouveau type d'entité signature pour spécifier un schéma pour ces entités. Les entités de signature sont dérivées à l'aide d'indices visuels du document.
Champs dérivés dans l'extracteur personnalisé
L'extracteur personnalisé est compatible avec les champs dérivés dans les modèles suivants :
pretrained-foundation-model-v1.4-2025-02-05en disponibilité générale (GA)pretrained-foundation-model-v1.5-2025-05-05en prévisualisationpretrained-foundation-model-v1.5-pro-2025-06-20en prévisualisation
Vous pouvez activer ces fonctionnalités dans l'interface utilisateur de la console lorsque vous créez ou modifiez des libellés dans le schéma de votre document.
Les champs dérivés sont une fonctionnalité puissante qui vous permet d'extraire des informations qui ne sont pas explicitement écrites dans un document. Vous pouvez ainsi configurer un champ à renseigner par inférence ou génération intelligente en fonction du contexte global du document. Cette fonctionnalité va au-delà de l'extraction de texte rudimentaire et est compatible avec des cas d'utilisation avancés, tels que :
- Déduire le pays à partir d'une adresse.
- Compter le nombre total d'éléments dans un tableau.
- Détecter si une carte d'identité est une "Real ID".
Exemple de création de schéma
Voici un exemple de création d'un schéma pour les champs dérivés pour de tels cas d'utilisation et le résultat attendu, à l'aide d'un permis de conduire américain.
Sélectionnez la méthode
Derivedlorsque vous créez un élément de schéma.
Ajoutez des libellés descriptifs pour améliorer les performances.

Les champs dérivés tels que les signatures ne nécessitent pas de définir des cadres de délimitation lors de l'étiquetage des documents. Pour Value (Valeur), sélectionnez Detected (Détecté).

Pour les champs dérivés autres que les signatures, vous pouvez saisir n'importe quelle Value (Valeur) lors de l'étiquetage pour définir les sorties possibles.

Le résultat attendu sera semblable à ceci, avec la présence d'une signature renvoyée sous la forme "Detected" (Détecté) ou "", et les champs dérivés renvoyés sous forme de texte, comme le demande la description du libellé.

Présentation de l'extraction par rapport à la dérivation
Lorsque vous définissez une entité dans le schéma de votre processeur, vous pouvez choisir une méthode pour renseigner sa valeur.
Extract (Extraire) : il s'agit de la méthode par défaut. Elle fonctionne lorsque la valeur de l'entité doit être extraite directement du texte du document. Le système identifie le texte et renseigne des champs tels que
textAnchoretpageAnchorpour indiquer son emplacement.Derived (Dérivé) : cette méthode est utilisée lorsque la valeur de l'entité doit être déduite du contenu du document. Étant donné que la valeur n'est pas directement présente dans le texte, les champs
textAnchoretpageAnchorne sont pas renseignés.
Exemple d'utilisation : trouver un code de devise
Imaginez que vous devez identifier le code de devise (par exemple, USD, CAD, EUR) pour les transactions dans vos documents.
Quand utiliser
Extract: si les documents contiennent systématiquement des symboles ou des codes de devise non ambigus tels que "USD" ou "€", utilisez la méthodeExtractpour trouver et extraire ce texte exact.Quand utiliser
Derived: si un document utilise un symbole ambigu tel que "$" (qui peut faire référence à USD, CAD, AUD, etc.) ou ne comporte aucun symbole, utilisez la méthodeDerived. Le modèle analyse le contexte du document, tel qu'une adresse de facturation ou l'emplacement d'une entreprise, pour déduire le code de devise ISO 4217 correct.
Exemple d'utilisation : instructions de normalisation personnalisées
Imaginez que vous devez extraire des informations du document dans un format différent du reste du document. La plupart des cas d'utilisation devraient déjà être gérés par la logique de normalisation. Pour les cas extrêmes qui ne sont pas couverts, ces entités peuvent être renvoyées dans un format de sortie personnalisé que vous définissez à l'aide de champs dérivés. Par exemple, vous pouvez supprimer les tirets des nombres à l'aide de l'invite : Return the number without all non-numeric characters (Renvoyer le nombre sans tous les caractères non numériques).

De même, la date de la facture peut être normalisée à l'aide d'un champ dérivé avec la description : Return the invoice date in yyyy-mm-dd (ISO 8601) format (Renvoyer la date de la facture au format aaaa-mm-jj (ISO 8601)). Le format de date de la facture sera au format de date local. Utilisez le pays d'origine de la facture pour dériver le format de date local.
Bonnes pratiques de configuration
Pour obtenir les meilleurs résultats avec les champs dérivés, nous vous recommandons vivement d'écrire une description claire et instructive pour la propriété dans votre schéma
lors de l'étiquetage. Cela permet de guider le modèle dans sa tâche de dérivation.
Dans l'exemple de code de devise, vous pouvez créer un champ nommé currency_code et fournir la description suivante : "Find the ISO 4217 currency code of the amount values in the document, using contextual signals present in the document, like currency symbols and addresses." (Rechercher le code de devise ISO 4217 des valeurs de montant dans le document, à l'aide de signaux contextuels présents dans le document, tels que les symboles de devise et les adresses.)
Limites
Les champs dérivés sont générés par page. Cela signifie que les cas d'utilisation nécessitant des informations provenant de plusieurs pages ne sont pas entièrement compatibles. Par exemple, si vous configurez un champ dérivé pour résumer un document, il génère un résumé distinct pour chaque page individuelle plutôt qu'un résumé cohérent pour l'ensemble du document. Cette limitation s'applique à tous les champs dont la valeur doit être dérivée à l'aide d'informations inter-pages.
Détection des signatures dans l'extracteur personnalisé
L'extracteur personnalisé de Document AI est compatible avec la détection des signatures dans les modèles d'extracteur personnalisé pretrained-foundation-model-v1.4-2025-02-05 et pretrained-foundation-model-v1.5-2025-05-05. Vous pouvez activer cette fonctionnalité dans l'interface utilisateur de la console lorsque vous créez ou modifiez des libellés dans le schéma de votre document.
La détection des signatures est une fonctionnalité qui vous permet de déterminer si une signature est présente dans vos documents. Cette fonctionnalité vérifie l'existence d'une signature en analysant des indices visuels, plutôt qu'en extrayant du texte.
Fonctionnement de la détection des signatures
Pour activer cette fonctionnalité, un type de données signature est disponible lors de la définition du schéma de votre processeur. Le comportement du processeur dépend de la détection ou non d'une signature dans le document.
Si une signature est trouvée, l'extracteur renvoie une entité de signature dans sa réponse.
Pour un champ nommé has_signed, l'objet de réponse présente la structure suivante :
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
Si aucune signature n'est trouvée, l'entité n'est pas renvoyée dans la réponse du processeur.
Configurer et définir les exigences clés
Pour configurer la détection des signatures :
- Définissez le schéma : dans le schéma de votre processeur, ajoutez une nouvelle entité pour la signature que vous souhaitez détecter.
- Définissez le type de données : sélectionnez "Signature" comme type de données pour cette nouvelle entité.
- Définissez la méthode sur "Dérivé" : les entités avec le type de données
signaturene peuvent utiliser que la méthodeDerived. Étant donné que le modèle déduit visuellement la présence de la signature, il n'extrait pas de valeur textuelle. Par conséquent, les champs tels quetextAnchoretpageAnchorne sont pas renseignés pour les entités de signature.
Exemple d'utilisation
Imaginez que vous traitez des contrats et que vous devez vérifier qu'ils ont été signés.
Vous pouvez créer un champ de schéma nommé is_contract_signed et définir son type de données sur signature. Lorsque vous traitez un contrat signé, la réponse inclut une entité is_contract_signed, confirmant la présence de la signature. Si aucune signature n'est présente, cette entité est absente de la réponse. Cela vous permet de signaler rapidement les documents non signés pour examen.
Étape suivante
Découvrez comment mettre à niveau un processeur spécialisé.