Abgeleitetes Feld und Signaturerkennung
Mit der Funktion für abgeleitete Felder in der öffentlichen Vorschau können Document AI-Kunden ein Feld so konfigurieren, dass es durch intelligente Inferenz oder Generierung basierend auf dem Dokumentkontext und nicht durch direkte Textextraktion ausgefüllt wird.
In dieser Version wird auch eine weitere Funktion zum Erkennen von Signaturen in Dokumenten hinzugefügt. Mit dem neuen Entitätstyp signature können Sie ein Schema für solche Entitäten angeben. Die Signatur-Entitäten werden anhand visueller Hinweise im Dokument abgeleitet.
Abgeleitete Felder im benutzerdefinierten Extraktor
Benutzerdefinierte Extraktoren unterstützen abgeleitete Felder in den folgenden Modellen:
pretrained-foundation-model-v1.4-2025-02-05als General Availability (GA)pretrained-foundation-model-v1.5-2025-05-05als Vorschaupretrained-foundation-model-v1.5-pro-2025-06-20als Vorschau
Sie können diese Funktionen in der Konsolen-UI aktivieren, wenn Sie Labels in Ihrem Dokumentschema erstellen oder bearbeiten.
Abgeleitete Felder sind eine leistungsstarke Funktion, mit der Sie Informationen extrahieren können, die nicht explizit in einem Dokument enthalten sind. So können Sie ein Feld so konfigurieren, dass es durch intelligente Inferenz oder Generierung basierend auf dem Gesamtkontext des Dokuments ausgefüllt wird. Das geht über die rudimentäre Textextraktion hinaus und unterstützt erweiterte Anwendungsfälle wie:
- Das Land aus einer Adresse ableiten.
- Gesamtzahl der Elemente in einer Tabelle zählen.
- Erkennen, ob ein Ausweis eine „Real ID“ ist
Beispiel für die Schemabearbeitung
Hier sehen Sie ein Beispiel für das Erstellen eines Schemas für abgeleitete Felder für solche Anwendungsfälle und die erwartete Ausgabe anhand eines US-Führerscheins.
Wählen Sie beim Erstellen eines Schemaelements die Methode
Derivedaus.
Beschreibende Labels hinzufügen, um die Leistung zu verbessern

Für abgeleitete Felder wie Signaturen müssen beim Labeln von Dokumenten keine Begrenzungsrahmen festgelegt werden. Wählen Sie für Wert die Option Erkannt aus.

Für abgeleitete Felder, die keine Signaturen sind, können Sie einen beliebigen Wert als Teil der Kennzeichnung eingeben, um die möglichen Ausgaben zu definieren.

Die erwartete Ausgabe sieht in etwa so aus. Das Vorhandensein einer Signatur wird als „Detected“ (Erkannt) oder „“ zurückgegeben und abgeleitete Felder werden als Text zurückgegeben, wie in der Beschreibung des Labels angegeben.

Übersicht über extrahierte und abgeleitete Daten
Wenn Sie eine Entität in Ihrem Prozessorschema definieren, können Sie eine Methode für die Art und Weise auswählen, wie ihr Wert festgelegt wird.
Extrahieren:Dies ist die Standardmethode. Diese Methode eignet sich, wenn der Wert der Entität direkt aus dem Dokumenttext extrahiert werden soll. Das System identifiziert den Text und füllt Felder wie
textAnchorundpageAnchoraus, um den Speicherort anzugeben.Abgeleitet:Diese Methode wird verwendet, wenn der Wert der Entität aus dem Inhalt des Dokuments abgeleitet werden muss. Da der Wert nicht direkt im Text enthalten ist, werden die Felder
textAnchorundpageAnchornicht ausgefüllt.
Beispielanwendungsfall: Währungscode finden
Angenommen, Sie müssen den Währungscode (z. B. USD, CAD, EUR) für Transaktionen in Ihren Dokumenten ermitteln.
Wann sollte
Extractverwendet werden? Wenn die Dokumente durchgehend eindeutige Währungssymbole oder ‑codes wie „USD“ oder „€“ enthalten, verwenden Sie dieExtract-Methode, um genau diesen Text zu finden und zu extrahieren.Wann sollte
Derivedverwendet werden?: Wenn in einem Dokument ein mehrdeutiges Symbol wie „$“ verwendet wird (das sich auf USD, CAD, AUD usw. beziehen könnte) oder gar kein Symbol vorhanden ist, verwenden Sie die MethodeDerived. Das Modell analysiert den Kontext des Dokuments, z. B. eine Rechnungsadresse oder den Unternehmensstandort, um den richtigen ISO 4217-Währungscode abzuleiten.
Anwendungsbeispiel: Benutzerdefinierte Normalisierungsanweisungen
Stellen Sie sich vor, Sie müssen Informationen aus dem Dokument in einem anderen Format als dem Rest des Dokuments extrahieren. Die meisten Anwendungsfälle sollten bereits durch die Normalisierungslogik abgedeckt sein. Für Grenzfälle, die nicht abgedeckt sind, können diese Einheiten in einem benutzerdefinierten Ausgabeformat zurückgegeben werden, das Sie mit abgeleiteten Feldern definieren. Sie können beispielsweise Bindestriche aus Zahlen entfernen, indem Sie den Prompt Gib die Zahl ohne alle nicht numerischen Zeichen zurück. verwenden.

Das Rechnungsdatum kann auf ähnliche Weise mit einem abgeleiteten Feld mit der Beschreibung Return the invoice date in yyyy-mm-dd (ISO 8601) format. Das Datumsformat auf der Rechnung entspricht dem lokalen Datumsformat. Verwenden Sie das Herkunftsland der Rechnung, um das lokale Datumsformat abzuleiten.
Best Practices für die Konfiguration
Damit Sie mit abgeleiteten Feldern optimale Ergebnisse erzielen, empfehlen wir Ihnen dringend, während der Kennzeichnung eine klare, anleitende description für die Property in Ihrem Schema zu schreiben. Das hilft dem Modell bei der Ableitung.
Im Beispiel für den Währungscode können Sie ein Feld mit dem Namen currency_code erstellen und die folgende Beschreibung angeben: „Finden Sie den ISO 4217-Währungscode der Betragswerte im Dokument. Verwenden Sie dazu kontextbezogene Signale im Dokument, z. B. Währungssymbole und Adressen.“
Beschränkungen
Abgeleitete Felder werden seitenweise generiert. Das bedeutet, dass Anwendungsfälle, für die Informationen von mehreren Seiten erforderlich sind, nicht vollständig unterstützt werden. Wenn Sie beispielsweise ein abgeleitetes Feld zum Zusammenfassen eines Dokuments konfigurieren, wird für jede einzelne Seite eine separate Zusammenfassung erstellt und nicht eine zusammenhängende Zusammenfassung für das gesamte Dokument. Diese Einschränkung gilt für alle Felder, in denen der Wert aus seitenübergreifenden Informationen abgeleitet werden muss.
Signaturerkennung im benutzerdefinierten Extrahierer
Der benutzerdefinierte Extraktor von Document AI unterstützt die Signaturerkennung in benutzerdefinierten Extraktormodellen pretrained-foundation-model-v1.4-2025-02-05 und pretrained-foundation-model-v1.5-2025-05-05. Sie können diese Funktion in der Console-Benutzeroberfläche aktivieren, wenn Sie Labels in Ihrem Dokumentschema erstellen oder bearbeiten.
Mit der Funktion Signaturerkennung können Sie feststellen, ob in Ihren Dokumenten eine Signatur vorhanden ist. Bei dieser Funktion wird anhand visueller Hinweise geprüft, ob eine Unterschrift vorhanden ist. Es wird kein Text extrahiert.
So funktioniert die Signaturerkennung
Um diese Funktion zu aktivieren, ist beim Definieren des Prozessorschemas ein signature-Datentyp verfügbar. Das Verhalten des Prozessors hängt davon ab, ob im Dokument eine Signatur erkannt wird.
Wenn eine Signatur gefunden wird, gibt der Extractor in seiner Antwort eine Signatur-Entität zurück.
Für ein Feld mit dem Namen has_signed hat das Antwortobjekt die folgende Struktur:
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
Wenn keine Signatur gefunden wird, wird die Entität nicht in der Antwort des Prozessors zurückgegeben.
Schlüsselanforderungen konfigurieren und einrichten
So richten Sie die Signaturerkennung ein:
- Schema definieren:Fügen Sie in Ihrem Prozessorschema eine neue Entität für die Signatur hinzu, die Sie erkennen möchten.
- Datentyp festlegen:Wählen Sie „Signatur“ als Datentyp für diese neue Einheit aus.
- Methode auf „Abgeleitet“ festlegen:Für Entitäten mit dem Datentyp
signaturekann nur die MethodeDerivedverwendet werden. Da das Modell die Anwesenheit der Signatur visuell ableitet, wird kein Textwert extrahiert. Daher werden Felder wietextAnchorundpageAnchorfür Signatur-Entitäten nicht ausgefüllt.
Anwendungsbeispiel
Stellen Sie sich vor, Sie verarbeiten Verträge und müssen überprüfen, ob sie unterzeichnet wurden.
Sie können ein Schemefeld mit dem Namen is_contract_signed erstellen und seinen Datentyp auf signature festlegen. Wenn Sie einen unterzeichneten Vertrag verarbeiten, enthält die Antwort eine is_contract_signed-Entität, die die Unterschrift bestätigt. Wenn keine Signatur vorhanden ist, ist diese Entität nicht in der Antwort enthalten. So können Sie nicht unterzeichnete Dokumente schnell zur Überprüfung kennzeichnen.