Benutzerdefinierte Extrahierer – Übersicht

Mit dem benutzerdefinierten Extraktor werden Entitäten aus Dokumenten eines bestimmten Typs extrahiert. So kann das Tool beispielsweise die Elemente in einem Menü oder den Namen und die Kontaktdaten aus einem Lebenslauf extrahieren.

Übersicht

Ziel des benutzerdefinierten Extraktors ist es, Document AI-Nutzern die Möglichkeit zu geben, benutzerdefinierte Lösungen zum Extrahieren von Einheiten für neue Dokumenttypen zu erstellen, für die keine vortrainierten Prozessoren verfügbar sind. Der benutzerdefinierte Extraktor umfasst eine Kombination aus layoutbewussten Deep-Learning-Modellen (für generative KI und benutzerdefinierte Modelle) und vorlagenbasierten Modellen.

Welche Trainingsmethode sollte ich verwenden?

Der benutzerdefinierte Extraktor unterstützt eine Vielzahl von Anwendungsfällen mit drei verschiedenen Modi.

Trainingsmethode Dokumentbeispiele Variationen im Dokumentlayout Freitext oder Absätze Anzahl der Trainingsdokumente für eine produktionsreife Qualität, je nach Variabilität
Optimierung und Foundation Model (generative KI). Vertrag, Nutzungsbedingungen, Rechnung, Kontoauszug, Frachtbrief, Lohnabrechnung. Absteigend (bevorzugt) Hoch Mittel: 0–50+ Dokumente
Benutzerdefiniertes Modell Modell Ähnliche Formulare mit Layoutabweichungen zwischen Jahren oder Anbietern (z. B. W9). Gering bis mittel. Niedrig. Hoch: 10–100+ Dokumente.
Vorlage Steuerformulare mit einem festen Layout, z. B. die Formulare 941 und 709. Keine. Niedrig. Niedrig (3 Dokumente)

Da Foundation Models in der Regel weniger Trainingsdokumente benötigen, werden sie als erste Option für alle variablen Layouts empfohlen.

Eine Anleitung zum Erstellen eines benutzerdefinierten Extraktionsprozessors finden Sie unter Prozessor erstellen.

Konfidenzwert

Der Konfidenzwert gibt an, wie stark Ihr Modell die einzelnen Einheiten mit dem vorhergesagten Wert in Verbindung bringt. Der Wert liegt zwischen 0 und 1. Je näher er an 1 liegt, desto höher ist die Konfidenz des Modells, dass der Wert der Entität entspricht. So können Nutzer Trigger für die manuelle Überprüfung einzelner Rechtssubjekte festlegen, wenn der Wert niedrig ist. Beispiel: Ermitteln, ob der Text in einer Einheit „Hello, world!“ oder „HeIIo vvorld!“ lautet.

Die Vorteile dieses Ansatzes bestehen darin, dass einzelne Einheiten mit geringer Konfidenz erkannt werden können, Schwellenwerte für die Verwendung von Vorhersagen festgelegt werden können, der optimale Konfidenzschwellenwert ausgewählt werden kann und neue Strategien für das Trainieren von Modellen mit höherer Genauigkeit und Konfidenzwerten entwickelt werden können.

Weitere Informationen zu Bewertungskonzepten und ‑messwerten finden Sie unter Leistung bewerten.