Die Ausgabe des Splitter-Prozessors enthält Informationen zur Aufteilung des Eingabedokuments, einschließlich einer Vertrauensbewertung. Die Document AI API gibt ein Document-JSON-Objekt aus. Im Ausgabeformat wird das Feld entities verwendet, um Dokumentaufteilungen darzustellen. Zusätzliche Informationen hängen vom jeweiligen Splittertyp ab.
Entity.typegibt die Dokumentklassifizierung an. Eine vollständige Liste der Dokumenttypen, die erkannt werden können, finden Sie in diesen Listen.Entity.pageAnchor.pageRefs[]gibt die Seiten an, die die einzelnen untergeordneten Dokumente enthalten.pageRefs[].pageist nullbasiert und der Index für das Felddocument.pages[].
Splitterversionen, die generative KI verwenden, sind nicht dafür konzipiert, logische Dokumente mit mehr als 500 Seiten aufzuteilen. Sie können logische Dokumente mit mehr als 500 Seiten manuell in zwei oder mehr Dokumente aufteilen und den Splitter für jedes Dokument separat ausführen, um sie zu klassifizieren.
Mit Trennzeichen werden Seitenränder festgelegt, aber das Eingabedokument wird nicht tatsächlich getrennt. Das SDK für die Document AI Toolbox bietet Hilfsfunktionen, mit denen das Eingabedokument basierend auf der Ausgabe eines Splitterprozessors aufgeteilt werden kann.
Erkannte Dokumenttypen
[1] Der entsprechende Parser für dieses Formular unterstützt diesen Dokumenttyp nicht. Das bedeutet, dass der Splitter Dokumente dieses Typs identifizieren und klassifizieren kann, Document AI aber keinen Parser zum Extrahieren von Informationen bereitstellt.
Beispiele für die Ausgabe
| Prozessoren | Beispielausgabe |
|---|
Codebeispiele
Mit Splittern werden Seitenränder erkannt, das Eingabedokument wird aber nicht automatisch aufgeteilt. Mit der Document AI Toolbox können Sie eine PDF-Datei anhand der Seitenränder physisch aufteilen. In den folgenden Codebeispielen werden die Seitenbereiche ausgegeben, ohne das PDF aufzuteilen:
Java
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Java API.
Richten Sie zur Authentifizierung bei Document AI die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Node.js API.
Richten Sie zur Authentifizierung bei Document AI die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Python API.
Richten Sie zur Authentifizierung bei Document AI die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Document aufzuteilen.
Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Python API.
Richten Sie zur Authentifizierung bei Document AI die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.