Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Prozessorliste

Auf dieser Seite finden Sie detaillierte Informationen zu allen von Document AI angebotenen Prozessoren. Sie können eine Liste aller Auftragsverarbeiter nach Lösungstyp aufrufen.

Alle Document AI-Prozessoren entsprechen den Nutzungsbedingungen zur Datenverarbeitung und Sicherheitsbestimmungen.

Weitere Informationen finden Sie in der Dokumentation unter Prozessorversionen verwalten. Außerdem gelten zusätzlich zu den allgemeinen Kontingenten und Limits für Produkte bestimmte Prozessorlimits.

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Beschreibung

Text in verschiedenen Arten von Dokumenten erkennen und extrahieren

Mit diesem Prozessor können Sie Text, einschließlich handschriftlichen Textes, in Dokumenten in über 200 Sprachen erkennen und extrahieren. Der Prozessor verwendet auch maschinelles Lernen, um die Qualität eines Dokuments anhand der Lesbarkeit des Inhalts zu bewerten.

Kategorie Digitalisieren

Funktionen OCR, Qualitätsanalyse

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben OCR_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Armenisch	`hy`	`Armn`
Belarussisch	`be`	`Cyrl`
Bengalisch	`bn`	`Beng`
Bengalisch	`bn`	`Beng`
Bulgarisch	`bg`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Koreanisch	`ko`	`Kore`
Lao	`lo`	`Laoo`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Thailändisch	`th`	`Thai`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Beschreibung
`pretrained-ocr-v1.2-2022-11-10`	Stabil	GA	Eingefrorene Modellversion 1.0: Modelldateien, Konfigurationen und Binärdateien einer Versionsmomentaufnahme, die bis zu 18 Monate lang in einem Container-Image eingefroren sind.
`pretrained-ocr-v2.0-2023-06-02`	Stabil	GA	Produktionsreifes Modell, das auf Dokumentanwendungsfälle spezialisiert ist. Beinhaltet den Zugriff auf alle OCR-Add-ons.
`pretrained-ocr-v2.1-2024-08-07`	Stabil	GA	Die wichtigsten Verbesserungen in Version 2.1 sind: bessere Erkennung von gedrucktem Text, genauere Erkennung von Kästchen und eine präzisere Lesereihenfolge.
`pretrained-ocr-v2.1.1-2025-01-31`	Releasekandidat	Öffentliche Vorschau	Version 2.1.1 ähnelt Version 2.1 und ist in allen Regionen verfügbar, mit Ausnahme von `US`, `EU` und `asia-southeast1`.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	500
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Enterprise Document OCR

Entitäten aus Dokumenten extrahieren

Beispieldatasets mit Beispielen für mit Labels versehene und nicht mit Labels versehene Datasets, die Sie zum Trainieren verwenden können.

Benutzerdefinierter Extrahierer

Beschreibung

Extrahieren Sie Felder aus Dokumenten mit generativer KI oder benutzerdefinierten Modellen und optimieren Sie Modelle, um Daten aus Ihren Dokumenten genau zu extrahieren.

Kategorie Extrahieren

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_EXTRACTION_PROCESSOR

Hinweise

Wenn Sie generative KI für die Extraktion verwenden, gilt Folgendes:
- Nur die englische Sprache wird offiziell unterstützt.
- Die regionale Verfügbarkeit ist in US, EU, northamerica-northeast1 und asia-southeast1.

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Afrikaans	`af`	`Latn`
Arabisch	`ar`	`Arab`
Aserbaidschanisch	`az`	`Latn`
Aserbaidschanisch (Kyrillisch)	`az-Cyrl`	`Cyrl`
Belarussisch	`be`	`Cyrl`
Bulgarisch	`bg`	`Cyrl`
Bosnisch	`bs`	`Latn`
Katalanisch	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Tschechisch	`cs`	`Latn`
Walisisch	`cy`	`Latn`
Dänisch	`da`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Englisch	`en`	`Latn`
Esperanto	`eo`	`Latn`
Spanisch	`es`	`Latn`
Estnisch	`et`	`Latn`
Baskisch	`eu`	`Latn`
Persisch	`fa`	`Arab`
Finnisch	`fi`	`Latn`
Filipino	`fil`	`Latn`
Französisch	`fr`	`Latn`
Irisch	`ga`	`Latn`
Galizisch	`gl`	`Latn`
Hindi	`hi`	`Deva`
Kroatisch	`hr`	`Latn`
Haitianisch	`ht`	`Latn`
Ungarisch	`hu`	`Latn`
Indonesisch	`id`	`Latn`
Isländisch	`is`	`Latn`
Italienisch	`it`	`Latn`
Hebräisch	`iw`	`Hebr`
Japanisch	`ja`	`Jpan`
Javanisch	`jv`	`Latn`
Kasachisch	`kk`	`Cyrl`
Koreanisch	`ko`	`Kore`
Kirgisisch	`ky`	`Cyrl`
Latein	`la`	`Latn`
Litauisch	`lt`	`Latn`
Lettisch	`lv`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Mongolisch	`mn`	`Cyrl`
Marathi	`mr`	`Deva`
Malaiisch	`ms`	`Latn`
Maltesisch	`mt`	`Latn`
Nepalesisch	`ne`	`Deva`
Niederländisch	`nl`	`Latn`
Norwegisch	`no`	`Latn`
Polnisch	`pl`	`Latn`
Paschtu	`ps`	`Arab`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Russisch (Orthografie von Peter dem Großen)	`ru-PETR1708`	`Cyrl`
Sanskrit	`sa`	`Deva`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Albanisch	`sq`	`Latn`
Serbisch	`sr`	`Cyrl`
Schwedisch	`sv`	`Latn`
Suaheli	`sw`	`Latn`
Tagalog	`tl`	`Latn`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Usbekisch	`uz`	`Latn`
Usbekisch (Kyrillisch)	`uz-Cyrl`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`
Chinesisch (vereinfacht)	`zh-Hans`	`Hani`
Chinesisch (traditionell)	`zh-Hant`	`Hani`
Zulu	`zu`	`Latn`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Beschreibung
`pretrained-foundation-model-v1.5-2025-05-05`	Stabil	GA	Produktionsreifer Kandidat, der auf dem Gemini 2.5 Flash-LLM basiert. Empfohlen für Nutzer, die neuere Modelle ausprobieren möchten.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Stabil	GA	Produktionsreifes Modell, das auf dem Gemini 2.5 Pro-LLM basiert. Unterstützt ein Kontingent von bis zu 30 Seiten pro Minute für Onlineverarbeitungsanfragen. Dieses Modell bietet eine höhere Qualität als Version 1.5 und kann eine höhere Latenz aufweisen.
`pretrained-foundation-model-v1.5.1-2025-08-07`	Releasekandidat	Öffentliche Vorschau	Modell in der öffentlichen Vorschau, das auf dem LLM Gemini 2.5 Flash basiert. Dieses Modell hat dieselben Funktionen wie Version 1.5 und bietet ein verbessertes adaptives Few-Shot-Lernen.
`pretrained-foundation-model-v1.6-pro-2025-12-01`	Releasekandidat	Öffentliche Vorschau	Vorschaumodell, das auf dem Gemini 3 Pro-LLM basiert. Hinweis:Bei dieser Prozessorversion wird der globale Vertex AI Gemini-Endpunkt verwendet. Sie entspricht nicht den Standards für die Datenresidenz (DMZ). Anfragen an US- und EU-Endpunkte können beispielsweise weltweit weitergeleitet werden.
`pretrained-foundation-model-v1.6-2026-01-13`	Releasekandidat	Öffentliche Vorschau	Vorschaumodell, das auf dem LLM Gemini 3 Flash basiert. Hinweis:Bei dieser Prozessorversion wird der globale Vertex AI Gemini-Endpunkt verwendet. Sie entspricht nicht den Standards für die Datenresidenz (DMZ). Anfragen an US- und EU-Endpunkte können beispielsweise weltweit weitergeleitet werden.
`pretrained-foundation-model-v3.5-2026-05-26`	Releasekandidat	Öffentliche Vorschau	Vorabversion des Modells, das auf dem LLM Gemini 3.5 Flash basiert.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Normalisierte Datentypen

Weitere Informationen finden Sie auf den Seiten Anreicherung und Normalisierung und Dataset erstellen.

Vollständige Liste der normalisierten Datentypen

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierter Extraktor

Formularparser

Beschreibung

Zusätzlich zu OCR-Text können Sie allgemeine Schlüssel/Wert-Paare (Entität und Kästchen), Tabellen und allgemeine Entitäten aus Dokumenten extrahieren.

Dieser Prozessor nutzt fortschrittliche Technologien für maschinelles Lernen, um Schlüssel/Wert-Paare, Kästchen und Tabellen aus Dokumenten in mehr als 200 Sprachen zu extrahieren. Dieser Prozessor nutzt auch Deep-Learning-Modelle, um 11 generische Entitäten zu extrahieren, die in verschiedenen Dokumenttypen häufig vorkommen.

Kategorie Extrahieren

Funktionen OCR, Formularanalyse, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben FORM_PARSER_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Belarussisch	`be`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Koreanisch	`ko`	`Kore`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Zusätzliche Felder erkannt	Beschreibung
`pretrained-form-parser-v1.0-2020-09-23`	Stabil	GA	Keine	Legacy-Version Für optimale Qualität und den vollen Funktionsumfang empfehlen wir die Verwendung von Form Parser v2.0.
`pretrained-form-parser-v2.0-2022-11-10`	Stabil	GA	Felder anzeigen `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Empfohlene Version. Unterstützt generische Einheiten und umfasst ein aktualisiertes Tabellen-, KVP- und Kontrollkästchenmodell sowie mehr als 200 Sprachen.
`pretrained-form-parser-v2.1-2023-06-26`	Releasekandidat	Öffentliche Vorschau	Keine	Version der öffentlichen Vorschau. Dasselbe Modell wie Version 2.0, aber mit aktivierter nativer Textextraktion aus digitalen PDF-Dateien.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	100
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Form Parser

Layoutparser

Beschreibung

Extrahiert Dokumentinhaltselemente (Text, Tabellen und Listen) und erstellt kontextsensitive Blöcke.

Der Layoutparser extrahiert Dokumentinhaltselemente wie Text, Tabellen und Listen und erstellt kontextsensitive Blöcke, die das Abrufen von Informationen in Anwendungen für generative KI und Discovery erleichtern.

Kategorie Extrahieren

Funktionen Layoutanalyse, Dokumentaufteilung

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben LAYOUT_PARSER_PROCESSOR

Hinweise

Dieser Parser unterstützt PDF-, HTML-, DOCX-, PPTX- und XLSX-/XLSM-Dateien.

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Afrikaans	`af`	`Latn`
Albanisch	`sq`	`Latn`
Arabisch	`ar`	`Arab`
Armenisch	`hy`	`Armn`
Belarussisch	`be`	`Cyrl`
Bengalisch	`bn`	`Beng`
Bengalisch	`bn`	`Beng`
Bulgarisch	`bg`	`Cyrl`
Katalanisch	`ca`	`Latn`
Chinesisch	`zh`	`Hani`
Kroatisch	`hr`	`Latn`
Tschechisch	`cs`	`Latn`
Dänisch	`da`	`Latn`
Niederländisch	`nl`	`Latn`
Englisch	`en`	`Latn`
Estnisch	`et`	`Latn`
Filipino	`fil`	`Latn`
Finnisch	`fi`	`Latn`
Französisch	`fr`	`Latn`
Deutsch	`de`	`Latn`
Griechisch	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebräisch	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Ungarisch	`hu`	`Latn`
Isländisch	`is`	`Latn`
Indonesisch	`id`	`Latn`
Italienisch	`it`	`Latn`
Japanisch	`ja`	`Jpan`
Kannada	`kn`	`Knda`
Khmer	`km`	`Khmr`
Koreanisch	`ko`	`Kore`
Lao	`lo`	`Laoo`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Mazedonisch	`mk`	`Cyrl`
Malaiisch	`ms`	`Latn`
Malayalam	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalesisch	`ne`	`Deva`
Norwegisch	`no`	`Latn`
Persisch	`fa`	`Arab`
Polnisch	`pl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Rumänisch	`ro`	`Latn`
Russisch	`ru`	`Cyrl`
Serbisch	`sr`	`Cyrl`
Slowakisch	`sk`	`Latn`
Slowenisch	`sl`	`Latn`
Spanisch	`es`	`Latn`
Schwedisch	`sv`	`Latn`
Tagalog	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Thailändisch	`th`	`Thai`
Türkisch	`tr`	`Latn`
Ukrainisch	`uk`	`Cyrl`
Vietnamesisch	`vi`	`Latn`
Jiddisch	`yi`	`Hebr`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Beschreibung
`pretrained-layout-parser-v1.0-2024-06-03`	Stabil	GA	Version mit allgemeiner Verfügbarkeit für die Analyse des Dokumentlayouts. Dies ist die Standardversion des vortrainierten Prozessors.
`pretrained-layout-parser-v1.5-2025-08-25`	Releasekandidat	Öffentliche Vorschau	Die Vorschauversion basiert auf dem Gemini 2.5 Flash LLM und bietet eine verbesserte Layoutanalyse für PDF-Dateien. Empfohlen für Nutzer, die neue Versionen ausprobieren möchten. Hinweis:Wenn sie für Nicht-PDF-Dateien verwendet wird, verhält sie sich genauso wie die stabile `pretrained-layout-parser-v1.0-2024-06-03`.
`pretrained-layout-parser-v1.5-pro-2025-08-25`	Releasekandidat	Öffentliche Vorschau	Die Vorschauversion basiert auf dem Gemini 2.5 Pro-LLM und bietet eine bessere Layoutanalyse von PDF-Dateien. Die Latenz von v1.5-pro ist höher als die von v1.5. Hinweis:Wenn sie für Nicht-PDF-Dateien verwendet wird, verhält sie sich genauso wie die stabile `pretrained-layout-parser-v1.0-2024-06-03`.
`pretrained-layout-parser-v1.6-pro-2025-12-01`	Releasekandidat	Öffentliche Vorschau	Vorschauversion, die auf dem Gemini 3.0 Pro-LLM basiert. Hinweis:Bei dieser Prozessorversion wird der globale Vertex AI Gemini-Endpunkt verwendet. Sie entspricht nicht den Data Residency (DMZ)-Standards. Anfragen an US- und EU-Endpunkte können beispielsweise weltweit weitergeleitet werden.
`pretrained-layout-parser-v1.6-2026-01-13`	Releasekandidat	Öffentliche Vorschau	Vorabversion, die auf dem LLM Gemini 3.0 Flash basiert. Hinweis:Bei dieser Prozessorversion wird der globale Vertex AI Gemini-Endpunkt verwendet. Sie entspricht nicht den Data Residency (DMZ)-Standards. Anfragen an US- und EU-Endpunkte können beispielsweise weltweit weitergeleitet werden.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	500
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Weitere Informationen Layoutparser

Vortrainierte Prozessoren ansehen

Kontoauszugsparser

Beschreibung

Extrahiert Daten aus Kontoauszügen, einschließlich Name, Konto, Transaktionen usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben BANK_STATEMENT_PROCESSOR

Hinweise

Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Extraktion von Entitäten für das erste unterstützte Dokument durch. Wenn der Prozessor in der Eingabedatei keine anwendbaren Dokumente findet, gibt er eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Beschreibung
`pretrained-bankstatement-v1.0-2021-08-08`	Stabil	GA
`pretrained-bankstatement-v1.1-2021-08-13`	Stabil	GA
`pretrained-bankstatement-v2.0-2021-12-10`	Stabil	GA
`pretrained-bankstatement-v3.0-2022-05-16`	Stabil	GA	In dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Kontoauszug enthält. Im Gegensatz zur Standardversion wird die Eingabedatei in dieser Version nicht auf Kontoauszüge geprüft. Es wird kein Fehler zurückgegeben, wenn keine Kontoauszüge gefunden werden.
`pretrained-bankstatement-v4.0-2023-07-31`	Releasekandidat	Öffentliche Vorschau
`pretrained-bankstatement-v5.0-2023-12-06`	Stabil	GA

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	30
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

bank_address
bank_name

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Labeling-Anleitung In neuem Fenster öffnen

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

W2-Parser

Beschreibung

Extrahiert Daten aus Formular W2, einschließlich Arbeitnehmer, Arbeitgeber, Löhne usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben FORM_W2_PROCESSOR

Hinweise

Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Extraktion von Entitäten für das erste unterstützte Dokument durch. Wenn der Prozessor in der Eingabedatei keine anwendbaren Dokumente findet, gibt er eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

2020 (Standard- und benutzerdefinierte Versionen)
2019 (Standard- und benutzerdefinierte Versionen)
2018 (Standard- und benutzerdefinierte Versionen)

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Zusätzliche Felder erkannt	Beschreibung
`pretrained-w2-v1.0-2020-10-01`	Stabil	GA	Keine
`pretrained-w2-v1.1-2022-01-27`	Stabil	GA	Keine
`pretrained-w2-v1.2-2022-01-28`	Stabil	GA	Felder anzeigen `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Qualitätsverbesserungen und Unterstützung neuer Felder; ohne Splitter.
`pretrained-w2-v2.0-2022-03-30`	Releasekandidat	Öffentliche Vorschau	Felder anzeigen `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Qualitätsverbesserungen und Unterstützung für Felder in Zeile 12 sowie detaillierte Vorhersagen für `EmployeeName`, `EmployeeAddress` und `EmployerNameAndAddress`. Diese sind nicht mehr Teil der Ausgabe und werden durch zusätzliche Felder ersetzt.
`pretrained-w2-v2.1-2022-06-08`	Stabil	GA	Felder anzeigen `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Ähnlich wie Version `pretrained-w2-v2.0-2022-03-30`, aber mit weiteren Qualitätsverbesserungen und einer zusätzlichen Entität `EmployeeName_Suffix`.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	15
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	15

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

EmployerNameAndAddress
EIN

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Parser für Identitätsnachweise

Beschreibung

Die Gültigkeit von Ausweisdokumenten mithilfe mehrerer Signale vorhersagen.

Der Identity Document Proofing-Prozessor wurde entwickelt, um die Gültigkeit von Identitätsdokumenten anhand von vier verschiedenen Signalen vorherzusagen.

Der Prozessor gibt derzeit Informationen aus den folgenden Signalen zurück:

fraud_signals_is_identity_document-Erkennung: Hier wird vorhergesagt, ob ein Bild ein erkanntes Ausweisdokument enthält.
fraud_signals_suspicious_words-Erkennung: Es wird vorhergesagt, ob Wörter vorhanden sind, die für Ausweise untypisch sind.
fraud_signals_image_manipulation-Erkennung: Hier wird vorhergesagt, ob das Bild mit einem Bildbearbeitungstool verändert oder manipuliert wurde.
fraud_signals_online_duplicate-Erkennung: Es wird vorhergesagt, ob das Bild online gefunden werden kann (nur USA).

Kategorie Vortrainiert

Funktionen OCR, Qualitätsanalyse

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben ID_PROOFING_PROCESSOR

Hinweise

Die Funktion zur Erkennung von Online-Duplikaten wird derzeit in US-Rechenzentren verarbeitet. Außerhalb der USA ist für diese Funktion keine regionale und multiregionale Unterstützung verfügbar.
Dieser Prozessor wird von Algorithmen unterstützt, die häufiger aktualisiert werden, als neue Prozessorversionen veröffentlicht werden. Aus diesem Grund kann der Prozessor im Laufe der Zeit unterschiedliche Ausgaben zurückgeben, auch wenn dieselbe Prozessorversion verwendet wird. Das System zur Online-Erkennung von Duplikaten überwacht beispielsweise Bilder im Web. Das Verhalten des Systems kann sich dann schneller ändern, als es in Prozessorversionen nachvollzogen werden kann.
Weitere Informationen finden Sie in den Anmerkungen zur verantwortungsbewussten Anwendung von KI^[†] und zur manuellen Überprüfung.^[‡]

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

Unterstützung für US-amerikanische Reisepässe, Passport Cards und Führerscheine.

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Zusätzliche Felder erkannt	Beschreibung
`pretrained-id-proofing-v1.0-2022-10-03`	Stabil	GA	Keine
`pretrained-id-proofing-v1.1-2023-05-18`	Releasekandidat	Öffentliche Vorschau	Felder anzeigen `fraud_signals_photocopy_detection`	Zusätzliches Signal zur Erkennung von Fotokopien
`pretrained-id-proofing-v1.2-2023-10-04`	Releasekandidat	Öffentliche Vorschau	Felder anzeigen `fraud_signals_photocopy_detection`

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	2
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	2

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Lohnabrechnungsparser

Beschreibung

Extrahiert Daten aus Lohnabrechnungen, einschließlich Name, Unternehmen, Beträge usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben PAYSTUB_PROCESSOR

Hinweise

Wenn das mehrseitige Eingabedokument mehr als einen gültigen Gehaltszettel enthält, werden nur aus dem ersten gültigen Gehaltszettel Entitäten extrahiert. Wenn in der Eingabedatei keine Gehaltsabrechnungen gefunden werden, gibt der Prozessor eine Fehlermeldung zurück.

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Zusätzliche Felder erkannt	Beschreibung
`pretrained-paystub-v1.0-2021-03-19`	Stabil	GA	Keine
`pretrained-paystub-v1.1-2021-08-13`	Stabil	GA	Felder anzeigen `net_pay` `net_pay_ytd` `employee_account_number`	Qualitätsverbesserung und Unterstützung neuer Felder
`pretrained-paystub-v1.2-2021-12-10`	Stabil	GA	Keine
`pretrained-paystub-v2.0-2022-05-17`	Releasekandidat	Öffentliche Vorschau	Felder anzeigen `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	In dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Gehaltszettel enthält. Im Gegensatz zur Standardversion wird in dieser Version die Eingabedatei nicht auf Gehaltsabrechnungen geprüft. Es wird kein Fehler zurückgegeben, wenn keine Gehaltsabrechnungen gefunden werden. Qualitätsverbesserung, Unterstützung neuer Felder und neues Schema. Bonus, Provisionen, Feiertage, Überstunden, reguläre Bezahlung und Urlaub sind jetzt Teil von earning_item/earning_this_period und die entsprechenden Werte seit Jahresbeginn sind in earning_item/earning_ytd enthalten. „Direct Deposit“ (Direkte Einzahlung) und „Employee Account Number“ (Kontonummer des Mitarbeiters) sind jetzt unter „direct_deposit_item“ verschachtelt. Das asynchrone Seitenlimit beträgt 10.
`pretrained-paystub-v2.0-2022-07-22`	Stabil	GA	Keine	Qualitätsverbesserung und Verbesserungen beim Uptraining.
`pretrained-paystub-v3.0-2023-12-06`	Stabil	GA	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	50
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

employer_address
employer_name

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Labeling-Anleitung In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Parser für US-Führerschein

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben US_DRIVER_LICENSE_PROCESSOR

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Unterstützte Formulare/Versionen

Unterstützt alle 50 Bundesstaaten und Washington, D.C.

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Beschreibung
`pretrained-us-driver-license-v1.0-2021-06-14`	Stabil	GA

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	2
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	2

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

Date Of Birth
Expiration Date
Issue Date

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

eu
us

Kostenparser

Beschreibung

Extrahiert Text und Werte aus Ausgabendokumenten, z. B. Ausgabendatum, Lieferantenname, Gesamtbetrag und Währung.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben EXPENSE_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Deutsch	`de`	`Latn`
Englisch	`en`	`Latn`
Spanisch	`es`	`Latn`
Französisch	`fr`	`Latn`
Japanisch	`ja`	`Jpan`
Niederländisch	`nl`	`Latn`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Zusätzliche Felder erkannt	Unterstützung für weitere Sprachen	Beschreibung
`pretrained-expense-v1.1-2021-04-09`	Stabil	GA	Keine	Keine	Abgestimmte Version des Prozessors v1.0. Eingeführt im April 2021
`pretrained-expense-v1.3.2-2024-09-11`	Releasekandidat	Öffentliche Vorschau	Felder anzeigen `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: Japanisch	Eine optimierte Version 1.3 mit einem verbesserten zugrunde liegenden Vision-Modell.
`pretrained-expense-v1.4-2022-11-18`	Stabil	GA	Felder anzeigen `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japanisch `it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien)	Leistungsverbesserungen und Unterstützung für das Uptraining. Das Limit für die maximale Anzahl von Seiten (Online-/synchronen Anfragen) wurde auf 15 erhöht. Hinweis:Ab dem 30. April 2025 wird das Produkt in den USA und der EU nicht mehr angeboten.
`pretrained-expense-v1.4.2-2024-09-12`	Stabil	GA	Felder anzeigen `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japanisch `it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien)	Ein Upgrade auf Version 1.4 mit einem verbesserten zugrunde liegenden Vision-Modell.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	10
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	10
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	10

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

supplier_address
supplier_name
supplier_phone

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Labeling-Anleitung In neuem Fenster öffnen

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Rechnungsparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum.

Der Rechnungs-Parser extrahiert sowohl Kopf- als auch Positionenfelder, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum und Positionenbeträge.

Kategorie Vortrainiert

Funktionen OCR, Entitätsextraktion

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben INVOICE_PROCESSOR

Unterstützte Sprachen

Vollständige Liste der Sprachen

Sprache	BCP 47-Tag	Skript
Deutsch	`de`	`Latn`
Englisch	`en`	`Latn`
Spanisch	`es`	`Latn`
Estnisch	`et`	`Latn`
Französisch	`fr`	`Latn`
Italienisch	`it`	`Latn`
Lettisch	`lv`	`Latn`
Litauisch	`lt`	`Latn`
Niederländisch	`nl`	`Latn`
Portugiesisch (Portugal und Brasilien)	`pt`	`Latn`
Rumänisch	`ro`	`Latn`
Schwedisch	`sv`	`Latn`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Unterstützung für weitere Sprachen	Beschreibung
`pretrained-invoice-v1.1-2021-04-09`	Stabil	GA	Keine
`pretrained-invoice-v1.2-2022-02-18`	Stabil	GA	Keine	Die Einstellung ist für bald geplant.
`pretrained-invoice-v1.3-2022-07-15`	Stabil	GA	`it`: Italienisch `pt`: Portugiesisch (Portugal und Brasilien) `ro`: Rumänisch `sv`: Schwedisch `et`: Estnisch `lv`: Lettisch `lt`: Litauisch	Prozessorversion, die nachtrainiert werden kann. Die maximale Anzahl von Seiten (Online-/synchrone Anfragen) wurde auf 15 erhöht.
`pretrained-invoice-v1.4-2022-10-21`	Releasekandidat	Öffentliche Vorschau	Keine	Prozessorversion, die nachtrainiert werden kann. Die maximale Anzahl von Seiten (Online-/synchrone Anfragen) wurde auf 15 erhöht.
`pretrained-invoice-v1.5-2023-09-15`	Releasekandidat	Öffentliche Vorschau	Keine
`pretrained-invoice-v2.0-2023-12-06`	Stabil	GA	Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder

supplier_address
supplier_name
supplier_phone

Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Labeling-Anleitung In neuem Fenster öffnen

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Beschreibung

Modell trainieren, um einen Dokumenttyp aus einer Reihe von Klassen zu klassifizieren.

Kategorie Klassifizieren

Funktionen OCR, Klassifizierung

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_CLASSIFICATION_PROCESSOR

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Beschreibung
`pretrained-classifier-v1.5-2025-08-05`	Stabil	GA	Produktionsreifes Modell, das auf dem Gemini 2.5 Flash-LLM basiert. Enthält auch erweiterte OCR-Funktionen. Dieses vortrainierte Modell kann ohne vorheriges Training verwendet werden. Es unterstützt die Zero-Shot-Klassifizierung und bietet eine bessere Unterstützung für die Catch-All-Klasse.
`pretrained-classifier-v1.6-2026-03-09`	Releasekandidat	Öffentliche Vorschau	Release-Kandidat, der auf dem Gemini 3.1 Flash-LLM basiert. Hinweis:Diese Version unterstützt keine Datenresidenz.
`pretrained-classifier-v1.6-pro-2026-03-09`	Releasekandidat	Öffentliche Vorschau	Release-Kandidat, der auf dem Gemini 3.1 Pro-LLM basiert. Hinweis:Diese Version unterstützt keine Datenresidenz.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	200
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierten Klassifizierungsprozessor erstellen

Benutzerdefinierter Splitter

Beschreibung

Trainieren Sie ein Modell, um eine Datei mit mehreren Dokumenten in einzelne, klassifizierte Dokumente aufzuteilen.

Kategorie Klassifizieren

Funktionen OCR, Klassifizierung, Aufteilung

Releasestufe General Availability

Zugriffsstatus Öffentlich

API eingeben CUSTOM_SPLITTING_PROCESSOR

Hinweise

i18n kann nur über benutzerdefinierte Trainingsoptionen unterstützt werden.

Unterstützte Sprachen

Sprache	BCP 47-Tag	Skript	Handschrift wird unterstützt
Englisch	`en`	`Latn`

Prozessorversionen

Versions-ID	Version	Reifegrad des Releases	Beschreibung
`pretrained-splitter-v1.5-2025-07-14`	Stabil	GA	Allgemein verfügbares Modell, das auf dem Gemini 2.5 Flash-LLM basiert. Dieses vortrainierte Modell kann ohne vorheriges Training verwendet werden. Es unterstützt Zero-Shot-Splitting und ‑Klassifizierung.
`pretrained-splitter-v1.6-2026-03-09`	Releasekandidat	Öffentliche Vorschau	Release-Kandidat, der auf dem Gemini 3.1 Flash-LLM basiert. Hinweis:Diese Version unterstützt keine Datenresidenz.
`pretrained-splitter-v1.6-pro-2026-03-09`	Releasekandidat	Öffentliche Vorschau	Release-Kandidat, der auf dem Gemini 3.1 Pro-LLM basiert. Hinweis:Diese Version unterstützt keine Datenresidenz.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits

Maximale Anzahl von Seiten (Online-/synchrone Anfragen):	15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen):	1000
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen):	30

Hinweis:Wenn Sie das maximale Seitenlimit für Online- und synchrone Anfragen auf bis zu 30 erhöhen möchten, müssen Sie imageless_mode in ProcessRequest aktivieren.

Uptraining

Beispiel für Eingabedatei In neuem Fenster öffnen

Beispielausgabe In neuem Fenster öffnen

Unterstützte Regionen

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Weitere Informationen Benutzerdefinierten Splitterprozessor erstellen

Fußnoten

^[†] Bei der Überprüfung von Ausweisdokumenten werden Informationen aus Ausweisdokumenten extrahiert und ausgewertet, um festzustellen, ob das Eingabebild einen authentischen Ausweis darstellt.

Bei Google Cloudhelfen wir Kunden bei der Entwicklung und Implementierung von KI-Lösungen auf Basis von KI-Prinzipien. Die Identitätsüberprüfung wurde in Übereinstimmung mit den KI-Grundsätzen von Google entwickelt.

Gemäß den KI‑Grundsätzen von Google und dem aktuellen Produktdesign empfehlen wir dringend, Vorsicht walten zu lassen und die potenziellen Vorteile und Risiken der Verwendung der Funktion „Ausweisdokumentprüfung“ für die folgenden Zwecke sorgfältig abzuwägen:

Entscheidungsfindung ohne menschliche Beteiligung bei Vorhersagen, die sich auf Menschenrechte auswirken können.
In sensiblen Bereichen wie Beschäftigung, Zugang zu öffentlichen Diensten, Gesundheitswesen und sicherheitskritischen Kontexten.

^[‡] Verwenden Sie die Identitätsüberprüfung immer als Teil Ihres umfassenderen Prozesses und Workflows zur Identitätserkennung. Es ist wichtig, dass Sie einen menschlichen Prüfer in Ihrem Workflow haben, um zu überprüfen, ob die vorhergesagten Signale korrekt sind. Der Identity Proofing-Prozessor soll die manuelle Überprüfung von Ausweisen in einem Workflow nicht ersetzen, sondern Prüfer bei der Validierung von Ausweisdokumenten unterstützen. Der Identity Proofing-Prozessor sollte nicht als automatisiertes Entscheidungstool verwendet werden, um festzustellen, ob ein Ausweis gültig ist. Durch die manuelle Überprüfung können Kunden eine höhere Genauigkeit bei der Dokumentenverarbeitung erzielen und Unternehmen bei der Bewertung von Vorhersagen helfen, indem sie speziell entwickelte Tools verwenden, die diese Überprüfungen ermöglichen.

Prüfen Sie die rechtlichen Vorgaben in der Region, in der Sie diese Technologie einsetzen, und informieren Sie sich über vorhandene Branchenrichtlinien, um mehr über Richtlinien und häufig auftretende Probleme im Zusammenhang mit Fairness zu erfahren. Hier finden Sie Informationen zur Fairness beim maschinellen Lernen, einschließlich Möglichkeiten, Verzerrungen in Trainingsdatensätzen zu reduzieren, Ihre benutzerdefinierten Modelle auf Leistungsunterschiede zu bewerten und andere Aspekte zu berücksichtigen, wenn Sie Ihr benutzerdefiniertes Modell verwenden.

Wir empfehlen unseren Kunden, bei der Implementierung der Identitätsüberprüfung Best Practices für Fairness, Interpretierbarkeit, Datenschutz und Sicherheit zu berücksichtigen. Weitere Informationen zur Implementierung von verantwortungsbewusster KI finden Sie in den Empfehlungen von Google für die verantwortungsbewusste Anwendung von KI.

Weitere Informationen zu Anwendungsfällen und ein Beispiel für ein Anwendungs-Code-Repository finden Sie im Blogpost Automate identity document processing with Document AI.

Weiter

Unterstützte Dateien

Prozessorliste Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Vollständige Liste der Sprachen

Entitäten aus Dokumenten extrahieren

Benutzerdefinierter Extrahierer

Vollständige Liste der Sprachen

Vollständige Liste der normalisierten Datentypen

Formularparser

Vollständige Liste der Sprachen

Felder anzeigen

Layoutparser

Vollständige Liste der Sprachen

Vortrainierte Prozessoren ansehen

Kontoauszugsparser

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

W2-Parser

Felder anzeigen

Felder anzeigen

Felder anzeigen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Parser für Identitätsnachweise

Felder anzeigen

Felder anzeigen

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Lohnabrechnungsparser

Felder anzeigen

Felder anzeigen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Parser für US-Führerschein

Vollständige Liste der Felder

Vollständige Liste der normalisierten Felder

Kostenparser

Vollständige Liste der Sprachen

Felder anzeigen

Felder anzeigen

Felder anzeigen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Rechnungsparser

Vollständige Liste der Sprachen

Vollständige Liste der Felder

Vollständige Liste der angereicherten Felder

Vollständige Liste der normalisierten Felder

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Benutzerdefinierter Splitter

Fußnoten

Prozessorliste