Prozessorliste

Auf dieser Seite finden Sie detaillierte Informationen zu allen von Document AI angebotenen Prozessoren. Sie können eine Liste aller Auftragsverarbeiter nach Lösungstyp aufrufen.

Alle Document AI-Prozessoren unterliegen den Nutzungsbedingungen zur Datenverarbeitung und Sicherheitsbestimmungen.

Weitere Informationen finden Sie in der Dokumentation unter Prozessorversionen verwalten. Außerdem gelten zusätzlich zu den allgemeinen Kontingenten und Limits für Produkte bestimmte Prozessorlimits.

Text digitalisieren

Enterprise Document OCR (Optische Zeichenerkennung)

Beschreibung

Text in verschiedenen Arten von Dokumenten erkennen und extrahieren

Mit diesem Prozessor können Sie Text, einschließlich handschriftlichen Textes, in Dokumenten in über 200 Sprachen erkennen und extrahieren. Der Prozessor verwendet auch maschinelles Lernen, um die Qualität eines Dokuments anhand der Lesbarkeit des Inhalts zu bewerten.

Kategorie Digitalisieren
Funktionen OCR, Qualitätsanalyse
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben OCR_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Armenisch hy Armn
Belarussisch be Cyrl
Bengalisch bn Beng
Bengalisch bn Beng
Bulgarisch bg Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Griechisch el Grek
Gujarati gu Gujr
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Kannada kn Knda
Khmer km Khmr
Koreanisch ko Kore
Lao lo Laoo
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalesisch ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Punjabi pa Guru
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thailändisch th Thai
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-ocr-v1.2-2022-11-10 Stabil GA Eingefrorene Modellversion 1.0: Modelldateien, Konfigurationen und Binärdateien einer Version, die in einem Container-Image für bis zu 18 Monate eingefroren ist.
pretrained-ocr-v2.0-2023-06-02 Stabil GA Produktionsreifes Modell, das auf Dokumentanwendungsfälle spezialisiert ist. Beinhaltet den Zugriff auf alle OCR-Add-ons.
pretrained-ocr-v2.1-2024-08-07 Stabil GA Die wichtigsten Verbesserungen in Version 2.1 sind: bessere Erkennung von gedrucktem Text, genauere Erkennung von Kästchen und eine präzisere Lesereihenfolge.
pretrained-ocr-v2.1.1-2025-01-31 Releasekandidat Öffentliche Vorschau v2.1.1 ähnelt V2.1 und ist in allen Regionen verfügbar, mit Ausnahme von US, EU und asia-southeast1.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 500
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Enterprise Document OCR

Entitäten aus Dokumenten extrahieren

Beispieldatasets mit Beispielen für mit Labels versehene und nicht mit Labels versehene Datasets, die Sie zum Trainieren verwenden können.

Benutzerdefinierter Extrahierer

Beschreibung

Extrahieren Sie Felder aus Dokumenten mit generativer KI oder benutzerdefinierten Modellen und optimieren Sie Modelle, um Daten aus Ihren Dokumenten genau zu extrahieren.

Kategorie Extrahieren
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_EXTRACTION_PROCESSOR
Hinweise
  • Wenn Sie generative KI für die Extraktion verwenden, gilt Folgendes:

    • Offiziell wird nur die englische Sprache unterstützt.
    • Die regionale Verfügbarkeit ist in US, EU, northamerica-northeast1 und asia-southeast1.

Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Afrikaans af Latn
Arabisch ar Arab
Aserbaidschanisch az Latn
Aserbaidschanisch (Kyrillisch) az-Cyrl Cyrl
Belarussisch be Cyrl
Bulgarisch bg Cyrl
Bosnisch bs Latn
Katalanisch ca Latn
Cebuano ceb Latn
Tschechisch cs Latn
Walisisch cy Latn
Dänisch da Latn
Deutsch de Latn
Griechisch el Grek
Englisch en Latn
Esperanto eo Latn
Spanisch es Latn
Estnisch et Latn
Baskisch eu Latn
Persisch fa Arab
Finnisch fi Latn
Filipino fil Latn
Französisch fr Latn
Irisch ga Latn
Galizisch gl Latn
Hindi hi Deva
Kroatisch hr Latn
Haitianisch ht Latn
Ungarisch hu Latn
Indonesisch id Latn
Isländisch is Latn
Italienisch it Latn
Hebräisch iw Hebr
Japanisch ja Jpan
Javanisch jv Latn
Kasachisch kk Cyrl
Koreanisch ko Kore
Kirgisisch ky Cyrl
Latein la Latn
Litauisch lt Latn
Lettisch lv Latn
Mazedonisch mk Cyrl
Mongolisch mn Cyrl
Marathi mr Deva
Malaiisch ms Latn
Maltesisch mt Latn
Nepalesisch ne Deva
Niederländisch nl Latn
Norwegisch no Latn
Polnisch pl Latn
Paschtu ps Arab
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Russisch ru Cyrl
Russisch (petrinische Orthografie) ru-PETR1708 Cyrl
Sanskrit sa Deva
Slowakisch sk Latn
Slowenisch sl Latn
Albanisch sq Latn
Serbisch sr Cyrl
Schwedisch sv Latn
Suaheli sw Latn
Tagalog tl Latn
Türkisch tr Latn
Ukrainisch uk Cyrl
Urdu ur Arab
Usbekisch uz Latn
Usbekisch (Kyrillisch) uz-Cyrl Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Chinesisch (vereinfacht) zh-Hans Hani
Chinesisch (traditionell) zh-Hant Hani
Zulu zu Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-foundation-model-v1.4-2025-02-05 Stabil GA Allgemein verfügbares Modell, das auf dem Gemini 2.0 Flash-LLM basiert. Enthält auch erweiterte OCR-Funktionen wie die Erkennung von Kästchen.
pretrained-foundation-model-v1.5-2025-05-05 Stabil GA Produktionsreifer Kandidat, der auf dem Gemini 2.5 Flash-LLM basiert. Empfohlen für Nutzer, die neuere Modelle ausprobieren möchten.
pretrained-foundation-model-v1.5-pro-2025-06-20 Stabil GA Produktionsreifes Modell, das auf dem Gemini 2.5 Pro-LLM basiert. Unterstützt ein Kontingent von bis zu 30 Seiten pro Minute für Onlineverarbeitungsanfragen. Dieses Modell bietet eine höhere Qualität als Version 1.5 und kann eine höhere Latenz aufweisen.
pretrained-foundation-model-v1.5.1-2025-08-07 Releasekandidat Öffentliche Vorschau Modell in der öffentlichen Vorschau, das auf dem LLM Gemini 2.5 Flash basiert. Dieses Modell hat dieselben Funktionen wie Version 1.5 und bietet ein verbessertes adaptives Few-Shot-Lernen.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Normalisierte Datentypen

Weitere Informationen finden Sie auf den Seiten Anreicherung und Normalisierung und Dataset erstellen.

Vollständige Liste der normalisierten Datentypen
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierter Extrahierer

Formularparser

Beschreibung

Zusätzlich zu OCR-Text können Sie allgemeine Schlüssel/Wert-Paare (Entität und Kästchen), Tabellen und allgemeine Entitäten aus Dokumenten extrahieren.

Dieser Prozessor nutzt fortschrittliche Technologien für maschinelles Lernen, um Schlüssel/Wert-Paare, Kästchen und Tabellen aus Dokumenten in mehr als 200 Sprachen zu extrahieren. Dieser Prozessor nutzt auch Deep-Learning-Modelle, um 11 generische Entitäten zu extrahieren, die in verschiedenen Dokumenttypen häufig vorkommen.

Kategorie Extrahieren
Funktionen OCR, Formularanalyse, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben FORM_PARSER_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Belarussisch be Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Koreanisch ko Kore
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Marathi mr Deva
Nepalesisch ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Reifegrad des Releases Zusätzliche Felder erkannt Beschreibung
pretrained-form-parser-v1.0-2020-09-23 Stabil GA

Keine

Legacy-Version Für optimale Qualität und den vollen Funktionsumfang sollten Sie den Formularparser v2.0 verwenden.
pretrained-form-parser-v2.0-2022-11-10 Stabil GA
Felder anzeigen
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
Empfohlene Version. Unterstützt generische Einheiten und umfasst ein aktualisiertes Tabellen-, KVP- und Kontrollkästchenmodell sowie mehr als 200 Sprachen.
pretrained-form-parser-v2.1-2023-06-26 Releasekandidat Öffentliche Vorschau

Keine

Version der öffentlichen Vorschau. Dasselbe Modell wie Version 2.0, aber mit aktivierter nativer Textextraktion aus digitalen PDF-Dateien.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 100
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Form Parser

Layoutparser

Beschreibung

Extrahiert Dokumentinhaltselemente (Text, Tabellen und Listen) und erstellt kontextsensitive Blöcke.

Der Layoutparser extrahiert Dokumentinhaltselemente wie Text, Tabellen und Listen und erstellt kontextsensitive Blöcke, die das Abrufen von Informationen in Anwendungen für generative KI und Discovery erleichtern.

Kategorie Extrahieren
Funktionen Layout-Parsing, Dokumentaufteilung
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben LAYOUT_PARSER_PROCESSOR
Hinweise
  • Dieser Parser unterstützt PDF-, HTML-, DOCX-, PPTX- und XLSX-/XLSM-Dateien.
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Afrikaans af Latn
Albanisch sq Latn
Arabisch ar Arab
Armenisch hy Armn
Belarussisch be Cyrl
Bengalisch bn Beng
Bengalisch bn Beng
Bulgarisch bg Cyrl
Katalanisch ca Latn
Chinesisch zh Hani
Kroatisch hr Latn
Tschechisch cs Latn
Dänisch da Latn
Niederländisch nl Latn
Englisch en Latn
Estnisch et Latn
Filipino fil Latn
Finnisch fi Latn
Französisch fr Latn
Deutsch de Latn
Griechisch el Grek
Gujarati gu Gujr
Hebräisch iw Hebr
Hindi hi Deva
Ungarisch hu Latn
Isländisch is Latn
Indonesisch id Latn
Italienisch it Latn
Japanisch ja Jpan
Kannada kn Knda
Khmer km Khmr
Koreanisch ko Kore
Lao lo Laoo
Lettisch lv Latn
Litauisch lt Latn
Mazedonisch mk Cyrl
Malaiisch ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalesisch ne Deva
Norwegisch no Latn
Persisch fa Arab
Polnisch pl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Punjabi pa Guru
Rumänisch ro Latn
Russisch ru Cyrl
Serbisch sr Cyrl
Slowakisch sk Latn
Slowenisch sl Latn
Spanisch es Latn
Schwedisch sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thailändisch th Thai
Türkisch tr Latn
Ukrainisch uk Cyrl
Vietnamesisch vi Latn
Jiddisch yi Hebr
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-layout-parser-v1.0-2024-06-03 Stabil GA Version mit allgemeiner Verfügbarkeit für die Analyse des Dokumentlayouts. Dies ist die Standardversion des vortrainierten Prozessors.
pretrained-layout-parser-v1.5-2025-08-25 Releasekandidat Öffentliche Vorschau Die Vorschauversion basiert auf dem Gemini 2.5 Flash-LLM und bietet eine bessere Layoutanalyse von PDF-Dateien. Empfohlen für Nutzer, die neue Versionen ausprobieren möchten. Wenn es für Nicht-PDF-Dateien verwendet wird, verhält es sich genauso wie die stabile Version von pretrained-layout-parser-v1.0-2024-06-03.
pretrained-layout-parser-v1.5-pro-2025-08-25 Releasekandidat Öffentliche Vorschau Die Vorschauversion basiert auf dem Gemini 2.5 Pro-LLM und bietet eine bessere Layoutanalyse von PDF-Dateien. Die Latenz von v1.5-pro ist höher als die von v1.5. Wenn es für Nicht-PDF-Dateien verwendet wird, verhält es sich wie die stabile Version 1.0.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 500
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us
Weitere Informationen Layout-Parser

Vortrainierte Prozessoren ansehen

Kontoauszugsparser

Beschreibung

Extrahiert Daten aus Kontoauszügen, einschließlich Name, Konto, Transaktionen usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben BANK_STATEMENT_PROCESSOR
Hinweise
  • Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Extraktion von Einheiten für das erste unterstützte Dokument durch. Wenn der Prozessor in der Eingabedatei keine anwendbaren Dokumente findet, gibt er eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-bankstatement-v1.0-2021-08-08 Stabil GA
pretrained-bankstatement-v1.1-2021-08-13 Stabil GA
pretrained-bankstatement-v2.0-2021-12-10 Stabil GA
pretrained-bankstatement-v3.0-2022-05-16 Stabil GA In dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Kontoauszug enthält. Im Gegensatz zur Standardversion wird in dieser Version die Eingabedatei nicht auf Kontoauszüge geprüft. Es wird kein Fehler zurückgegeben, wenn keine Kontoauszüge gefunden werden.
pretrained-bankstatement-v4.0-2023-07-31 Releasekandidat Öffentliche Vorschau
pretrained-bankstatement-v5.0-2023-12-06 Releasekandidat Öffentliche Vorschau

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 30
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • bank_address
  • bank_name
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Labeling-Anleitung In neuem Fenster öffnen
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

W2-Parser

Beschreibung

Extrahiert Daten aus Formular W2, einschließlich Arbeitnehmer, Arbeitgeber, Löhne usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben FORM_W2_PROCESSOR
Hinweise
  • Wenn eine Seite einer mehrseitigen Eingabedatei dem richtigen Dokumenttyp und einer der unterstützten Versionen entspricht, führt der Prozessor die Extraktion von Einheiten für das erste unterstützte Dokument durch. Wenn der Prozessor in der Eingabedatei keine anwendbaren Dokumente findet, gibt er eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • 2020 (Standard- und benutzerdefinierte Versionen)
  • 2019 (Standard- und benutzerdefinierte Versionen)
  • 2018 (Standard- und benutzerdefinierte Versionen)
Prozessorversionen
Versions-ID Version Reifegrad des Releases Zusätzliche Felder erkannt Beschreibung
pretrained-w2-v1.0-2020-10-01 Stabil GA

Keine

pretrained-w2-v1.1-2022-01-27 Stabil GA

Keine

pretrained-w2-v1.2-2022-01-28 Stabil GA
Felder anzeigen
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Qualitätsverbesserungen und Unterstützung neuer Felder; enthält keinen Splitter.

pretrained-w2-v2.0-2022-03-30 Releasekandidat Öffentliche Vorschau
Felder anzeigen
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Qualitätsverbesserungen und Unterstützung für Felder in Feld 12 sowie detaillierte Vorhersagen für EmployeeName, EmployeeAddress und EmployerNameAndAddress. Diese sind nicht mehr Teil der Ausgabe und werden durch zusätzliche Felder ersetzt.

pretrained-w2-v2.1-2022-06-08 Stabil GA
Felder anzeigen
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Ähnlich wie Version pretrained-w2-v2.0-2022-03-30, aber mit weiteren Qualitätsverbesserungen und einer zusätzlichen Entität EmployeeName_Suffix.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 15
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 15
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • EmployerNameAndAddress
  • EIN
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Parser für US-amerikanische Reisepässe

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben US_PASSPORT_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-us-passport-v1.0-2021-06-14 Stabil GA

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 2
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Dienstprogrammparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen von Energieversorgern, z. B. den Lieferantennamen und den zuvor bezahlten Betrag.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Eingeschränkt [*]
API eingeben UTILITY_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-utility-v1.1-2021-04-09 Stabil GA
pretrained-utility-v1.2-2022-12-15 Releasekandidat Öffentliche Vorschau

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 10
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 30
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Labeling-Anleitung In neuem Fenster öffnen
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Identity Document Proofing Parser

Beschreibung

Die Gültigkeit von Ausweisdokumenten anhand mehrerer Signale vorhersagen.

Der Identity Document Proofing-Prozessor wurde entwickelt, um die Gültigkeit von Identitätsdokumenten anhand von vier verschiedenen Signalen vorherzusagen.

Der Prozessor gibt derzeit Informationen aus den folgenden Signalen zurück:

  • fraud_signals_is_identity_document-Erkennung: Es wird vorhergesagt, ob ein Bild ein erkanntes Ausweisdokument enthält.
  • fraud_signals_suspicious_words-Erkennung: Es wird vorhergesagt, ob Wörter vorhanden sind, die für IDs untypisch sind.
  • fraud_signals_image_manipulation-Erkennung: Hier wird vorhergesagt, ob das Bild mit einem Bildbearbeitungstool verändert oder manipuliert wurde.
  • fraud_signals_online_duplicate-Erkennung: Es wird vorhergesagt, ob das Bild online gefunden werden kann (nur USA).

Kategorie Vortrainiert
Funktionen OCR, Qualitätsanalyse
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben ID_PROOFING_PROCESSOR
Hinweise
  • Die Funktion zur Online-Duplikaterkennung wird derzeit in US-Rechenzentren verarbeitet. Außerhalb der USA ist für diese Funktion keine regionale und multiregionale Unterstützung verfügbar.
  • Dieser Prozessor wird von Algorithmen unterstützt, die häufiger aktualisiert werden, als neue Prozessorversionen veröffentlicht werden. Aus diesem Grund kann der Prozessor im Laufe der Zeit unterschiedliche Ausgaben zurückgeben, auch wenn dieselbe Prozessorversion verwendet wird. Das System zur Online-Erkennung von Duplikaten überwacht beispielsweise Bilder im Web. Das Verhalten des Systems kann sich dann schneller ändern, als es in Prozessorversionen nachvollzogen werden kann.
  • Weitere Informationen finden Sie in den Anmerkungen zu verantwortungsbewusster KI[†] und zur Überprüfung durch Menschen.[‡]
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • Unterstützung für US-amerikanische Reisepässe, Passport Cards und Führerscheine.
Prozessorversionen
Versions-ID Version Reifegrad des Releases Zusätzliche Felder erkannt Beschreibung
pretrained-id-proofing-v1.0-2022-10-03 Stabil GA

Keine

pretrained-id-proofing-v1.1-2023-05-18 Releasekandidat Öffentliche Vorschau
Felder anzeigen
  • fraud_signals_photocopy_detection

Zusätzliches Signal zur Erkennung von Fotokopien

pretrained-id-proofing-v1.2-2023-10-04 Releasekandidat Öffentliche Vorschau
Felder anzeigen
  • fraud_signals_photocopy_detection

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 2
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Lohnabrechnungsparser

Beschreibung

Extrahiert Daten aus Lohnabrechnungen, einschließlich Name, Unternehmen, Beträge usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben PAYSTUB_PROCESSOR
Hinweise
  • Wenn das mehrseitige Eingabedokument mehrere gültige Gehaltsabrechnungen enthält, werden nur aus der ersten gültigen Gehaltsabrechnung Entitäten extrahiert. Wenn in der Eingabedatei keine Gehaltsabrechnungen gefunden werden, gibt der Prozessor eine Fehlermeldung zurück.
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Zusätzliche Felder erkannt Beschreibung
pretrained-paystub-v1.0-2021-03-19 Stabil GA

Keine

pretrained-paystub-v1.1-2021-08-13 Stabil GA
Felder anzeigen
  • net_pay
  • net_pay_ytd
  • employee_account_number
Qualitätsverbesserung und Unterstützung neuer Felder
pretrained-paystub-v1.2-2021-12-10 Stabil GA

Keine

pretrained-paystub-v2.0-2022-05-17 Releasekandidat Öffentliche Vorschau
Felder anzeigen
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Bei dieser Version wird davon ausgegangen, dass die Eingabedatei einen einzelnen Gehaltszettel enthält. Im Gegensatz zur Standardversion wird in dieser Version die Eingabedatei nicht auf Gehaltsabrechnungen geprüft. Es wird kein Fehler zurückgegeben, wenn keine Gehaltsabrechnungen gefunden werden.

Qualitätsverbesserung, Unterstützung neuer Felder und neues Schema. Bonus, Provisionen, Feiertage, Überstunden, reguläre Vergütung und Urlaub sind jetzt Teil von earning_item/earning_this_period und die entsprechenden Werte seit Jahresbeginn sind in earning_item/earning_ytd enthalten. „Direct Deposit“ (Direkte Einzahlung) und „Employee Account Number“ (Mitarbeiterkontonummer) sind jetzt unter „direct_deposit_item“ verschachtelt.

Das asynchrone Seitenlimit beträgt 10.

pretrained-paystub-v2.0-2022-07-22 Stabil GA

Keine

Qualitätsverbesserung und Verbesserungen beim Uptraining.

pretrained-paystub-v3.0-2023-12-06 Releasekandidat Öffentliche Vorschau

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 50
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 30
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • employer_address
  • employer_name
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Labeling-Anleitung In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Parser für US-Führerschein

Beschreibung

Extrahiert Felder wie Name, Ausweis-ID, Geburtsdatum usw.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben US_DRIVER_LICENSE_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Unterstützte Formulare/Versionen
  • Unterstützt alle 50 Bundesstaaten und DC.
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-us-driver-license-v1.0-2021-06-14 Stabil GA

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 2
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 2
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 2
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • eu
  • us

Kostenparser

Beschreibung

Extrahiert Text und Werte aus Ausgabendokumenten, z. B. Ausgabendatum, Lieferantenname, Gesamtbetrag und Währung.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben EXPENSE_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Deutsch de Latn
Englisch en Latn
Spanisch es Latn
Französisch fr Latn
Japanisch ja Jpan
Niederländisch nl Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Zusätzliche Felder erkannt Unterstützung weiterer Sprachen Beschreibung
pretrained-expense-v1.1-2021-04-09 Stabil GA

Keine

Keine

Eingeführt im April 2021
pretrained-expense-v1.3.2-2024-09-11 Releasekandidat Öffentliche Vorschau
Felder anzeigen
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Japanisch
Ein Upgrade auf Version 1.3 mit einem verbesserten zugrunde liegenden Vision-Modell.
pretrained-expense-v1.4-2022-11-18 Releasekandidat Öffentliche Vorschau
Felder anzeigen
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japanisch
  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
Leistungsverbesserungen und Unterstützung für das Uptraining. Das Limit für die maximale Anzahl von Seiten (Online-/Synchronanfragen) wurde auf 15 erhöht.
pretrained-expense-v1.4.2-2024-09-12 Releasekandidat Öffentliche Vorschau
Felder anzeigen
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japanisch
  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
Ein Upgrade auf Version 1.4 mit einem verbesserten zugrunde liegenden Vision-Modell.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 10
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 10
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 10
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • supplier_address
  • supplier_name
  • supplier_phone
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Labeling-Anleitung In neuem Fenster öffnen
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Rechnungsparser

Beschreibung

Extrahiert Text und Werte aus Rechnungen, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum.

Der Rechnungs-Parser extrahiert sowohl Kopf- als auch Positionsfelder, z. B. Rechnungsnummer, Lieferantenname, Rechnungsbetrag, Steuerbetrag, Rechnungsdatum, Fälligkeitsdatum und Positionsbeträge.

Kategorie Vortrainiert
Funktionen OCR, Entitätsextraktion
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben INVOICE_PROCESSOR
Unterstützte Sprachen
Vollständige Liste der Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Deutsch de Latn
Englisch en Latn
Spanisch es Latn
Estnisch et Latn
Französisch fr Latn
Italienisch it Latn
Lettisch lv Latn
Litauisch lt Latn
Niederländisch nl Latn
Portugiesisch (Portugal und Brasilien) pt Latn
Rumänisch ro Latn
Schwedisch sv Latn
Prozessorversionen
Versions-ID Version Reife des Releases Unterstützung für weitere Sprachen Beschreibung
pretrained-invoice-v1.1-2021-04-09 Stabil GA

Keine

pretrained-invoice-v1.2-2022-02-18 Stabil GA

Keine

Die Einstellung ist für bald geplant.
pretrained-invoice-v1.3-2022-07-15 Stabil GA
  • it: Italienisch
  • pt: Portugiesisch (Portugal und Brasilien)
  • ro: Rumänisch
  • sv: Schwedisch
  • et: Estnisch
  • lv: Lettisch
  • lt: Litauisch
Prozessorversion, die neu trainiert werden kann. Die maximale Anzahl von Seiten (Online-/Synchronanfragen) wurde auf 15 erhöht.
pretrained-invoice-v1.4-2022-10-21 Releasekandidat Öffentliche Vorschau

Keine

Prozessorversion, die neu trainiert werden kann. Die maximale Anzahl von Seiten (Online-/Synchronanfragen) wurde auf 15 erhöht.
pretrained-invoice-v1.5-2023-09-15 Releasekandidat Öffentliche Vorschau

Keine

pretrained-invoice-v2.0-2023-12-06 Releasekandidat Öffentliche Vorschau

Keine

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 30
In der frühesten Version erkannte Felder

Sie finden diese Informationen auch auf der Seite Erkanntes Feld.

Vollständige Liste der Felder
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Angereicherte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der angereicherten Felder
  • supplier_address
  • supplier_name
  • supplier_phone
Normalisierte Felder

Weitere Informationen finden Sie auf der Seite Anreicherung und Normalisierung.

Vollständige Liste der normalisierten Felder
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Labeling-Anleitung In neuem Fenster öffnen
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Dokumente klassifizieren

Benutzerdefinierter Klassifikator

Beschreibung

Modell trainieren, um einen Dokumenttyp aus einer Reihe von Klassen zu klassifizieren.

Kategorie Klassifizieren
Funktionen OCR, Klassifizierung
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_CLASSIFICATION_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-foundation-model-v1.4-2025-05-16 Releasekandidat Öffentliche Vorschau Release-Kandidat, der auf dem Gemini 2.0 Flash-LLM basiert. Enthält auch erweiterte OCR-Funktionen.
pretrained-classifier-v1.5-2025-08-05 Releasekandidat Öffentliche Vorschau Release-Kandidat, der auf dem LLM Gemini 2.5 Flash basiert. Enthält auch erweiterte OCR-Funktionen.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 200
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierten Klassifizierungsprozessor erstellen

Benutzerdefinierter Splitter

Beschreibung

Trainieren Sie ein Modell, um eine Datei mit mehreren Dokumenten in einzelne, klassifizierte Dokumente aufzuteilen.

Kategorie Klassifizieren
Funktionen OCR, Klassifizierung, Aufteilung
Releasestufe General Availability
Zugriffsstatus Öffentlich
API eingeben CUSTOM_SPLITTING_PROCESSOR
Hinweise
  • i18n kann nur über benutzerdefinierte Trainingsoptionen unterstützt werden.
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-splitter-v1.5-2025-07-14 Releasekandidat Öffentliche Vorschau Release-Kandidat, der auf dem LLM Gemini 2.5 Flash basiert. Dieses vortrainierte Modell kann ohne vorheriges Training verwendet werden. Es unterstützt Zero-Shot-Aufteilung und ‑Klassifizierung.

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 1000
Maximale Anzahl an Seiten (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Weitere Informationen Benutzerdefinierten Splitterprozessor erstellen

Dokumente zusammenfassen

Summarizer

Beschreibung

Sie können Zusammenfassungen in Form von Kurzfassungen und Stichpunkten für kurze und lange Dokumente abrufen.

Kategorie vorab trainiert
Funktionen Zusammenfassen
Releasestufe Vorschau
Zugriffsstatus Öffentlich
API eingeben SUMMARY_PROCESSOR
Unterstützte Sprachen
Sprache BCP 47-Tag Skript Handschrift wird unterstützt
Englisch en Latn
Prozessorversionen
Versions-ID Version Reifegrad des Releases Beschreibung
pretrained-foundation-model-v1.0-2023-08-22 Stabil GA Foundation Model von Google

Weitere Informationen finden Sie unter Prozessorversionen verwalten.

Kontingente und Limits
Maximale Anzahl von Seiten (Online-/synchrone Anfragen): 15
Maximale Anzahl von Seiten (Batch-/Offline-/asynchrone Anfragen): 250
Maximale Seitenzahl (Onlinemodus ohne Bilder/synchrone Anfragen): 30
Uptraining
Beispiel für Eingabedatei In neuem Fenster öffnen
Beispielausgabe In neuem Fenster öffnen
Unterstützte Regionen
  • us
Weitere Informationen Benutzerdefinierte Zusammenfassung

Fußnoten

[*] Dieser Prozessor ist nur für Kunden mit eingeschränktem Zugriff verfügbar.

Wenn Sie den API-Zugriff anfordern möchten, füllen Sie das Kundenanfrageformular für eingeschränkten Zugriff auf Document AI aus und senden Sie es ab. Im Formular müssen Sie Informationen über sich, Ihr Unternehmen und Ihren Anwendungsfall angeben. Beachten Sie, dass eine Google Cloud-Projekt-ID für den Zugriff erforderlich ist. Halten Sie sich an diese Anleitung, um ein neues Google Cloud-Projekt zu erstellen oder die Projekt-ID eines vorhandenen Projekts zu ermitteln.

Nachdem Sie das Formular gesendet haben, prüft das Document AI-Team Ihre Anfrage, um sicherzustellen, dass Sie die Kriterien für den Zugriff erfüllen. Bei Genehmigung erhalten Sie eine E-Mail mit einer Anleitung dazu, wie Sie auf das Feature zugreifen und es verwenden können.

[†] Beim Identitätsnachweis werden Informationen aus Ausweisdokumenten extrahiert und ausgewertet, um festzustellen, ob das Eingabebild einen authentischen Ausweis darstellt.

Bei Google Cloudist es uns wichtig, Kunden bei der sicheren Entwicklung und Implementierung von KI-Lösungen zu unterstützen. Die Funktion „Identitätsnachweis“ wurde in Übereinstimmung mit den KI-Grundsätzen von Google entwickelt.

Gemäß den KI‑Grundsätzen von Google und dem aktuellen Produktdesign empfehlen wir dringend, Vorsicht walten zu lassen und die potenziellen Vorteile und Risiken der Verwendung der Funktion „Ausweisdokumentprüfung“ für die folgenden Zwecke sorgfältig abzuwägen:

  • Entscheidungsfindung ohne menschliche Beteiligung bei Vorhersagen, die sich auf Menschenrechte auswirken können.
  • In sensiblen Bereichen wie Beschäftigung, Zugang zu öffentlichen Diensten, Gesundheitswesen und sicherheitskritischen Kontexten.

[‡] Verwenden Sie die Identitätsüberprüfung immer als Teil Ihres umfassenderen Prozesses und Workflows zur Identitätserkennung. Es ist wichtig, dass Sie einen menschlichen Prüfer in Ihrem Workflow haben, um zu überprüfen, ob die vorhergesagten Signale korrekt sind. Der Identity Proofing-Prozessor soll die manuelle Überprüfung von Ausweisen in einem Workflow nicht ersetzen, sondern Prüfer bei der Validierung von Ausweisdokumenten unterstützen. Der Identity Proofing-Prozessor sollte nicht als automatisiertes Entscheidungstool verwendet werden, um festzustellen, ob ein Ausweis gültig ist. Durch die manuelle Überprüfung können Kunden eine höhere Genauigkeit bei der Dokumentenverarbeitung erzielen und Unternehmen bei der Bewertung von Vorhersagen helfen, indem sie speziell entwickelte Tools verwenden, die diese Überprüfungen ermöglichen.

Prüfen Sie die rechtlichen Vorgaben in der Region, in der Sie diese Technologie einsetzen, und informieren Sie sich über vorhandene Branchenrichtlinien, um mehr über Richtlinien und häufig auftretende Probleme im Zusammenhang mit Fairness zu erfahren. Hier finden Sie Informationen zur Fairness beim maschinellen Lernen, einschließlich Möglichkeiten, Verzerrungen in Trainingsdatensätzen zu reduzieren, Ihre benutzerdefinierten Modelle auf Leistungsunterschiede zu bewerten und andere Aspekte zu berücksichtigen, wenn Sie Ihr benutzerdefiniertes Modell verwenden.

Wir empfehlen unseren Kunden, bei der Implementierung der Identitätsüberprüfung Best Practices für Fairness, Interpretierbarkeit, Datenschutz und Sicherheit zu berücksichtigen. Weitere Informationen zur Implementierung von verantwortungsbewusster KI finden Sie in den Empfehlungen von Google für die verantwortungsbewusste Anwendung von KI.

Weitere Informationen zu Anwendungsfällen und ein Beispiel für ein Anwendungs-Code-Repository finden Sie im Blogpost Automate identity document processing with Document AI.