In diesem Dokument wird beschrieben, wie Sie die Dokumentschemas in Document AI Warehouse verwalten, einschließlich der Vorgänge zum Erstellen, Abrufen, Auflisten, Aktualisieren und Löschen.
Was sind Dokumentschemas?
Jedes Dokument hat einen bestimmten Dokumenttyp und wird durch ein Schema angegeben.
Ein Dokumentschema definiert die Struktur für einen Dokumenttyp (z. B. „Rechnung“ oder „Gehaltsabrechnung“) in Document AI Warehouse. Administratoren können Eigenschaften verschiedener Datentypen (Text | Numerisch | Datum | Aufzählung) angeben.
Eigenschaften werden verwendet, um die extrahierten Daten, Klassifizierungstags oder andere Geschäftstags darzustellen, die von KI oder menschlichen Nutzern an Dokumente angehängt werden, z. B. Invoice_Amount (numerisch), Due_Date (Datum) oder Supplier_Name (Text).
Property-Attribute:Jede Property kann als
Filterbar: Kann zum Filtern von Suchergebnissen verwendet werden.
Suchbar: Der Inhalt ist indexiert und kann in Suchanfragen gefunden werden.
Erforderlich –
requiredwird verwendet, um sicherzustellen, dass die Property im Dokument vorhanden ist. Wir empfehlen, die meisten Properties alsrequired = falsezu speichern, sofern die Property nicht erforderlich ist.
Erweiterbares Schema:In einigen Fällen müssen Endnutzer mit Bearbeitungszugriff neue Schemaeigenschaften zu Dokumenten hinzufügen oder daraus löschen. Dies wird durch eine „MAP-Eigenschaft“ unterstützt, die eine Liste von Schlüssel/Wert-Paaren ist.
Jedes Schlüssel/Wert-Paar in einer MAP-Eigenschaft kann einen Datentyp vom Typ „Text“, „Numeric“, „Date“ oder „Enumeration“ haben.
Die Rechnung kann beispielsweise die Map-Eigenschaft „Invoice_Entities“ mit den folgenden Schlüssel/Wert-Paaren enthalten:
Invoice_Amount (numerisch) 1000
Due_Date (date) 12/24/2021
Supplier_Name (text) ABC Corp
Unveränderlichkeit des Schemas:Schemata oder Schemaeigenschaften können hinzugefügt, aber derzeit nicht bearbeitet oder gelöscht werden. Definieren Sie Schemata daher sorgfältig.
Hinweise
Bevor Sie beginnen, müssen Sie die Seite Schnellstart durcharbeiten.
Schema erstellen
Dokumentschema erstellen
REST
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--data '{
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_searchable": true,
"is_repeatable": true,
"text_type_options": {}
}
]
}'Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Python API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Java API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Node.js API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Schema abrufen
Details zu einem Dokumentschema abrufen.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Python API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Java API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Node.js API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Schemas auflisten
Dokumentschemas auflisten
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Python API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Java API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Schema löschen
Dokumentschema löschen
REST
curl --request DELETE --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Python API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Java API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Node.js API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Schema aktualisieren
Dokumentschema aktualisieren. Derzeit unterstützt die Aktualisierungslogik nur das Hinzufügen neuer Property-Definitionen. Das neue Dokumentschema sollte alle Attributdefinitionen des vorhandenen Schemas enthalten.
Unterstützt:
- Bei vorhandenen Properties können Nutzer die folgenden Metadateneinstellungen ändern:
is_repeatable,is_metadata,is_required. - Bei vorhandenen ENUM-Eigenschaften können Nutzer neue mögliche ENUM-Werte hinzufügen oder vorhandene mögliche ENUM-Werte löschen. Sie können das Flag
EnumTypeOptions.validation_check_disabledaktualisieren, um die Validierungsprüfung zu deaktivieren. Mit der Validierungsprüfung wird sichergestellt, dass die in den Dokumenten angegebenen ENUM-Werte im Bereich der möglichen ENUM-Werte liegen, die in der Property-Definition beim Aufrufen derCreateDocumentAPI definiert sind. - Das Hinzufügen neuer Attributdefinitionen wird unterstützt.
- Bei vorhandenen Properties können Nutzer die folgenden Metadateneinstellungen ändern:
Nicht unterstützt:
- Bei vorhandenen Schemas sind Aktualisierungen von
display_nameunddocument_is_foldernicht zulässig. - Bei bestehenden Properties sind keine Aktualisierungen von
name,display_nameundvalue_type_optionszulässig.
- Bei vorhandenen Schemas sind Aktualisierungen von
REST
curl --request PATCH --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" \
--data '{
"document_schema": {
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_repeatable": true,
"text_type_options": {}
}
]
}
}'Python
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Python API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Weitere Informationen finden Sie in der Referenzdokumentation zur Document AI Warehouse Java API.
Richten Sie zur Authentifizierung bei Document AI Warehouse die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.