Ce document explique comment gérer les schémas de documents dans Document AI Warehouse, y compris les opérations de création, de récupération, de liste, de mise à jour et de suppression.
Que sont les schémas de document ?
Chaque document est d'un certain type et est spécifié par un schéma.
Un schéma de document définit la structure d'un type de document (par exemple, "Facture" ou "Bulletin de salaire") dans Document AI Warehouse, où les administrateurs peuvent spécifier des propriétés de différents types de données (texte, numérique, date ou énumération).
Les propriétés sont utilisées pour représenter les données extraites, les tags de classification ou d'autres tags métier ajoutés aux documents par l'IA ou des utilisateurs humains (par exemple, Invoice_Amount (numérique), Due_Date (date) ou Supplier_Name (texte)).
Attributs de propriété : chaque propriété peut être déclarée comme
Filtrable : peut être utilisé pour filtrer les résultats de recherche
Inclus dans l'index de recherche : indexé pour pouvoir être trouvé dans les requêtes de recherche
Obligatoire :
requiredpermet de s'assurer que la propriété existe dans le document. (Nous vous recommandons d'enregistrer la plupart des propriétés en tant querequired = false, sauf si la propriété est obligatoire.)
Schéma extensible : dans certains cas, les utilisateurs finaux disposant d'un accès en modification doivent ajouter ou supprimer des propriétés de schéma dans les documents. Cette opération est possible grâce à une "propriété MAP", qui est une liste de paires clé/valeur.
Chaque paire clé/valeur d'une propriété MAP peut être un type de données (texte, numérique, date ou énumération).
Par exemple, "Facture" peut contenir une propriété de mappage "Invoice_Entities" avec les paires clé-valeur suivantes :
Invoice_Amount (numérique) 1000
Due_Date (date) 12/24/2021
Supplier_Name (text) ABC Corp
Immuabilité du schéma : notez que vous pouvez ajouter des schémas ou des propriétés de schéma, mais que vous ne pouvez pas les modifier ni les supprimer pour le moment. Définissez donc le schéma avec soin.
Avant de commencer
Avant de commencer, assurez-vous d'avoir consulté la page Démarrage rapide.
Créer un schéma
Créez un schéma de document.
REST
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--data '{
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_searchable": true,
"is_repeatable": true,
"text_type_options": {}
}
]
}'Python
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Python.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Java.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Node.js.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Obtenir un schéma
Obtenez les détails d'un schéma de document.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Python.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Java.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Node.js.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Lister les schémas
Répertorie les schémas de document.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Python.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Java.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Supprimer un schéma
Supprimez un schéma de document.
REST
curl --request DELETE --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Python.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Java.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Node.js.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Mettre à jour un schéma
Mettre à jour un schéma de document Actuellement, la logique de mise à jour n'est compatible qu'avec l'ajout de définitions de propriétés. Le nouveau schéma de document doit inclure toutes les définitions de propriétés présentes dans le schéma existant.
Types compatibles :
- Pour les propriétés existantes, les utilisateurs peuvent modifier les paramètres de métadonnées suivants :
is_repeatable,is_metadata,is_required. - Pour les propriétés ENUM existantes, les utilisateurs peuvent ajouter ou supprimer des valeurs ENUM possibles. Il peut modifier l'indicateur
EnumTypeOptions.validation_check_disabledpour désactiver la vérification de la validation. La vérification de la validation permet de s'assurer que les valeurs ENUM spécifiées dans les documents se trouvent dans la plage des valeurs ENUM possibles définies dans la définition de la propriété lors de l'appel de l'APICreateDocument. - Il est possible d'ajouter des définitions de propriétés.
- Pour les propriétés existantes, les utilisateurs peuvent modifier les paramètres de métadonnées suivants :
Formats non compatibles :
- Pour les schémas existants, les modifications apportées à
display_nameetdocument_is_folderne sont pas autorisées. - Pour les propriétés existantes, les modifications apportées à
name,display_nameetvalue_type_optionsne sont pas autorisées.
- Pour les schémas existants, les modifications apportées à
REST
curl --request PATCH --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" \
--data '{
"document_schema": {
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_repeatable": true,
"text_type_options": {}
}
]
}
}'Python
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Python.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour en savoir plus, consultez la documentation de référence de l'API Document AI Warehouse Java.
Pour vous authentifier auprès de Document AI Warehouse, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Étapes suivantes
- Consultez Gérer les documents pour découvrir comment gérer les documents.