En este documento, se describe cómo administrar los esquemas de documentos en Document AI Warehouse, incluidas las operaciones de creación, recuperación, enumeración, actualización y eliminación.
Qué son los esquemas de documentos
Cada documento es de un tipo determinado y se especifica con un esquema.
Un esquema de documento define la estructura de un tipo de documento (por ejemplo, factura o recibo de sueldo) en Document AI Warehouse, en el que los administradores pueden especificar propiedades de diferentes tipos de datos (texto, numérico, fecha o enumeración).
Las propiedades se usan para representar los datos extraídos, las etiquetas de clasificación o cualquier otra etiqueta comercial que los usuarios humanos o la IA agregan a los documentos, por ejemplo, Invoice_Amount (numérico), Due_Date (fecha) o Supplier_Name (texto).
Atributos de propiedad: Cada propiedad se puede declarar como
Se puede filtrar: Se puede usar para filtrar los resultados de la búsqueda.
Se puede buscar: Está indexado para que se pueda encontrar en las búsquedas.
Obligatorio:
requiredse usa para garantizar que la propiedad exista en el documento (recomendamos guardar la mayoría de las propiedades comorequired = false, a menos que la propiedad sea obligatoria).
Esquema extensible: En algunos casos, los usuarios finales con acceso de edición deben agregar o borrar propiedades de esquema nuevas en los documentos. Esto se admite con una "propiedad MAP", que es una lista de pares clave-valor.
Cada par clave-valor de una propiedad MAP puede ser de un tipo de datos (texto, numérico, fecha o enumeración).
Por ejemplo, la factura puede contener una propiedad de mapa "Invoice_Entities" con los siguientes pares clave-valor:
Invoice_Amount (numérico) 1000
Due_Date (fecha) 24/12/2021
Supplier_Name (texto) ABC Corp
Inmutabilidad del esquema: Ten en cuenta que se pueden agregar esquemas o propiedades de esquemas, pero actualmente no se pueden editar ni borrar, por lo que debes definir el esquema con cuidado.
Antes de comenzar
Antes de comenzar, asegúrate de haber completado la página de Inicio rápido.
Crea un esquema
Crea un esquema de documento.
REST
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--data '{
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_searchable": true,
"is_repeatable": true,
"text_type_options": {}
}
]
}'Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Python.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Java.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Node.js.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Obtén un esquema
Obtiene detalles del esquema de un documento.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Python.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Java.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Node.js.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Enumerar esquemas
Enumera los esquemas de documentos.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Python.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Java.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Borra un esquema
Borra un esquema de documento.
REST
curl --request DELETE --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Python.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Java.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Node.js.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Actualiza un esquema
Actualiza un esquema de documento. Actualmente, la lógica de actualización solo admite la adición de nuevas definiciones de propiedades. El nuevo esquema de documento debe incluir todas las definiciones de propiedad presentes en el esquema existente.
Compatibles:
- En el caso de las propiedades existentes, los usuarios pueden cambiar los siguientes parámetros de configuración de metadatos:
is_repeatable,is_metadatayis_required. - En el caso de las propiedades ENUM existentes, los usuarios pueden agregar o borrar valores posibles de ENUM. Pueden actualizar la marca
EnumTypeOptions.validation_check_disabledpara inhabilitar la verificación de validación. La verificación de validación se usa para asegurarse de que los valores de ENUM especificados en los documentos estén dentro del rango de valores de ENUM posibles definidos en la definición de la propiedad cuando se llama a la API deCreateDocument. - Se admite la adición de nuevas definiciones de propiedades.
- En el caso de las propiedades existentes, los usuarios pueden cambiar los siguientes parámetros de configuración de metadatos:
No compatibles:
- En el caso de los esquemas existentes, no se permiten las actualizaciones de
display_nameydocument_is_folder. - En el caso de las propiedades existentes, no se permiten las actualizaciones de
name,display_nameyvalue_type_options.
- En el caso de los esquemas existentes, no se permiten las actualizaciones de
REST
curl --request PATCH --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" \
--data '{
"document_schema": {
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_repeatable": true,
"text_type_options": {}
}
]
}
}'Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Python.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Java
Para obtener más información, consulta la documentación de referencia de la API de Document AI Warehouse Java.
Para autenticarte en Document AI Warehouse, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Próximos pasos
- Continúa a Administrar documentos para obtener información sobre cómo administrar documentos.