Este documento descreve como gerenciar os esquemas de documentos no Document AI Warehouse, incluindo operações de criação, busca, listagem, atualização e exclusão.
O que são esquemas de documentos
Cada documento é de um determinado tipo e é especificado por um esquema.
Um esquema de documento define a estrutura de um tipo de documento (por exemplo, fatura ou comprovante de pagamento) no Document AI Warehouse, em que os administradores podem especificar propriedades de diferentes tipos de dados (texto, numérico, data, enumeração).
As propriedades são usadas para representar os dados extraídos, as tags de classificação ou outras tags comerciais anexadas aos documentos por IA ou usuários humanos, por exemplo, Invoice_Amount (numérico), Due_Date (data) ou Supplier_Name (texto).
Atributos da propriedade:cada propriedade pode ser declarada como
Filtrável: pode ser usado para filtrar resultados da pesquisa.
Pesquisável: indexado para que possa ser encontrado em consultas de pesquisa
Obrigatório:
requiredé usado para garantir que a propriedade exista no documento. Recomendamos salvar a maioria das propriedades comorequired = false, a menos que a propriedade seja obrigatória.
Esquema extensível:em alguns casos, os usuários finais com acesso de edição precisam adicionar / excluir novas propriedades de esquema em documentos. Isso é compatível com uma "propriedade MAP", que é uma lista de pares de chave-valor.
Cada par de chave-valor em uma propriedade MAP pode ser um tipo de dados (texto | numérico | data | enumeração).
Por exemplo, "Invoice" pode conter uma propriedade de mapa "Invoice_Entities" com os seguintes pares de chave-valor:
Invoice_Amount (numérico) 1000
Due_Date (date) 24/12/2021
Supplier_Name (texto) ABC Corp
Imutabilidade do esquema:observe que o esquema ou as propriedades do esquema podem ser adicionados, mas não podem ser editados ou excluídos no momento. Portanto, defina o esquema com cuidado.
Antes de começar
Antes de começar, confira se você concluiu a página de início rápido.
criar um esquema
Crie um esquema de documento.
REST
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--data '{
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_searchable": true,
"is_repeatable": true,
"text_type_options": {}
}
]
}'Python
Para mais informações, consulte a documentação de referência da API Python da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para mais informações, consulte a documentação de referência da API Java da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para mais informações, consulte a documentação de referência da API Node.js da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Receber um esquema
Receba detalhes de um esquema de documento.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Para mais informações, consulte a documentação de referência da API Python da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para mais informações, consulte a documentação de referência da API Java da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para mais informações, consulte a documentação de referência da API Node.js da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Listar esquemas
Listar esquemas de documentos.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Para mais informações, consulte a documentação de referência da API Python da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para mais informações, consulte a documentação de referência da API Java da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Excluir um esquema
Excluir um esquema de documento.
REST
curl --request DELETE --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Para mais informações, consulte a documentação de referência da API Python da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para mais informações, consulte a documentação de referência da API Java da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para mais informações, consulte a documentação de referência da API Node.js da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Atualizar um esquema
Atualiza um esquema de documento. No momento, a lógica de atualização só permite adicionar novas definições de propriedade. O novo esquema de documento precisa incluir todas as definições de propriedade presentes no esquema atual.
Compatíveis:
- Para propriedades atuais, os usuários podem mudar as seguintes configurações de metadados:
is_repeatable,is_metadata,is_required. - Para propriedades ENUM atuais, os usuários podem adicionar ou excluir valores possíveis. É possível atualizar a flag
EnumTypeOptions.validation_check_disabledpara desativar a verificação de validação. A verificação de validação é usada para garantir que os valores ENUM especificados nos documentos estejam no intervalo de valores ENUM possíveis definidos na definição da propriedade ao chamar a APICreateDocument. - É possível adicionar novas definições de propriedade.
- Para propriedades atuais, os usuários podem mudar as seguintes configurações de metadados:
Sem suporte:
- Para esquemas atuais, não é permitido atualizar
display_nameedocument_is_folder. - Para propriedades atuais, não é permitido atualizar
name,display_nameevalue_type_options.
- Para esquemas atuais, não é permitido atualizar
REST
curl --request PATCH --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" \
--data '{
"document_schema": {
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_repeatable": true,
"text_type_options": {}
}
]
}
}'Python
Para mais informações, consulte a documentação de referência da API Python da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para mais informações, consulte a documentação de referência da API Java da Document AI Warehouse.
Para autenticar no Document AI Warehouse, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Próximas etapas
- Acesse Gerenciar documentos para saber como fazer isso.