Validação e correção

Você pode usar a Document AI para definir regras de negócios personalizadas para validar os resultados do processamento de documentos. A validação é um processo de processamento de documentos que executa suas regras de validação nas entidades extraídas finais. A correção é um processo opcional que tenta melhorar os resultados da extração com base nos resultados da regra de validação, aumentando a acurácia da extração.

As regras de validação podem, por exemplo, verificar se a soma dos preços dos itens de linha é igual ao valor total, verificar a consistência do campo em vários documentos ou garantir que os campos extraídos estejam alinhados espacialmente em um layout (como em um bloco horizontal). Defina regras de negócios usando a Common Expression Language (CEL) e gere-as a partir de comandos de linguagem natural.

Ativar validação e correção

Você pode ativar a validação e a correção de forma independente no console da Document AI. Essas configurações se aplicam a todas as solicitações processDocument da versão do processador selecionada. No entanto, é possível substituir esse comportamento para solicitações individuais usando parâmetros na chamada de API processDocument.

As configurações de validação e correção, incluindo regras de validação, são específicas para cada versão do processador. Todas as versões de processador pré-treinadas gerenciadas pelo Google compartilham uma configuração de base comum. Ao criar uma nova versão de processador personalizado (por exemplo, por ajuste fino), a Document AI duplica a configuração de base, anexando-a à nova versão.

Quando a validação está ativada, os resultados de todas as regras de validação definidas são incluídos na resposta ProcessDocument para solicitações síncronas e em lote. A correção só pode ser ativada se a validação também estiver ativada. A Document AI executa o processo de correção somente se pelo menos uma regra de validação falhar para um determinado documento. Após a correção, a Document AI executa novamente o processo de validação para fornecer os resultados finais. Os resultados da validação pré e pós-correção estão disponíveis na resposta processDocument em uma lista de revisões.

Regras de validação de CEL

As regras de validação são definidas usando expressões baseadas na Common Expression Language (CEL). A CEL é uma linguagem de expressão não completa de Turing projetada para simplicidade e segurança. Exemplos de regras que você pode definir:

  • A soma dos campos A é igual ao campo B.
  • O campo B corresponde a um padrão de expressão regular especificado.
  • Todos os subcampos de cada entidade pai estão alinhados horizontalmente.

Para simplificar a criação de regras, gere regras de CEL fornecendo comandos em linguagem natural. Essa abordagem evita as complexidades da sintaxe CEL. A implementação da CEL na Document AI pode ter pequenas diferenças em relação à especificação padrão. Para descrições e exemplos detalhados, consulte a referência de regras de CEL.

Ativar a validação no Google Cloud console

  1. Noconsole de um processador atual, selecione a entrada Validação e correção. Google Cloud

    ce-validation-1

  2. Antes de processar um documento, acesse Gerenciamento de regras.

    ce-validation-2

  3. Selecione a opção Ativar validação.

  4. Opcional: selecione a opção Ativar correção.

Criação da regra

  1. Clique em Adicionar regra.

    ce-validation-6

  2. No formulário de criação de regras, insira um comando de linguagem natural.

    ce-validation-5

  3. Dê um nome à regra e use Common Expression Language (CEL) para definir o comportamento.

  4. Opcional. Use as opções Editar ou Excluir para gerenciar as regras atuais.

Copiar a configuração entre processadores

  1. Na seção Gerenciamento de regras, clique em Copiar para outro PV.

    ce-validation-4

  2. Selecione o nome e a versão do processador para copiar a configuração.

    ce-validation-3

Resultados da regra

  1. Na página Gerenciar conjunto de dados, navegue até Gerenciamento de regras.

    ce-validation-7

  2. Avalie o total de testes aprovados e reprovados.

  3. Confira um detalhamento dos resultados de regras individuais.

  4. Você pode comparar as mudanças para ver novas entidades criadas após a correção em verde e entidades modificadas em amarelo.

    ce-validation-8

  5. Na seção Avaliar e testar, haverá colunas para pontuações antes e depois de ativar a correção.

    ce-validation-9

Avaliação

As avaliações da versão do processador incluem métricas importantes para resultados pós-correção e pré-correção, se a correção estiver ativada. Use essas métricas para avaliar o impacto do processo de correção na qualidade da extração.

A seguir