Extrator personalizado com IA generativa

Detecção de campo derivado e assinatura

O recurso de campos derivados da prévia pública permite que os clientes da Document AI configurem um campo para ser preenchido por inferência ou geração inteligente com base no contexto do documento, em vez de extração direta de texto.

Esta versão também adiciona outro recurso para detectar a presença de assinaturas em documentos. Você pode usar o novo tipo de entidade signature para especificar um esquema para essas entidades. As entidades de assinatura são derivadas usando pistas visuais do documento.

Campos derivados no extrator personalizado

O extrator personalizado oferece suporte a campos derivados nos seguintes modelos:

  • pretrained-foundation-model-v1.4-2025-02-05 como disponibilidade geral (DG)
  • pretrained-foundation-model-v1.5-2025-05-05 como prévia
  • pretrained-foundation-model-v1.5-pro-2025-06-20 como prévia

É possível ativar esses recursos na UI do console ao criar ou editar rótulos no esquema do documento.

Campos derivados é um recurso eficiente que permite extrair informações que não estão escritas explicitamente em um documento. Isso permite configurar um campo para ser preenchido por inferência ou geração inteligente com base no contexto geral do documento. Isso vai além da extração de texto rudimentar e oferece suporte a casos de uso avançados, como:

  • Deduzir o país de um endereço.
  • Contar o número total de itens em uma tabela.
  • Detectar se um documento de identidade é um "Real ID".

Exemplo de criação de esquema

Confira um exemplo de criação de um esquema para campos derivados para esses casos de uso e a saída esperada, usando uma carteira de motorista dos EUA.

  1. Selecione o método Derived ao criar um elemento de esquema.

    cde-signature-detection-derived-field-1

  2. Adicione rótulos descritivos para melhorar a performance.

    cde-signature-detection-derived-field-2

  3. Campos derivados, como assinaturas, não exigem a definição de caixas delimitadoras ao rotular documentos. Em Value, selecione Detected.

    cde-signature-detection-derived-field-3

  4. Para campos derivados que não sejam assinaturas, é possível inserir qualquer Value como parte da rotulagem para definir as possíveis saídas.

    cde-signature-detection-derived-field-4

A saída esperada será semelhante a esta, com a presença de uma assinatura retornada como "Detected" ou "", e campos derivados retornados como texto, conforme a descrição do rótulo solicita.

cde-signature-detection-derived-field-5

Visão geral de extração versus derivado

Ao definir uma entidade no esquema do processador, é possível escolher um método para preencher o valor dela.

  • Extract:esse é o método padrão. Ele funciona quando o valor da entidade precisa ser extraído diretamente do texto do documento. O sistema identifica o texto e preenche campos como textAnchor e pageAnchor para mostrar a localização dele.

  • Derived:esse método é usado quando o valor da entidade precisa ser inferido do conteúdo do documento. Como o valor não está presente diretamente no texto, os campos textAnchor e pageAnchor não são preenchidos.

Exemplo de caso de uso: encontrar um código de moeda

Imagine que você precisa identificar o código de moeda (por exemplo, USD, CAD, EUR) para transações nos seus documentos.

  • Quando usar Extract: se os documentos contiverem consistentemente símbolos ou códigos de moeda não ambíguos , como "USD" ou "€", use o método Extract para encontrar e extrair esse texto exato.

  • Quando usar Derived: se um documento usar um símbolo ambíguo como "$" (que pode se referir a USD, CAD, AUD etc.) ou não tiver nenhum símbolo, use o Derived método. O modelo analisa o contexto do documento, como um endereço de faturamento ou a localização da empresa, para inferir o código de moeda ISO 4217 correto.

Exemplo de caso de uso: instruções de normalização personalizadas

Imagine que você precisa extrair informações do documento em um formato diferente do restante do documento. A maioria dos casos de uso já deve ser processada pela lógica de normalização. Para casos extremos que não são cobertos, essas entidades podem ser retornadas em um formato de saída personalizado definido usando campos derivados. Por exemplo, é possível remover traços de números usando o comando: Retorne o número sem todos os caracteres não numéricos.

cde-signature-detection-derived-field-6

Da mesma forma, a data da fatura pode ser normalizada usando um campo derivado com a descrição: Retorne a data da fatura no formato aaaa-mm-dd (ISO 8601). O formato da data na fatura estará no formato de data local. Use o país de origem da fatura para derivar o formato de data local.

Práticas recomendadas de configuração

Para ter os melhores resultados com campos derivados, recomendamos que você escreva uma description clara e instrutiva para a propriedade no esquema durante a rotulagem. Isso ajuda a orientar o modelo na tarefa de derivação.

No exemplo de código de moeda, é possível criar um campo com o nome currency_code e fornecer a seguinte descrição: "Encontre o código de moeda ISO 4217 dos valores de quantia no documento, usando indicadores contextuais presentes no documento, como símbolos de moeda e endereços".

Limitações

Os campos derivados são gerados por página. Isso significa que os casos de uso que exigem informações de várias páginas não são totalmente compatíveis. Por exemplo, se você configurar um campo derivado para resumir um documento, ele vai gerar um resumo separado para cada página individual, em vez de um resumo coeso para todo o documento. Essa limitação se aplica a qualquer campo em que o valor precise ser derivado usando informações de várias páginas.

Detecção de assinatura no extrator personalizado

O extrator personalizado da Document AI oferece suporte à detecção de assinatura nos modelos de extrator personalizado pretrained-foundation-model-v1.4-2025-02-05 e pretrained-foundation-model-v1.5-2025-05-05. É possível ativar esse recurso na UI do console ao criar ou editar rótulos no esquema do documento.

A detecção de assinatura é um recurso que permite determinar se uma assinatura está presente nos seus documentos. Esse recurso verifica se uma assinatura existe analisando indicadores visuais, em vez de extrair texto.

Como funciona a detecção de assinatura

Para ativar essa funcionalidade, um tipo de dados signature está disponível ao definir o esquema do processador. O comportamento do processador depende da detecção de uma assinatura no documento.

Se uma assinatura for encontrada, o extrator vai retornar uma entidade de assinatura na resposta. Para um campo chamado has_signed, o objeto de resposta tem a seguinte estrutura:

"has_signed": {
  "mention_text": "Detected",
  "confidence": <confidence_score_between 0 to 1>,
  "normalized_value": {
    "text": "Detected",
    "signature_value": true
  }
}

Se uma assinatura não for encontrada, a entidade não será retornada na resposta do processador.

Configurar e definir os principais requisitos

Para configurar a detecção de assinatura:

  1. Defina o esquema:no esquema do processador, adicione uma nova entidade para a assinatura que você quer detectar.
  2. Defina o tipo de dados:selecione "Assinatura" como o tipo de dados para essa nova entidade.
  3. Defina o método como derivado:as entidades com o tipo de dados signature só podem usar o método Derived. Como o modelo infere a presença da assinatura visualmente, ele não extrai um valor de texto. Portanto, campos como textAnchor e pageAnchor não são preenchidos para entidades de assinatura.

Exemplo de caso de uso

Imagine que você está processando contratos e precisa verificar se eles foram assinados. É possível criar um campo de esquema chamado is_contract_signed e definir o tipo de dados como signature. Ao processar um contrato assinado, a resposta inclui uma entidade is_contract_signed, confirmando a presença da assinatura. Se nenhuma assinatura estiver presente, essa entidade estará ausente da resposta. Isso permite sinalizar rapidamente documentos não assinados para revisão.

A seguir

Saiba como fazer o uptraining de um processador especializado.