Validación y corrección

Puedes usar Document AI para definir reglas de negocio personalizadas para validar los resultados del procesamiento de documentos. La validación es un proceso de procesamiento de documentos que ejecuta tus reglas de validación en las entidades finales extraídas. La corrección es un proceso opcional que intenta mejorar los resultados de la extracción en función de los resultados de la regla de validación, lo que aumenta la exactitud de la extracción.

Las reglas de validación pueden, por ejemplo, verificar si la suma de los precios de los artículos coincide con el valor total, verificar la coherencia de los campos en varios documentos o garantizar que los campos extraídos estén alineados espacialmente en un diseño (por ejemplo, dentro de un bloque horizontal). Define reglas de negocio con Common Expression Language (CEL) y genéralas a partir de instrucciones en lenguaje natural.

Habilita la validación y la corrección

Puedes habilitar la validación y la corrección de forma independiente en la consola de Document AI. Estos parámetros de configuración se aplican a todas las solicitudes de processDocument para la versión del procesador seleccionada. Sin embargo, puedes anular este comportamiento para solicitudes individuales con parámetros en la llamada a la API de processDocument.

Las configuraciones de validación y corrección, incluidas las reglas de validación, son específicas de cada versión del procesador. Ten en cuenta que todas las versiones de procesadores entrenados previamente administrados por Google comparten una configuración base común. Cuando creas una nueva versión del procesador personalizado (p.ej., a través del ajuste), Document AI duplica la configuración base y la adjunta a la nueva versión.

Cuando se habilita la validación, los resultados de todas las reglas de validación definidas se incluyen en la respuesta de ProcessDocument para las solicitudes síncronas y por lotes. La corrección solo se puede habilitar si también se habilita la validación. Document AI ejecuta el proceso de corrección solo si falla al menos una regla de validación para un documento determinado. Después de la corrección, Document AI vuelve a ejecutar el proceso de validación para proporcionar los resultados finales. Los resultados de la validación previa y posterior a la corrección están disponibles en la respuesta de processDocument en una lista de revisiones.

Reglas de validación de CEL

Las reglas de validación se definen con expresiones basadas en Common Expression Language (CEL). CEL es un lenguaje de expresión no Turing-complete diseñado para ser simple y seguro. Ejemplos de reglas que puedes definir:

  • La suma de los campos A es igual al campo B.
  • El campo B coincide con un patrón de expresión regular especificado.
  • Todos los subcampos de cada entidad principal están alineados horizontalmente.

Para simplificar la creación de reglas, genera reglas de CEL proporcionando instrucciones en lenguaje natural. Este enfoque evita las complejidades de la sintaxis de CEL. La implementación de CEL en Document AI puede tener pequeñas diferencias con respecto a la especificación estándar. Para obtener descripciones y ejemplos detallados, consulta la referencia de reglas de CEL.

Activa la validación en la consola de Google Cloud

  1. En la consola de Google Cloud para un procesador existente, selecciona la entrada Validación y corrección.

    ce-validation-1

  2. Antes de procesar un documento, ve a Administración de reglas.

    ce-validation-2

  3. Selecciona el botón de activación Habilitar validación.

  4. Opcional: Selecciona el botón de activación Habilitar corrección.

Creación de reglas

  1. Haz clic en Agregar regla.

    ce-validation-6

  2. En el formulario de creación de reglas, ingresa una instrucción en lenguaje natural.

    ce-validation-5

  3. Asigna un nombre a la regla y usa Common Expression Language (CEL) para definir el comportamiento.

  4. Es opcional. Usa las opciones Editar o Borrar para administrar las reglas existentes.

Copia la configuración entre procesadores

  1. En la sección Administración de reglas, haz clic en Copiar en otro PV.

    ce-validation-4

  2. Selecciona el nombre y la versión del procesador al que deseas copiar la configuración.

    ce-validation-3

Resultados de la regla

  1. En la página Administrar conjunto de datos, ve a Administración de reglas.

    ce-validation-7

  2. Evalúa la cantidad total de pruebas aprobadas y reprobadas.

  3. Verifica un desglose de los resultados de las reglas individuales.

  4. Puedes comparar los cambios para ver las entidades nuevas creadas después de la corrección en verde y las entidades modificadas en amarillo.

    ce-validation-8

  5. En la sección Evaluar y probar, habrá columnas para las puntuaciones antes y después de activar la corrección.

    ce-validation-9

Evaluación

Las evaluaciones de la versión del procesador incluyen métricas clave para los resultados posteriores y anteriores a la corrección si esta está habilitada. Usa estas métricas para evaluar el impacto del proceso de corrección en la calidad de la extracción.

¿Qué sigue?