El Analizador de formularios extrae pares clave-valor (KVPs), tablas, marcas de selección (como casillas de verificación), campos genéricos y texto para aumentar y automatizar el procesamiento de documentos.
Se puede considerar el Analizador de formularios en lugar de los otros analizadores cuando el caso de uso incluye lo siguiente:
- Tratar con formularios estructurados: Se destaca en la extracción de KVPs de formularios bien definidos que se ven como formularios convencionales con espacios en blanco etiquetados para completar, como
name: __. El modelo preentrenado del Analizador de formularios ofrece alta precisión para campos comunes como nombres, fechas y direcciones. - Se necesita una extracción de tablas flexible: El Analizador de formularios extrae de tablas simples (sin celdas que abarquen filas o columnas) que se ven como tablas. No se necesita entrenamiento (ni es posible). Para la extracción de tablas entrenadas, se puede usar el extractor personalizado con un campo superior que contenga campos secundarios de columna (celda).
- Necesitas eficiencia: Evita compilar y mantener analizadores de extracción, en especial para tareas de extracción de formularios variados y de gran volumen.
Funciones de extracción de datos
Las funciones del Analizador de formularios incluyen lo siguiente:
KVP: Son conjuntos de dos elementos dentro de un documento: una etiqueta o clave y sus datos correspondientes (un valor). Puedes usar KVPs directamente (si las claves son coherentes) o compilar una lógica personalizada para resolver claves variadas en información estructurada coherente.
Entidades genéricas: Analiza 11 campos diferentes de documentos listos para usar. Estos incluyen los siguientes:
emailphoneurldate_timeaddresspersonorganizationquantitypriceidpage_number
Texto y diseño: Usa nuestro motor de OCR más reciente para extraer texto y diseño. Esto incluye texto incorporado de PDFs digitales (solo v2.1) o texto de imágenes.
Tablas: Detecta y extrae tablas de imágenes y PDFs.
Casillas de verificación: Un detector de marcas de selección de alta calidad, que extrae casillas de verificación de imágenes y resultados de PDF como KVP, usando el texto más cercano a la casilla de verificación, con un
valueTypeque indica si está marcada o no.
Lenguajes y regiones
- El Analizador de formularios 2.0 admite más de 200 idiomas. Obtén más información.
- Brindamos asistencia para funciones en ocho regiones. Obtén más información.
Versiones del modelo
Las siguientes versiones del procesador son compatibles con esta función. Para obtener más información, consulta Administra versiones de procesadores.
Limitaciones
No se admiten las compresiones JPEG anteriores para TIFF. Tipo de encapsulación JPEG definida por la especificación de TIFF versión 6.0.
El modelo de casilla de verificación no admite el análisis de botones de selección. Es posible que algunas casillas de verificación detectadas no tengan claves correspondientes.
El modelo no analiza de manera confiable un KVP con un valor no completado, como un formulario en blanco.
El análisis de KVP en documentos en ciertos idiomas puede tener una calidad inferior a la de los idiomas latinos.
Procesa documentos con el Analizador de formularios
En esta guía de inicio rápido, se presenta la función Analizador de formularios en Document AI. En esta guía de inicio rápido, usarás la consola Google Cloud para configurar tu Google Cloud proyecto y autorización, crear un analizador de formularios y, luego, solicitar a Document AI que procese un formulario en PDF.
Aprenderás a realizar estas tareas:
Habilitar Document AI en un proyecto de Google Cloud
Crear un procesador de analizador de formularios, que puede identificar y extraer texto, pares clave-valor, tablas y entidades genéricas de muchos tipos de documentos.
Usar el procesador para anotar un documento de muestra.
Para seguir la guía paso a paso sobre esta tarea directamente en la consola Google Cloud , haz clic en Guiarme:
- Accede a tu Google Cloud cuenta de. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Document AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Document AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Usa la consola para crear un procesador de analizador de formularios.
Usa la consola Google Cloud para crear un procesador de analizador de formularios. Consulta Crea y administra procesadores para obtener más información.
En el menú de navegación de la consola de Google Cloud , haz clic en Document AI y, luego, en Galería del procesador.
En la Galería de procesadores,
busca Analizador de formularios y selecciona Crear.
En la ventana lateral, ingresa un Nombre del procesador, como
quickstart-form-processor.Selecciona la región más cercana a ti.
Haz clic en el botón Crear (Create).
Se te redireccionará a la página Detalles del procesador del nuevo procesador de analizador de formularios.
Procesador de prueba
Después de crear tu procesador, puedes enviarle solicitudes de anotación.
Descargar el documento de muestra.
Es un archivo PDF que contiene una muestra de un formulario de admisión médica escrito a mano. Este documento se almacena en un bucket de Cloud Storage de acceso público.
Haz clic en el botón
Subir documento de prueba y selecciona el documento que acabas de descargar.Ahora, debes estar en la página Análisis del analizador de formularios. Puedes ver el texto detectado por OCR, los pares clave-valor, las tablas y las entidades genéricas extraídos del documento.
Limpia
Para evitar cargos Google Cloud innecesarios, usa Google Cloud console para borrar el procesador y el proyecto si no los necesitas.
¿Qué sigue?
- Revisa la lista de procesadores.