La salida del procesador Splitter contiene información de división para el documento de entrada, incluida una puntuación de confianza. La API de Document AI genera un objeto JSON Document, y el formato de salida usa el campo entities para representar las divisiones del documento. La información adicional depende del tipo específico de divisor.
Entity.typeespecifica la clasificación del documento. Para obtener una lista completa de los tipos de documentos que se pueden identificar, consulta las siguientes listas.Entity.pageAnchor.pageRefs[]especifica las páginas que contienen cada subdocumento. Ten en cuenta quepageRefs[].pagese basa en cero y es el índice del campodocument.pages[].
Las versiones del divisor que usan IA generativa no están diseñadas para dividir documentos lógicos de más de 500 páginas. Puedes dividir manualmente los documentos lógicos que tengan más de 500 páginas en dos o más documentos y ejecutar el separador para cada uno por separado para clasificarlos.
Los divisores identifican los límites de las páginas, pero no dividen el documento de entrada. El SDK de Document AI Toolbox proporciona funciones de utilidad que pueden dividir el documento de entrada según el resultado de un procesador de división.
Tipos de documentos identificados
[1] El analizador correspondiente para este formulario no admite este tipo de documento. Esto significa que el separador puede identificar y clasificar documentos de este tipo, pero Document AI no proporciona un analizador para extraer información.
Ejemplos de resultados
| Procesadores | Ejemplos de resultados |
|---|
Muestras de código
Los divisores identifican los límites de las páginas, pero no dividen el documento de entrada. Puedes usar la caja de herramientas de Document AI para dividir físicamente un archivo PDF con los límites de página. En los siguientes ejemplos de código, se imprimen los rangos de páginas sin dividir el PDF:
Java
Para obtener más información, consulta la documentación de referencia de la API de Document AI Java.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
Para obtener más información, consulta la documentación de referencia de la API de Document AI Node.js.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Python.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Document procesado.
Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Python.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.