Si necesitas convertir las entidades extraídas en propiedades de Document AI Warehouse, debes establecer o actualizar el esquema.
Antes de configurar el esquema con la asignación, debes conocer los tipos de procesadores de Document AI, sus esquemas y sus tipos de entidades. La canalización aplana las entidades anidadas, por lo que también debes crear asignaciones para las entidades secundarias.
Por ejemplo, el procesador INVOICE_PROCESSOR tiene los siguientes tipos de entidades:
line_itemline_item/amounttotal_amount
{
"property_definitions": [
{
"name": "line_item",
"display_name": "line_item",
"is_searchable": true,
"is_filterable": true,
"text_type_options": {}
},
{
"name": "my_new_receiver_name",
"display_name": "my_new_receiver_name",
"is_searchable": true,
"is_filterable": true,
"text_type_options": {},
"schema_sources": [
{
"name": "receiver_name_in_invoice",
"processor_type": "INVOICE_PROCESSOR"
},
{
"name": "receiver_name_in_w2",
"processor_type": "FORM_W2_PROCESSOR"
}
]
}
]
}
Si deseas mantener el nombre de la propiedad igual al tipo de entidad, puedes usar el nombre directamente, como line_item en el ejemplo anterior. Si deseas convertir todas las entidades con el tipo receiver_name_in_invoice del procesador de facturas y con receiver_name_in_w2 del procesador del formulario W2 a tu nuevo nombre my_new_receiver_name, puedes agregar las asignaciones en el campo schema_sources como en el ejemplo anterior. Sin embargo, después de la conversión, usa my_new_receiver_name para buscar y filtrar. Los nombres de las propiedades y los nombres de schema_source deben ser únicos.