Définir des schémas avec le mappage

Si vous devez convertir les entités extraites en propriétés Document AI Warehouse, vous devez définir ou mettre à jour le schéma.

Avant de définir le schéma avec le mappage, vous devez connaître les types de processeurs Document AI, ainsi que leurs schémas et types d'entités. Le pipeline aplatit les entités imbriquées. Vous devez donc également créer des mappages pour les entités enfants.

Par exemple, le processeur INVOICE_PROCESSOR possède les types d'entités suivants :

  • line_item
  • line_item/amount
  • total_amount
{
  "property_definitions": [
    {
      "name": "line_item",
      "display_name": "line_item",
      "is_searchable": true,
      "is_filterable": true,
      "text_type_options": {}
    },
    {
      "name": "my_new_receiver_name",
      "display_name": "my_new_receiver_name",
      "is_searchable": true,
      "is_filterable": true,
      "text_type_options": {},
      "schema_sources": [
        {
          "name": "receiver_name_in_invoice",
          "processor_type": "INVOICE_PROCESSOR"
        },
        {
          "name": "receiver_name_in_w2",
          "processor_type": "FORM_W2_PROCESSOR"
        }
      ]
    }
  ]
}

Si vous souhaitez conserver le même nom de propriété que le type d'entité, vous pouvez utiliser directement le nom, tel que line_item dans l'exemple ci-dessus. Si vous souhaitez convertir toutes les entités de type receiver_name_in_invoice du processeur de factures et avec receiver_name_in_w2 du processeur de formulaire W2 en votre nouveau nom my_new_receiver_name, vous pouvez ajouter les mappages dans le champ schema_sources comme dans l'exemple ci-dessus. Toutefois, après la conversion, utilisez my_new_receiver_name pour effectuer des recherches et filtrer les données. Les noms de propriétés et de schema_source doivent être uniques.