マッピングを使用してスキーマを設定する

抽出したエンティティを Document AI Warehouse プロパティに変換する必要がある場合は、スキーマを設定または更新する必要があります。

マッピングを使用してスキーマを設定する前に、Document AI プロセッサのタイプとそのスキーマとエンティティ タイプを把握しておく必要があります。パイプラインはネストされたエンティティをフラット化するため、子エンティティのマッピングも作成する必要があります。

たとえば、プロセッサ INVOICE_PROCESSOR には次のエンティティ タイプがあります。

  • line_item
  • line_item/amount
  • total_amount
{
  "property_definitions": [
    {
      "name": "line_item",
      "display_name": "line_item",
      "is_searchable": true,
      "is_filterable": true,
      "text_type_options": {}
    },
    {
      "name": "my_new_receiver_name",
      "display_name": "my_new_receiver_name",
      "is_searchable": true,
      "is_filterable": true,
      "text_type_options": {},
      "schema_sources": [
        {
          "name": "receiver_name_in_invoice",
          "processor_type": "INVOICE_PROCESSOR"
        },
        {
          "name": "receiver_name_in_w2",
          "processor_type": "FORM_W2_PROCESSOR"
        }
      ]
    }
  ]
}

プロパティ名をエンティティ タイプと同じにしたい場合は、上記の例の line_item のように、名前を直接使用できます。請求書プロセッサのタイプ receiver_name_in_invoice のすべてのエンティティと、フォーム W2 プロセッサの receiver_name_in_w2 のすべてのエンティティを新しい名前 my_new_receiver_name に変換する場合は、上記の例のように schema_sources フィールドにマッピングを追加します。変換後は、検索とフィルタリングに my_new_receiver_name を使用します。プロパティ名と schema_source 名は一意である必要があります。