抽出したエンティティを Document AI Warehouse プロパティに変換する必要がある場合は、スキーマを設定または更新する必要があります。
マッピングを使用してスキーマを設定する前に、Document AI プロセッサのタイプとそのスキーマとエンティティ タイプを把握しておく必要があります。パイプラインはネストされたエンティティをフラット化するため、子エンティティのマッピングも作成する必要があります。
たとえば、プロセッサ INVOICE_PROCESSOR には次のエンティティ タイプがあります。
line_itemline_item/amounttotal_amount
{
"property_definitions": [
{
"name": "line_item",
"display_name": "line_item",
"is_searchable": true,
"is_filterable": true,
"text_type_options": {}
},
{
"name": "my_new_receiver_name",
"display_name": "my_new_receiver_name",
"is_searchable": true,
"is_filterable": true,
"text_type_options": {},
"schema_sources": [
{
"name": "receiver_name_in_invoice",
"processor_type": "INVOICE_PROCESSOR"
},
{
"name": "receiver_name_in_w2",
"processor_type": "FORM_W2_PROCESSOR"
}
]
}
]
}
プロパティ名をエンティティ タイプと同じにしたい場合は、上記の例の line_item のように、名前を直接使用できます。請求書プロセッサのタイプ receiver_name_in_invoice のすべてのエンティティと、フォーム W2 プロセッサの receiver_name_in_w2 のすべてのエンティティを新しい名前 my_new_receiver_name に変換する場合は、上記の例のように schema_sources フィールドにマッピングを追加します。変換後は、検索とフィルタリングに my_new_receiver_name を使用します。プロパティ名と schema_source 名は一意である必要があります。