派生フィールドと署名の検出
このリリースでは、ドキュメント内の署名の有無を検出する機能も追加されています。新しい signature
エンティティ タイプを使用して、このようなエンティティのスキーマを指定できます。署名エンティティは、ドキュメントの視覚的な手がかりを使用して派生します。
カスタム エクストラクタの派生フィールド
カスタム エクストラクタは、次のモデルの派生フィールドをサポートしています。
pretrained-foundation-model-v1.4-2025-02-05(一般提供)(GA)pretrained-foundation-model-v1.5-2025-05-05(プレビュー)pretrained-foundation-model-v1.5-pro-2025-06-20(プレビュー)
これらの機能は、ドキュメント スキーマでラベルを作成または編集するときに、コンソール UI で有効にできます。
派生フィールドは、ドキュメントに明示的に記述されていない情報を抽出できる強力な機能です。 これにより、ドキュメントの全体的なコンテキストに基づいてインテリジェントな推論または生成によって入力されるフィールドを構成できます。これは基本的なテキスト抽出を超えて、次のような高度なユースケースをサポートします。
- 住所から国を推測する。
- テーブル内のアイテムの合計数を数える。
- ID カードが「Real ID」かどうかを検出する。
スキーマ作成の例
このようなユースケースの派生フィールドのスキーマを作成する例と、 米国運転免許証 を使用した想定される出力を示します。
スキーマ要素を作成するときに、
Derivedメソッドを選択します。
パフォーマンスを向上させるために、説明ラベルを追加します。

署名などの派生フィールドでは、ドキュメントにラベルを付けるときにバウンディング ボックスを設定する必要はありません。[**値**] で [**検出済み**] を選択します。

署名以外の派生フィールドの場合は、ラベル付けの一部として任意の値 を入力して、可能な出力を定義できます。

想定される出力は次のようになります。署名が存在する場合は「検出済み」または「」として返され、派生フィールドはラベルの説明でリクエストを促すテキストとして返されます。

抽出と派生の概要
プロセッサ スキーマでエンティティを定義するときに、その値の入力方法を選択できます。
抽出: これはデフォルトの方法です。エンティティの値をドキュメント テキストから直接抽出する場合に使用します。システムはテキストを識別し、
textAnchorやpageAnchorなどのフィールドに入力して、その場所を示します。派生: この方法は、エンティティの値をドキュメントのコンテンツから推測する必要がある場合に使用します。値はテキストに直接存在しないため、
textAnchorフィールドとpageAnchorフィールドは入力されません。
ユースケースの例: 通貨コードの検索
ドキュメント内の取引の通貨コード(USD、CAD、EUR など)を特定する必要があるとします。
Extractを使用する場合: ドキュメントに「USD」や「€」などの明確な 通貨記号またはコードが一貫して含まれている場合は、Extractメソッドを使用して、その正確なテキストを 検索して抽出します。**
Derivedを使用する場合**: ドキュメントで「$」(USD、CAD、AUD などを指す可能性がある)などの曖昧な記号を使用している場合や、記号がまったくない場合は、Derivedメソッドを使用します。モデルは、請求先住所や会社の所在地など、ドキュメントのコンテキストを分析して、正しい ISO 4217 通貨コードを推測します。
ユースケースの例: カスタム正規化手順
ドキュメントの残りの部分とは異なる形式でドキュメントから情報を抽出する必要があるとします。ほとんどのユースケースは、 正規化ロジックですでに処理されているはずです。対象外の特殊なケースでは、派生フィールドを使用して定義したカスタム出力形式でこれらのエンティティを返すことができます。たとえば、プロンプト「 数字以外の文字をすべて削除して数字を返す 」を使用して、数字からハイフンを削除できます。

同様に、請求書発行日は、 説明「請求書発行日を yyyy-mm-dd(ISO 8601)形式で返す」を含む派生フィールドを使用して正規化できます。請求書の日付形式は、ローカルの日付形式になります。請求書の原産国を使用して、ローカルの日付形式を派生させます。
構成のベスト プラクティス
派生フィールドで最適な結果を得るには、ラベル付け時にスキーマのプロパティに明確でわかりやすい description を記述することを強くおすすめします。これにより、モデルの派生タスクをガイドできます。
通貨コードの例では、currency_code という名前のフィールドを作成し、「通貨記号や住所など、ドキュメントに存在するコンテキスト シグナルを使用して、ドキュメント内の金額値の ISO 4217 通貨コードを見つける」という説明を入力できます。
制限事項
派生フィールドはページごとに生成されます。つまり、複数のページにまたがる情報を必要とするユースケースは完全にサポートされていません。たとえば、ドキュメントを要約するように派生フィールドを構成すると、ドキュメント全体のまとまりのある要約ではなく、個々のページごとに個別の要約が生成されます。この制限は、ページをまたぐ情報を使用して値を派生させる必要があるフィールドに適用されます。
カスタム エクストラクタでの署名検出
Document AI のカスタム エクストラクタは、カスタム エクストラクタ モデル pretrained-foundation-model-v1.4-2025-02-05 と pretrained-foundation-model-v1.5-2025-05-05 で署名検出をサポートしています。この機能は、ドキュメント スキーマでラベルを作成または編集するときに、コンソール UI で有効にできます。
署名検出は、ドキュメントに署名が存在するかどうかを判断できる機能です。この機能は、テキストを抽出するのではなく、視覚的な手がかりを分析して署名が存在することを確認します。
署名検出の仕組み
この機能を有効にするには、プロセッサ スキーマを定義するときに signature データ型を使用できます。プロセッサの動作は、ドキュメントで署名が検出されるかどうかによって異なります。
署名が見つかった場合、エクストラクタはレスポンスで署名エンティティを返します。has_signed という名前のフィールドの場合、レスポンス オブジェクトの構造は次のようになります。
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
署名が見つからない場合、エンティティはプロセッサのレスポンスで返されません。
鍵の要件を構成して設定する
署名検出を設定するには:
- スキーマを定義する: プロセッサ スキーマで、検出する署名の新しいエンティティを追加します。
- データ型を設定する: この新しいエンティティのデータ型として [署名] を選択します。
- メソッドを派生に設定する:
signatureデータ型のエンティティは、Derivedメソッドのみを使用できます。モデルは署名の有無を視覚的に推測するため、テキスト値は抽出されません。そのため、署名エンティティのtextAnchorやpageAnchorなどのフィールドは入力されません。
ユースケースの例
契約書を処理していて、署名されていることを確認する必要があるとします。
is_contract_signed という名前のスキーマ フィールドを作成し、そのデータ型を signature に設定できます。署名済みの契約書を処理すると、レスポンスに is_contract_signed エンティティが含まれ、署名が存在することが確認されます。署名がない場合、このエンティティはレスポンスに含まれません。これにより、署名されていないドキュメントにすばやくフラグを設定して確認できます。
次のステップ
特殊なプロセッサのアップトレーニングについて学習する。