衍生欄位和簽章偵測
公開測試版衍生欄位功能可讓 Document AI 客戶設定欄位,透過智慧型推論或根據文件內容生成資料,而非直接擷取文字。
這個版本也新增一項功能,可偵測文件中的簽名。您可以使用新的 signature 實體類型,為這類實體指定結構定義。簽名實體是根據文件中的視覺提示衍生而來。
自訂擷取器中的衍生欄位
自訂擷取器支援下列模型中的衍生欄位:
pretrained-foundation-model-v1.4-2025-02-05正式發布 (GA)pretrained-foundation-model-v1.5-2025-05-05預覽pretrained-foundation-model-v1.5-pro-2025-06-20預覽
在文件結構定義中建立或編輯標籤時,您可以在控制台 UI 中啟用這些功能。
衍生欄位是一項強大功能,可讓您從文件中擷取未明確寫出的資訊。您可以設定欄位,根據文件的整體脈絡,透過智慧推論或生成功能填入內容。這項功能不僅能擷取基本文字,還支援進階用途,例如:
- 從地址推斷國家/地區。
- 計算資料表中的項目總數。
- 偵測身分證是否為「Real ID」。
建立結構定義的範例
以下範例說明如何使用美國駕照,為這類用途建立衍生欄位的結構定義,以及預期輸出內容。
建立結構定義元素時,請選取
Derived方法。
加入說明性標籤,提升成效。

標記文件時,簽名等衍生欄位不需要設定邊界方塊。在「值」部分,選取「偵測到的值」。

對於簽章以外的衍生欄位,您可以輸入任何 Value 做為標籤的一部分,定義可能的輸出內容。

預期輸出內容會與下列內容相似,其中簽章會以「Detected」或「」的形式傳回,衍生欄位則會以文字形式傳回,做為標籤說明提示要求。

擷取與衍生總覽
在處理器結構定義實體時,您可以選擇值填入方式。
擷取:這是預設方法。如果實體的值應直接從文件文字中擷取,這項功能就派得上用場。系統會識別文字,並填入
textAnchor和pageAnchor等欄位,顯示文字位置。衍生:如果實體的值需要從文件內容推斷,請使用這個方法。由於文字中沒有直接顯示值,因此系統不會填入
textAnchor和pageAnchor欄位。
使用案例範例:尋找貨幣代碼
假設您需要找出文件中交易的貨幣代碼 (例如 USD、CAD、EUR)。
何時使用
Extract:如果文件一律包含明確的貨幣符號或代碼 (例如「USD」或「€」),請使用Extract方法尋找並擷取該確切文字。何時使用
Derived:如果文件使用模稜兩可的符號 (例如「$」,可能代表美元、加元、澳元等),或完全沒有符號,請使用Derived方法。模型會分析文件內容 (例如帳單地址或公司所在地),推斷出正確的 ISO 4217 貨幣代碼。
使用案例範例:自訂正規化指令
假設您需要從文件擷取資訊,但格式與文件其他部分不同。大多數用途應已由正規化邏輯處理。如果遇到未涵蓋的特殊情況,您可以透過衍生欄位定義自訂輸出格式,傳回這些實體。舉例來說,你可以使用提示「Return the number without all non-numeric characters」(傳回不含所有非數字字元的號碼),從號碼中移除破折號。

同樣地,您可以使用衍生欄位將發票日期正規化,並加上以下說明:以 yyyy-mm-dd (ISO 8601) 格式傳回發票日期。月結單上的日期格式會採用當地日期格式。使用月結單開立國家/地區來衍生當地日期格式。
設定最佳做法
如要讓衍生欄位發揮最佳效果,強烈建議您在標記期間,為結構定義中的屬性撰寫清楚的指示 description。這有助於引導模型執行衍生作業。
在貨幣代碼範例中,您可以建立名為 currency_code 的欄位,並提供下列說明:「使用文件中出現的內容相關信號 (例如貨幣符號和地址),找出文件中金額值的 ISO 4217 貨幣代碼。」
限制
衍生欄位是根據每個網頁產生。也就是說,如果使用案例需要多個頁面的資訊,則不完全支援。舉例來說,如果您設定衍生欄位來摘要文件,系統會為每個頁面分別生成摘要,而不是為整份文件生成連貫的摘要。這項限制適用於任何欄位,只要值必須使用跨頁面資訊衍生即可。
在自訂擷取器中偵測簽章
Document AI 的自訂擷取器支援自訂擷取器模型 pretrained-foundation-model-v1.4-2025-02-05 和 pretrained-foundation-model-v1.5-2025-05-05 中的簽名偵測功能。在文件結構定義中建立或編輯標籤時,您可以在控制台 UI 中啟用這項功能。
簽名偵測功能可判斷文件中是否含有簽名。這項功能會分析視覺提示,而非擷取文字,藉此驗證簽名是否存在。
簽章偵測功能的運作方式
如要啟用這項功能,定義處理器結構定義時,請使用 signature 資料類型。處理器的行為取決於文件是否偵測到簽名。
如果找到簽名,擷取器會在回應中傳回簽名實體。
如果是名為 has_signed 的欄位,回應物件的結構如下:
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
如果找不到簽章,處理器的回應就不會傳回實體。
設定及滿足主要需求
如要設定簽名偵測功能,請按照下列步驟操作:
- 定義結構定義:在處理器結構定義中,為要偵測的簽章新增實體。
- 設定資料類型:為這個新實體選取「簽名」做為資料類型。
- 將方法設為衍生:具有
signature資料類型的實體只能使用Derived方法。由於模型會以視覺方式推斷簽名是否存在,因此不會擷取文字值。因此,簽章實體不會填入textAnchor和pageAnchor等欄位。
用途範例
假設您正在處理合約,需要確認合約是否已簽署。您可以建立名為 is_contract_signed 的結構定義欄位,並將其資料類型設為 signature。處理已簽署的合約時,回應會包含 is_contract_signed 實體,確認簽名存在。如果沒有簽章,回應中就不會出現這個實體。方便您快速標記未簽署的文件以供審查。
後續步驟
瞭解如何進階訓練特殊處理器。