採用生成式 AI 技術的自訂擷取器

衍生欄位和簽章偵測

公開測試版衍生欄位功能可讓 Document AI 客戶設定欄位,透過智慧型推論或根據文件內容生成資料,而非直接擷取文字。

這個版本也新增一項功能,可偵測文件中的簽名。您可以使用新的 signature 實體類型,為這類實體指定結構定義。簽名實體是根據文件中的視覺提示衍生而來。

自訂擷取器中的衍生欄位

自訂擷取器支援下列模型中的衍生欄位:

  • pretrained-foundation-model-v1.4-2025-02-05 正式發布 (GA)
  • pretrained-foundation-model-v1.5-2025-05-05 預覽
  • pretrained-foundation-model-v1.5-pro-2025-06-20 預覽

在文件結構定義中建立或編輯標籤時,您可以在控制台 UI 中啟用這些功能。

衍生欄位是一項強大功能,可讓您從文件中擷取未明確寫出的資訊。您可以設定欄位,根據文件的整體脈絡,透過智慧推論或生成功能填入內容。這項功能不僅能擷取基本文字,還支援進階用途,例如:

  • 從地址推斷國家/地區。
  • 計算資料表中的項目總數。
  • 偵測身分證是否為「Real ID」。

建立結構定義的範例

以下範例說明如何使用美國駕照,為這類用途建立衍生欄位的結構定義,以及預期輸出內容。

  1. 建立結構定義元素時,請選取 Derived 方法。

    cde-signature-detection-derived-field-1

  2. 加入說明性標籤,提升成效。

    cde-signature-detection-derived-field-2

  3. 標記文件時,簽名等衍生欄位不需要設定邊界方塊。在「值」部分,選取「偵測到的值」

    cde-signature-detection-derived-field-3

  4. 對於簽章以外的衍生欄位,您可以輸入任何 Value 做為標籤的一部分,定義可能的輸出內容。

    cde-signature-detection-derived-field-4

預期輸出內容會與下列內容相似,其中簽章會以「Detected」或「」的形式傳回,衍生欄位則會以文字形式傳回,做為標籤說明提示要求。

cde-signature-detection-derived-field-5

擷取與衍生總覽

在處理器結構定義實體時,您可以選擇值填入方式。

  • 擷取:這是預設方法。如果實體的值應直接從文件文字中擷取,這項功能就派得上用場。系統會識別文字,並填入 textAnchorpageAnchor 等欄位,顯示文字位置。

  • 衍生:如果實體的值需要從文件內容推斷,請使用這個方法。由於文字中沒有直接顯示值,因此系統不會填入 textAnchorpageAnchor 欄位。

使用案例範例:尋找貨幣代碼

假設您需要找出文件中交易的貨幣代碼 (例如 USD、CAD、EUR)。

  • 何時使用 Extract:如果文件一律包含明確的貨幣符號或代碼 (例如「USD」或「€」),請使用 Extract 方法尋找並擷取該確切文字。

  • 何時使用 Derived:如果文件使用模稜兩可的符號 (例如「$」,可能代表美元、加元、澳元等),或完全沒有符號,請使用 Derived 方法。模型會分析文件內容 (例如帳單地址或公司所在地),推斷出正確的 ISO 4217 貨幣代碼。

使用案例範例:自訂正規化指令

假設您需要從文件擷取資訊,但格式與文件其他部分不同。大多數用途應已由正規化邏輯處理。如果遇到未涵蓋的特殊情況,您可以透過衍生欄位定義自訂輸出格式,傳回這些實體。舉例來說,你可以使用提示「Return the number without all non-numeric characters」(傳回不含所有非數字字元的號碼),從號碼中移除破折號。

cde-signature-detection-derived-field-6

同樣地,您可以使用衍生欄位將發票日期正規化,並加上以下說明:以 yyyy-mm-dd (ISO 8601) 格式傳回發票日期。月結單上的日期格式會採用當地日期格式。使用月結單開立國家/地區來衍生當地日期格式。

設定最佳做法

如要讓衍生欄位發揮最佳效果,強烈建議您在標記期間,為結構定義中的屬性撰寫清楚的指示 description。這有助於引導模型執行衍生作業。

在貨幣代碼範例中,您可以建立名為 currency_code 的欄位,並提供下列說明:「使用文件中出現的內容相關信號 (例如貨幣符號和地址),找出文件中金額值的 ISO 4217 貨幣代碼。」

限制

衍生欄位是根據每個網頁產生。也就是說,如果使用案例需要多個頁面的資訊,則不完全支援。舉例來說,如果您設定衍生欄位來摘要文件,系統會為每個頁面分別生成摘要,而不是為整份文件生成連貫的摘要。這項限制適用於任何欄位,只要值必須使用跨頁面資訊衍生即可。

在自訂擷取器中偵測簽章

Document AI 的自訂擷取器支援自訂擷取器模型 pretrained-foundation-model-v1.4-2025-02-05pretrained-foundation-model-v1.5-2025-05-05 中的簽名偵測功能。在文件結構定義中建立或編輯標籤時,您可以在控制台 UI 中啟用這項功能。

簽名偵測功能可判斷文件中是否含有簽名。這項功能會分析視覺提示,而非擷取文字,藉此驗證簽名是否存在。

簽章偵測功能的運作方式

如要啟用這項功能,定義處理器結構定義時,請使用 signature 資料類型。處理器的行為取決於文件是否偵測到簽名。

如果找到簽名,擷取器會在回應中傳回簽名實體。 如果是名為 has_signed 的欄位,回應物件的結構如下:

"has_signed": {
  "mention_text": "Detected",
  "confidence": <confidence_score_between 0 to 1>,
  "normalized_value": {
    "text": "Detected",
    "signature_value": true
  }
}

如果找不到簽章,處理器的回應就不會傳回實體。

設定及滿足主要需求

如要設定簽名偵測功能,請按照下列步驟操作:

  1. 定義結構定義:在處理器結構定義中,為要偵測的簽章新增實體。
  2. 設定資料類型:為這個新實體選取「簽名」做為資料類型。
  3. 將方法設為衍生:具有 signature 資料類型的實體只能使用 Derived 方法。由於模型會以視覺方式推斷簽名是否存在,因此不會擷取文字值。因此,簽章實體不會填入 textAnchorpageAnchor 等欄位。

用途範例

假設您正在處理合約,需要確認合約是否已簽署。您可以建立名為 is_contract_signed 的結構定義欄位,並將其資料類型設為 signature。處理已簽署的合約時,回應會包含 is_contract_signed 實體,確認簽名存在。如果沒有簽章,回應中就不會出現這個實體。方便您快速標記未簽署的文件以供審查。

後續步驟

瞭解如何進階訓練特殊處理器