預先訓練總覽

Document AI 提供多項產品,可處理文件以擷取資訊,適用於各種用途。

預先訓練的剖析器

詳情請參閱「探索預先訓練的處理器」。

銀行對帳單剖析器

銀行對帳單剖析器會擷取鍵/值組合 (KVP)。最多可擷取 17 個一般實體。例如帳號、客戶名稱、銀行名稱,以及存款和提款等表格項目。您未指定要擷取的欄位 (結構定義)。銀行對帳單剖析器支援擴充正規化

W2 剖析器

W2 剖析器會從 IRS 表單 W2 擷取 KVP。這項功能最多可擷取 12 個一般實體,包括員工姓名、身分證字號、雇主和薪資。您未指定要擷取的欄位 (結構定義)。W2 剖析器支援擴充功能

美國護照剖析器

美國護照剖析器會擷取 KVP。最多可擷取七個一般實體。 包括名字、姓氏、文件 ID 和出生日期。您未指定要擷取的欄位 (結構定義)。美國護照剖析器支援正規化

身分證明文件驗證剖析器

身分證明文件驗證剖析器會使用多種信號,預測身分證明文件的有效性。

  • fraud_signals_is_identity_document 偵測:預測圖片是否含有可辨識的身分證明文件。
  • fraud_signals_suspicious_words 偵測:預測 ID 中是否出現非一般字詞。
  • fraud_signals_image_manipulation 偵測:預測圖片是否經過圖片編輯工具變造或竄改。
  • fraud_signals_online_duplicate 偵測:預測圖片是否可在網路上找到 (僅限美國)。

薪資單剖析器

薪資單剖析器會擷取 KVP。這項功能最多可從薪資單中擷取 26 個一般實體。包括員工姓名、獎金、佣金、加班費和薪資發放日期。 您未指定要擷取的欄位 (結構定義)。薪資單剖析器支援「擴充」和「正規化」

美國駕照剖析器

美國駕照剖析器會擷取 KVP。這項功能最多可從駕照中擷取八個一般實體,例如:名字、姓氏、文件 ID 和有效期限。您未指定要擷取的欄位 (結構定義)。美國駕照剖析器支援正規化

費用剖析器

費用剖析器會擷取 KVP。這項功能最多可從費用報告中擷取 17 個一般實體。例如:支出日期、供應商名稱、總金額和幣別。 您未指定要擷取的欄位 (結構定義)。費用剖析器支援「擴充」和「正規化」。

應付憑據剖析器

應付憑據剖析器會擷取 KVP。這項功能最多可從發票中擷取 46 個一般實體,包括應付憑據號碼、供應商名稱、應付憑據金額、稅額、應付憑據日期和繳費期限。您未指定要擷取的欄位 (結構定義)。應付憑據剖析器支援擴充正規化