预训练概览

Document AI 提供多种产品来处理文档,以便在不同的使用场景中获取信息。

预训练的解析器

如需了解详情,请前往探索预训练的 处理器

银行对账单解析器

银行对账单解析器会提取键值对 (KVP)。它最多可以提取 17 个通用实体。例如,账号、客户名称、银行名称以及存款和取款等表格项。您无需指定要提取的字段(架构)。银行对账单解析器支持 扩充规范化

W2 解析器

W2 解析器会从 IRS 表单 W2 中提取键值对。它最多可以提取 12 个通用实体,包括员工姓名、社会保障号、雇主和工资。您无需指定要提取的字段(架构)。W2 解析器支持扩充

美国护照解析器

美国护照解析器会提取键值对。它最多可以提取 7 个通用实体。 其中包括名字、姓氏、文档 ID 和出生日期。您无需指定要提取的字段(架构)。美国护照解析器支持规范化

身份证明文件验证解析器

身份证明文件验证解析器使用多个信号预测 ID 证明文件的有效性。

  • fraud_signals_is_identity_document 检测:预测图片是否 包含可识别的身份证明文件。
  • fraud_signals_suspicious_words 检测:预测是否存在 ID 上不常见的字词。
  • fraud_signals_image_manipulation 检测:预测图片是否被图片编辑工具更改或篡改。
  • fraud_signals_online_duplicate 检测:预测图片是否可以在网上找到(仅限美国)。

工资单解析器

工资单解析器会提取键值对。它最多可以从工资单中提取 26 个通用实体。其中包括员工姓名、奖金、佣金、加班费和工资日期。 您无需指定要提取的字段(架构)。工资单解析器支持 扩充规范化

美国驾照解析器

美国驾照解析器会提取键值对。它最多可以从驾照中提取 8 个通用实体。例如,名字、姓氏、文档 ID 和有效期。您无需指定要提取的字段(架构)。美国驾照解析器支持规范化

费用解析器

费用解析器会提取键值对。它最多可以从费用报告中提取 17 个通用实体。例如,费用日期、供应商名称、总金额和货币。 您无需指定要提取的字段(架构)。费用解析器支持 扩充规范化

账单解析器

账单解析器会提取键值对。它最多可以从账单中提取 46 个通用实体。其中包括账单编号、供应商名称、账单金额、税费金额、账单日期和截止日期。您无需指定要提取的字段(架构)。账单解析器支持扩充规范化