Form パーサー

Form Parser は、Key-Value ペア(KVP)、テーブル、選択マーク(チェックボックスなど)、汎用フィールド、テキストを抽出して、ドキュメント処理を強化し、自動化します。

ユースケースに次のものが含まれる場合は、他のパーサーよりも Form Parser を検討できます。

  • 構造化されたフォームの処理: name: __ のように、入力するラベル付きの空白がある従来のフォームのような、明確に定義されたフォームから KVP を抽出するのに優れています。Form Parser の事前トレーニング済みモデルは、名前、日付、住所などの一般的なフィールドで高い精度を実現します。
  • 柔軟なテーブル抽出が必要: Form Parser は、テーブルのような単純なテーブル(行または列にまたがるセルがない)から抽出します。トレーニングは不要です(トレーニングはできません)。トレーニング済みのテーブル抽出の場合、列(セル)の子フィールドを含む親フィールドでカスタム抽出を使用できます。
  • 効率化が必要: 特に大量でさまざまな形式の抽出タスクの場合、抽出パーサーの構築と維持を回避します。

データ抽出機能

Form Parser の機能は次のとおりです。

  • KVP: ドキュメント内の 2 つの項目のセットです。ラベルまたはキーと、それに対応するデータ(値)です。KVP を直接使用する(キーに整合性がある場合)か、カスタム ロジックを構築してさまざまなキーを一貫した構造化情報に解決できます。

  • 汎用エンティティ: ドキュメントから 11 個の異なるフィールドをすぐに解析できます。たとえば、次のようなものが挙げられます。

    • email
    • phone
    • url
    • date_time
    • address
    • person
    • organization
    • quantity
    • price
    • id
    • page_number
  • テキストとレイアウト: 最新の OCR エンジンを使用して、テキストとレイアウト情報を抽出します。これには、デジタル PDF(v2.1 のみ)から埋め込まれたテキストや、画像からのテキストが含まれます。

  • テーブル: 画像と PDF からテーブルを検出して抽出します。

  • チェックボックス: 高品質の選択マーク検出器。チェックボックスに最も近いテキストを使用して、画像と PDF 出力からチェックボックスを KVP として抽出します。valueType は、チェックボックスがオンかオフかを示します。

言語とリージョン

  • Form Parser 2.0 は 200 以上の言語をサポートしています。詳細
  • 8 つのリージョンで機能サポートを提供しています。詳細

モデル バージョン

次のプロセッサ バージョンは、この機能と互換性があります。詳細については、プロセッサ バージョンの管理をご覧ください。

制限事項

  • TIFF の以前の JPEG 圧縮はサポートされていません。TIFF バージョン 6.0 仕様で定義されている JPEG カプセル化のタイプ。

  • チェックボックス モデルはラジオボタンの解析をサポートしていません。検出されたチェックボックスに対応するキーがない場合があります。

  • モデルは、空白のフォームなど、値が入力されていない KVP を確実に解析しません。

  • 特定の言語のドキュメントの KVP 解析は、ラテン語よりも品質が低い場合があります。

Form Parser でドキュメントを処理する

このクイックスタートでは、Document AI の Form Parser 機能について説明します。このクイックスタートでは、 Google Cloud コンソールを使用して Google Cloud プロジェクトと承認を設定し、Form Parser を作成して、Document AI に PDF フォームの処理をリクエストします。

学習内容:

  1. Google Cloud プロジェクトで Document AI を有効にします。

  2. Form パーサー プロセッサを作成します。このプロセッサで、さまざまな種類のドキュメント内のテキスト、Key-Value ペア、テーブル、汎用エンティティを識別し、抽出することができます。

  3. このプロセッサを使用して、サンプル ドキュメントにアノテーションを付けます。


このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、[ガイドを表示] をクリックしてください。

ガイドを表示


  1. アカウントにログインします。 Google Cloud を初めて使用する場合は、 アカウントを作成して、実際のシナリオで Google プロダクトのパフォーマンスを評価してください。 Google Cloud新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Document AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Document AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

Form パーサー プロセッサを作成する

Google Cloud コンソールを使用して Form Parser プロセッサを作成します。詳細については、プロセッサの作成と管理をご覧ください。

  1. コンソールのナビゲーション メニューで [Document AI] をクリックし、 [プロセッサ ギャラリー] を選択します。 Google Cloud

    プロセッサ ギャラリー

  2. [プロセッサ ギャラリー] で、[Form パーサー] を検索して [作成] を選択します。

    UI の Form パーサー オプション

  3. サイド ウィンドウで、[プロセッサ名] に「quickstart-form-processor」などを入力します。

  4. 最も近いリージョンを選択します。

  5. [作成] ボタンをクリックします。

新しいフォーム パーサー プロセッサの [プロセッサの詳細] ページが表示されます。

プロセッサをテストする

プロセッサを作成したら、作成したプロセッサに対してアノテーション リクエストを送信できます。

  1. サンプル ドキュメントをダウンロードします

    手書きの医療用登録フォームのサンプルを含む PDF ファイルです。このドキュメントは、一般公開されている Cloud Storage バケットに保存されています。

  2. [テスト ドキュメントをアップロード] ボタンをクリックし、ダウンロードしたドキュメントを選択します。

  3. [Form パーサー分析] ページが表示されます。OCR で検出されたテキスト、Key-Value ペア、テーブル、ドキュメントから抽出された汎用エンティティが表示されます。

    UI に表示される Form の Key-Value ペアの例

クリーンアップ

不要な Google Cloud 料金が発生しないようにするには、 Google Cloud console を使用して、不要なプロセッサやプロジェクトを削除します。

次のステップ