Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud Storage 取り込みパイプラインを使用した一括アップロード

このドキュメントでは、バックグラウンドで Cloud Storage 取り込みパイプラインをトリガーする一括アップロードを実行する方法について説明します。

前処理のオプション

現在、一括アップロードでは次の 3 つの前処理オプションが用意されています。

前処理なしの一括アップロード: Document AI プロセッサでドキュメントを処理せずに、GcsIngestPipeline を使用して runPipeline API をトリガーします。
Document AI プロセッサでエンティティを抽出する: これにより、 GcsIngestWithDocAiProcessorsPipeline を使用して runPipeline API がトリガーされます。パイプラインは、まず指定された Document AI プロセッサを呼び出し、処理された結果を使用してドキュメントを取り込みます。
ドキュメントタイプを分類し、タイプごとにエンティティを抽出する: これも GcsIngestWithDocAiProcessorsPipeline を使用して runPipeline API をトリガーします。これにより、まず分類子が呼び出されます。次に、ドキュメントタイプごとに、特定のドキュメントタイプを処理する対応するスキーマとプロセッサを指定できます。結果とともに取り込まれ、このスキーマに設定されます。

各前処理タイプは、UI の次のオプションに対応しています。

ステップ0

この例では、パイプラインの 2 つ目の使用方法を示します。

以前に OCR プロセッサを作成したことがある場合は、プロセッサリストでそのプロセッサを見つけて、プロセッサの詳細ページに移動してプロセッサ ID を取得します。

作成していない場合は、次の手順を行います。

プロセッサリストの上部にある [プロセッサギャラリー] をクリックします。
ギャラリーで Document OCR プロセッサを見つけ、カードの下部にある [プロセッサを作成] をクリックします。
プロセッサの表示名を入力します。
[作成] をクリックします。[プロセッサの詳細] ページにリダイレクトされたら、ID を見つけます。

これは、一括アップロードビューの入力フィールドにコピーする必要があるものです。

一括アップロードビューを開きます。

[新規追加] の横にある [一括アップロード] をクリックします。
適切なプロセッサを見つけます。
1. 2 つ目の前処理オプションを選択します。
2. スキーマを選択し、抽出結果を JSON 形式で保存するプロセッサと Cloud Storage バケットパスを指定します。
説明テキストのリンクからプロセッサ ID を見つけます。

**注:** Document AI を使用したことがない場合、プロセッサリンクは、次の図に示すように、API 有効化ページにリダイレクトされます。
アップロードをトリガーします。
1. 前のステップでコピーしたプロセッサ ID を使用して、入力フィールドを指定します。ソースファイルバケットパスには、バケット、バケット内のフォルダ、サブフォルダを指定できます。
2. 入力フィールドが有効な場合は、一括アップロードをトリガーするため、右上の [アップロード] をクリックします。

一括アップロードがトリガーされると、ステータストラッキングページにリダイレクトされます。

ステップ 9

最初の表には、保留中または処理済みのドキュメントが表示されます。取り込まれたドキュメントは、最初の表に表示されなくなります。アップロードに失敗したドキュメントは、2 番目の表に表示されます。右側の統計には、取り込まれたドキュメント、失敗したドキュメント、保留中のドキュメントの数が表示されます。

ステップ 10

ジョブが完了すると、ステータスページに [100% 完了] と表示され、保留中のドキュメントは表示されません。

ステップ 11

検索ビューに戻って、新しく取り込まれたドキュメントを見つけます。上部のナビゲーションバーにある Document AI Warehouse のロゴまたは [検索] をクリックします。
ドキュメント名をクリックして、新しく取り込まれたドキュメントを開きます。ドキュメントビューアで、[AI ビュー] を開くことができます。
[テキストブロック] タブに移動します。OCR の結果はドキュメントに保存されます。