このページでは、Document AI Toolbox API の Cloud クライアント ライブラリの使い方について説明します。クライアント ライブラリを使用すると、サポートされている言語から Google Cloud API に簡単にアクセスできます。サーバーにリクエストを送信してGoogle Cloud API を直接利用することもできますが、クライアント ライブラリを使用すると、記述するコードの量を大幅に削減できます。
Cloud クライアント ライブラリ と以前の Google API クライアント ライブラリの詳細については、 クライアント ライブラリの説明をご覧ください。
クライアント ライブラリをインストールする
Python
pip install --upgrade google-cloud-documentai-toolbox
詳細については、Python 開発環境の設定をご覧ください。
認証を設定する
Google Cloud API の呼び出しを認証するために、クライアント ライブラリではアプリケーションのデフォルト認証情報(ADC)がサポートされています。このライブラリは、一連の定義済みロケーションの中から認証情報を探し、それらの認証情報を使用して API へのリクエストを認証します。ADC を使用すると、アプリケーション コードを変更することなく、ローカルでの開発や本番環境など、さまざまな環境のアプリケーションで認証情報を使用できるようになります。本番環境では、ADC の設定方法はサービスとコンテキストによって異なります。詳細については、アプリケーションのデフォルト認証情報を設定するをご覧ください。
ローカル開発環境では、Google アカウントに関連付けられている認証情報を使用して ADC を設定できます。
-
Google Cloud CLI をインストールします。 インストール後、 初期化するには、次のコマンドを実行して Google Cloud CLI を初期化します。
gcloud init外部 ID プロバイダ(IdP)を使用している場合は、まず フェデレーション ID を使用して gcloud CLI にログインする必要があります。
-
ローカルシェルを使用している場合は、ユーザー アカウントのローカル認証情報を作成します。
gcloud auth application-default login
Cloud Shell を使用している場合は、この操作を行う必要はありません。
認証エラーが返され、外部 ID プロバイダ (IdP)を使用している場合は、フェデレーション ID を使用して gcloud CLI にログインしていることを確認します。
ログイン画面が表示されます。ログインすると、 ADC で使用されるローカル認証情報ファイルに認証情報が保存されます。
クライアント ライブラリの使用
Document AI Toolbox は、ドキュメント レスポンスの情報の管理、操作、抽出を行うユーティリティ
関数を提供する Python 用の SDK です。
Cloud Storage 内の JSON ファイル、ローカル JSON ファイル、またはprocess_document()メソッドから直接出力された処理済みドキュメント レスポンスから「ラップされた」ドキュメント オブジェクトを作成します。
次の操作を実行できます。
- バッチ処理の断片化された
DocumentJSON ファイルを 1 つの "ラップされた" ドキュメントに結合します。 - シャードを統合された
Documentとしてエクスポートします。 -
次から
Document出力を取得します: Layout情報を処理せずに、Pages、Lines、Paragraphs、FormFields、Tablesからテキストにアクセスします。- ターゲット文字列を含む、または正規表現に一致する
Pagesを検索します。 - 名前で
FormFieldsを検索します。 - タイプで
Entitiesを検索します。 Tablesを Pandas Dataframe または CSV に変換します。EntitiesとFormFieldsを BigQuery テーブルに挿入します。- Splitter/Classifier プロセッサの出力に基づいて PDF ファイルを分割します。
Document境界ボックスから画像Entitiesを抽出します。-
Documentsを一般的な形式との間で変換します:- Cloud Vision API
AnnotateFileResponse - hOCR
- サードパーティのドキュメント処理形式
-
Google Cloud
- Cloud Vision API
- Cloud Storage フォルダから処理するドキュメントのバッチを作成します。
コードサンプル
次のコードサンプルは、Document AI Toolbox の使用方法を示しています。
クイックスタート
テーブル
BigQuery Export
PDF の分割
画像抽出
Vision の変換
hOCR の変換
サードパーティの変換
ドキュメント バッチ
ドキュメント シャードをマージする
参考情報
Python
次のリストは、Python のクライアント ライブラリに関連するその他のリソースへのリンクを示します。