割り当て

このドキュメントでは、Document AI に適用される割り当てと上限について説明します。

  • 割り当てにはデフォルト値がありますが、通常は調整をリクエストできます。
  • システムの上限は固定値で、変更できません。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

このドキュメントでは、Document AI に適用される割り当ての一覧を示します。

サービス階層

Document AI は、生成 AI を搭載したプロセッサ バージョンに対するオンライン プロセス リクエスト用に、プロビジョニング済み階層とベスト エフォート階層の 2 つのサービス階層と関連する割り当てをサポートしています。

プロビジョニングされた階層の割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンで 1 分あたり 120 ページ、カスタム エクストラクタ v1.5 Pro などのベース プロセッサ バージョンで 1 分あたり 30 ページが提供されます。

ベスト エフォート階層の割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンに 120、カスタム エクストラクタ v1.5 Pro などの Pro プロセッサ バージョンに 60 が提供されます。この割り当ては、プロビジョニングされた割り当てが使い果たされた場合にのみ使用されます。これは、コンソールの割り当て BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS(指標 best_effort_online_process_document_pages_us)と BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU(指標 best_effort_online_process_document_pages_eu)に適用されます。

メモ カスタム エクストラクタ v1.4(Gemini 2.0 Flash ベース) カスタム抽出ツール v1.5(Gemini 2.5 Flash ベース) カスタム抽出ツール v1.5 Pro(Gemini 2.5 Pro ベース)
プロビジョニング済み 120 120 30
ベスト エフォート 120 120 60
組織レベルでプロビジョニング済み 240 240 60

ベスト エフォート型の割り当てに記載されている値を超える割り当てが必要な場合は、セールスチームに連絡して割り当て増加リクエスト(QIR)を行うことができます。

トラフィック量が多いときに使用可能な容量を増やすには、容量予約リクエストを行う方法に関するセクションをご覧ください。

ベスト エフォート ティアにはサービスレベル契約はありません。

割り当てリスト

次の割り当てが Document AI に適用されます。これらの割り当ては、各 Google Cloud コンソール プロジェクトに適用され、そのプロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。

処理するリクエスト数を増やしたい場合は、Google Cloud コンソールでプロジェクトの Document AI 割り当てリクエストを送信してください。

リクエストには、具体的なニーズとユースケースに関する情報を記載してください。

リクエストの割り当て デフォルト値 メモ
1 分あたりのリクエスト数 1 ユーザーあたり 1,800 件 Google Cloud コンソールで割り当てを表示する
1 分あたりのオンライン プロセス リクエスト数(米国) プロセッサ タイプごとに 1 プロジェクトあたり 120 Google Cloud コンソールで割り当てを表示する
1 分あたりのオンライン プロセス リクエスト数(EU) プロセッサ タイプごとに 1 プロジェクトあたり 120 Google Cloud コンソールで割り当てを表示する
オンライン プロセス ドキュメントのページ数(米国)、1 分あたり、プロセッサ タイプとモデル バージョン別(Gemini 2.0 Flash を使用した Custom Extractor v1.4 のみ) 1 分あたり 120 ページ* Google Cloud コンソールで割り当てを表示する
1 分あたりのオンライン処理ドキュメント ページ数(EU)(プロセッサ タイプとモデル バージョンごと)(Gemini 2.0 Flash を使用した Custom Extractor v1.4 のみ) 1 分あたり 120 ページ* Google Cloud コンソールで割り当てを表示する
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(米国)(Gemini 2.5 Flash を使用した Custom Extractor v1.5 のみ) 1 分あたり 120 ページ* Google Cloud コンソールで割り当てを表示する
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(EU)(Gemini 2.5 Flash を使用した Custom Extractor v1.5 のみ) 1 分あたり 120 ページ* Google Cloud コンソールで割り当てを表示する
1 分あたりのオンライン プロセス リクエスト数(単一リージョン) プロセッサ タイプごとにプロジェクトあたり 6 個 Google Cloud コンソールで割り当てを表示する
プロジェクトとリージョンごとの同時実行バッチプロセス リクエスト数(米国) 1 プロジェクトあたり 5 件 Google Cloud コンソールで割り当てを表示する
プロジェクトとリージョンごとの同時実行バッチプロセス リクエスト数(EU) 1 プロジェクトあたり 5 件 Google Cloud コンソールで割り当てを表示する
プロセッサあたりの同時実行バッチ処理リクエスト数(単一リージョン) 1 プロジェクトあたり 5 件 Google Cloud コンソールで割り当てを表示する
同時実行可能なプロセッサ バージョンのトレーニング リクエスト(米国) 1 プロジェクトあたり 1 個 Google Cloud コンソールで割り当てを表示する
同時実行可能なプロセッサ バージョンのトレーニング リクエスト(EU) 1 プロジェクトあたり 1 個 Google Cloud コンソールで割り当てを表示する
同時実行可能なプロセッサ バージョンのトレーニング リクエスト数(単一リージョン) プロジェクトあたり 1 個 Google Cloud コンソールで割り当てを表示する
デプロイされたカスタム プロセッサ バージョン(米国) 1 プロジェクトあたり 5 件 Google Cloud コンソールで割り当てを表示する
デプロイされたカスタム プロセッサ バージョン(EU) 1 プロジェクトあたり 5 件 Google Cloud コンソールで割り当てを表示する
デプロイされたカスタム プロセッサ バージョン(単一リージョン) 1 プロジェクトあたり 5 件 Google Cloud コンソールで割り当てを表示する
デプロイされた生成プロセッサ バージョン(米国) プロジェクトあたり、カスタム抽出プロセッサあたり 100 Google Cloud コンソールで割り当てを表示する
デプロイされた生成プロセッサ バージョン(EU) プロジェクトあたり、カスタム抽出プロセッサあたり 100 Google Cloud コンソールで割り当てを表示する
デプロイされた生成プロセッサ バージョン(単一リージョン) プロジェクトあたり、カスタム抽出プロセッサあたり 100 Google Cloud コンソールで割り当てを表示する
同時実行可能なドキュメントのインポート リクエスト(米国) 1 プロジェクトあたり 3 個 Google Cloud コンソールで割り当てを表示する
同時実行可能なドキュメントのインポート リクエスト(EU) 1 プロジェクトあたり 3 個 Google Cloud コンソールで割り当てを表示する
同時実行可能なドキュメントのインポート リクエスト(単一リージョン) 1 プロジェクトあたり 3 個 Google Cloud コンソールで割り当てを表示する
同時実行可能な輸出書類リクエスト(米国) 1 プロジェクトあたり 1 個 Google Cloud コンソールで割り当てを表示する
同時実行可能な輸出書類リクエスト(EU) 1 プロジェクトあたり 1 個 Google Cloud コンソールで割り当てを表示する
同時実行可能なエクスポート ドキュメント リクエスト(単一リージョン) 1 プロジェクトあたり 1 個 Google Cloud コンソールで割り当てを表示する

* このバージョンでは、割り当て調整リクエストはまだサポートされていません。

割り当ての調整リクエストにより、australia-southeast1 でサポートされます。

容量予約リクエストを行う

Document AI 容量予約は、サブスクライブ期間中にリアルタイムの大容量予測トラフィックを処理するための予約済み容量を提供し、サービスレベル契約(SLA)の要件を満たすのに役立ちます。各ユニットは、デフォルトの割り当てを超える 1 分あたりの追加ページ数に対応しています。

容量予約は、カスタム抽出ツール モデル v1.4 と v1.5 のプロビジョニングされた階層の割り当てを増やすためにサポートされており、必要です。これには、それらに基づいて構築されたファインチューニングされたプロセッサ バージョンも含まれます。

容量予約の料金は、1 分あたり 1 ページあたり月額 300 米ドルです。

容量予約リクエストを行うには:

  1. Google Cloud コンソールで、[IAM と管理] > [容量予約] ページに移動します。

    容量予約

  2. ページの上部にある [新しい容量予約を作成] をクリックします。2 ページの申請フォームが表示されます。

  3. [構成] ページに次の情報を入力します。

    • オーダーの名前を入力します。
    • リージョンを選択します。
    • プルダウン メニューからプロセッサのバージョンを選択します。
    • 1 か月あたりに必要な追加ページの数を 1 分あたりのページ数で記入します。
    • 定期購入の期間(月単位)を選択します。
    • 開始日時を選択します。
    • プルダウンから自動更新オプションを選択します。
  4. [続行] をクリックします。

  5. 2 ページ目には、月額費用の見積もりが表示されます。購入を検証するには、「Confirm」と入力します。

  6. [確認して送信] をクリックします。

リクエストのステータスは、[容量予約] タブで確認できます。

ステータスには次の 3 つがあります。

  • 無効: サブスクリプションがまだ開始されていません。
  • 有効: 定期購入は継続中です。
  • 完了: サブスクリプションが終了しました。

容量予約を購入する前に考慮すべきこと

容量予約を購入するかどうかを判断する際は、次の点を考慮してください。

  • 期間の途中で注文をキャンセルすることはできません。

    容量予約の購入はコミットメントであるため、期間中に注文をキャンセルすることはできません。ただし、購入した GSU の数は増やすことができます。コミットメントを誤って購入した場合や、構成に問題がある場合は、 Google Cloud アカウント担当者にお問い合わせください

  • サブスクリプションは自動更新できます。

    注文を送信する際に、サブスクリプションの期間の終了時に自動更新するか、サブスクリプションを終了するかを選択できます。自動更新プロセスはキャンセルできます。自動更新の前にサブスクリプションをキャンセルするには、次の期間の開始の 30 日前までに自動更新をキャンセルしてください。

    月単位のサブスクリプションは、毎月自動的に更新するように設定できます。週単位のプランでは自動更新はサポートされていません。