割り当て

このドキュメントでは、 Document AI の割り当てと上限について説明します。

  • 割り当てにはデフォルト値がありますが、通常は 調整をリクエストできます。
  • システムの上限は固定値で、変更できません。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

詳細については、 Cloud Quotas の概要をご覧ください。

プロジェクトで使用可能な容量を増やすには、容量予約リクエストをご覧ください。

オンライン サービス層

Document AI は、生成 AI を搭載したプロセッサ バージョンへのオンライン処理リクエストに対して、プロビジョニング済みティアとベスト エフォート ティアの 2 つのサービスティアと関連する割り当てをサポートしています。

プロビジョニング済みティアの割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンで 1 分あたり 120 ページ、カスタム エクストラクタ v1.5 Pro などのベース プロセッサ バージョンで 1 分あたり 30 ページが提供されます。

ベスト エフォート ティアの割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンで 120、カスタム エクストラクタ v1.5 Pro などの Pro プロセッサ バージョンで 60 が提供され、プロビジョニング済み割り当てが使い果たされた場合にのみ使用されます。これは、コンソールの割り当て BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS(指標 best_effort_online_process_document_pages_us)と BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU(指標 best_effort_online_process_document_pages_eu)に適用されます。

メモ Gemini 2.0 Flash に基づくプロセッサ Gemini 2.5 Flash に基づくプロセッサ Gemini 2.5 Pro に基づくプロセッサ
次のようなプロセッサ: カスタム エクストラクタ v1.4 カスタム エクストラクタ v1.5 カスタム エクストラクタ v1.5 Pro や v1.6 Pro などのすべての Pro バージョン
プロビジョニング済み 120 120 30
ベスト エフォート 120 120 60
割り当て増加リクエストによるベスト エフォート 240 240 120
組織レベルでプロビジョニング済み 240 240 60
購入した予約容量 利用可能 利用可能 利用不可

ベスト エフォートの割り当てを超える量が必要な場合は、営業チームにお問い合わせのうえ、割り当て 増加リクエスト(QIR)を送信してください。

トラフィック量が多いときに使用可能な容量を増やすには、 容量予約リクエストを送信する方法をご覧ください。

ベスト エフォート ティアにはサービスレベル契約はありません。

割り当てリスト

以下の割り当てが Document AI に適用されます。 この割り当ては、各 Google Cloud コンソールプロジェクトに適用され、そのプロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。

より多くのリクエストを処理する場合は、 コンソールでプロジェクトの Document AI 割り当て リクエストを送信してください。Google Cloud

リクエストで、具体的なニーズとユースケースに関する情報を提供してください。

1 分あたりのベース リクエスト数(RPM) デフォルト値 メモ
1 分あたりのリクエスト数 ユーザーあたり 1,8001 コンソールで割り当てを表示する Google Cloud
プロビジョニング済み同期汎用 RPM
1 分あたりのオンライン処理リクエスト数(米国) プロセッサ タイプごとに 1 プロジェクトあたり 120 コンソールで割り当てを表示する Google Cloud
1 分あたりのオンライン処理リクエスト数(EU) プロセッサ タイプごとに 1 プロジェクトあたり 120 コンソールで割り当てを表示する Google Cloud
1 分あたりのオンライン処理リクエスト数(単一リージョン) プロセッサ タイプごとに 1 プロジェクトあたり 6 コンソールで割り当てを表示する Google Cloud
生成 AI 同期 PPM
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(米国)(Gemini 2.0 Flash を使用したカスタム エクストラクタ v1.4 のみ) 1 分あたり 120 ページ2 コンソールで割り当てを表示する Google Cloud
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(EU)(Gemini 2.0 Flash を使用したカスタム エクストラクタ v1.4 のみ) 1 分あたり 120 ページ2 コンソールで割り当てを表示する Google Cloud
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(米国)(Gemini 2.5 Flash を使用したカスタム エクストラクタ v1.5 のみ) 1 分あたり 120 ページ2 コンソールで割り当てを表示する Google Cloud
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(EU)(Gemini 2.5 Flash を使用したカスタム エクストラクタ v1.5 のみ) 1 分あたり 120 ページ2 コンソールで割り当てを表示する Google Cloud
ベスト エフォート同期 PPM
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(米国) 1 分あたり 120 ページ4 コンソールで割り当てを表示する Google Cloud
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(EU) 1 分あたり 120 ページ4 コンソールで割り当てを表示する Google Cloud
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(単一リージョン) 1 分あたり 120 ページ4 コンソールで割り当てを表示する Google Cloud
同時実行バッチ
プロジェクトとリージョンごとの同時実行バッチ処理リクエスト数(米国) 1 プロジェクトあたり 5 件 コンソールで割り当てを表示する Google Cloud
プロジェクトとリージョンごとの同時実行バッチ処理リクエスト数(EU) 1 プロジェクトあたり 5 件 コンソールで割り当てを表示する Google Cloud
プロセッサごとの同時実行バッチ処理リクエスト数(単一リージョン) 1 プロジェクトあたり 5 件 コンソールで割り当てを表示する Google Cloud
同時実行トレーニング
同時実行プロセッサ バージョン トレーニング リクエスト数(米国) 1 プロジェクトあたり 1 件 コンソールで割り当てを表示する Google Cloud
同時実行プロセッサ バージョン トレーニング リクエスト数(EU) 1 プロジェクトあたり 1 件 コンソールで割り当てを表示する Google Cloud
同時実行プロセッサ バージョン トレーニング リクエスト数(単一リージョン) 1 プロジェクトあたり 1 件3 コンソールで割り当てを表示する Google Cloud
デプロイされたプロセッサ
デプロイされたカスタム プロセッサ バージョン(米国) 1 プロジェクトあたり 5 件 コンソールで割り当てを表示する Google Cloud
デプロイされたカスタム プロセッサ バージョン(EU) 1 プロジェクトあたり 5 件 コンソールで割り当てを表示する Google Cloud
デプロイされたカスタム プロセッサ バージョン(単一リージョン) 1 プロジェクトあたり 5 件 コンソールで割り当てを表示する Google Cloud
デプロイされた生成 AI プロセッサ
デプロイされた生成プロセッサ バージョン(米国) カスタム抽出プロセッサごとに 1 プロジェクトあたり 100 コンソールで割り当てを表示する Google Cloud
デプロイされた生成プロセッサ バージョン(EU) カスタム抽出プロセッサごとに 1 プロジェクトあたり 100 コンソールで割り当てを表示する Google Cloud
デプロイされた生成プロセッサ バージョン(単一リージョン) カスタム抽出プロセッサごとに 1 プロジェクトあたり 100 コンソールで割り当てを表示する Google Cloud
同時インポート
同時インポート ドキュメント リクエスト数(米国) 1 プロジェクトあたり 3 件 コンソールで割り当てを表示する Google Cloud
同時インポート ドキュメント リクエスト数(EU) 1 プロジェクトあたり 3 件 コンソールで割り当てを表示する Google Cloud
同時インポート ドキュメント リクエスト数(単一リージョン) 1 プロジェクトあたり 3 件 コンソールで割り当てを表示する Google Cloud
同時エクスポート
同時エクスポート ドキュメント リクエスト数(米国) 1 プロジェクトあたり 1 件 コンソールで割り当てを表示する Google Cloud
同時エクスポート ドキュメント リクエスト数(EU) 1 プロジェクトあたり 1 件 コンソールで割り当てを表示する Google Cloud
同時エクスポート ドキュメント リクエスト数(単一リージョン) 1 プロジェクトあたり 1 件 コンソールで割り当てを表示する Google Cloud
  1. 1 分あたりのリクエスト数の割り当てバッチは、1 分あたりにリクエストされるドキュメントの数であり、ページ数や `batchProcess` API 呼び出しの数ではありません。
  2. このバージョンでは、割り当て調整リクエストはまだサポートされていません。
  3. australia-southeast1 で、割り当て調整リクエストでサポートされています。
  4. Gemini のバージョンによって異なります。サービスティアをご覧ください。容量予約リクエストを送信する方法を確認してください。

プロジェクトでより多くの容量が必要な場合は、容量 予約をご覧ください。