このドキュメントでは、Document AI に適用される割り当てと上限について説明します。
- 割り当てにはデフォルト値がありますが、通常は調整をリクエストできます。
- システムの上限は固定値で、変更できません。
Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
詳細については、Cloud Quotas の概要をご覧ください。
プロジェクトで使用可能な容量を増やすには、容量予約リクエストをご覧ください。
サービス階層
Document AI は、生成 AI を搭載したプロセッサ バージョンに対するオンライン プロセス リクエスト用に、プロビジョニング済み階層とベスト エフォート階層の 2 つのサービス階層と関連する割り当てをサポートしています。
プロビジョニングされた階層の割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンで 1 分あたり 120 ページ、カスタム エクストラクタ v1.5 Pro などのベース プロセッサ バージョンで 1 分あたり 30 ページが提供されます。
ベスト エフォート階層の割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンに 120、カスタム エクストラクタ v1.5 Pro などの Pro プロセッサ バージョンに 60 が提供されます。この割り当ては、プロビジョニングされた割り当てが使い果たされた場合にのみ使用されます。これは、コンソールの割り当て BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS(指標 best_effort_online_process_document_pages_us)と BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU(指標 best_effort_online_process_document_pages_eu)に適用されます。
| メモ | カスタム エクストラクタ v1.4(Gemini 2.0 Flash ベース) | カスタム抽出ツール v1.5(Gemini 2.5 Flash ベース) | カスタム抽出ツール v1.5 Pro(Gemini 2.5 Pro ベース) |
|---|---|---|---|
| プロビジョニング済み | 120 | 120 | 30 |
| ベスト エフォート | 120 | 120 | 60 |
| 組織レベルでプロビジョニング済み | 240 | 240 | 60 |
ベスト エフォート型の割り当てに記載されている値を超える割り当てが必要な場合は、セールスチームに連絡して割り当て増加リクエスト(QIR)を行うことができます。
トラフィック量が多いときに使用可能な容量を増やすには、容量予約リクエストを行う方法に関するセクションをご覧ください。
ベスト エフォート ティアにはサービスレベル契約はありません。
割り当てリスト
次の割り当てが Document AI に適用されます。これらの割り当ては、各 Google Cloud コンソール プロジェクトに適用され、そのプロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。
処理するリクエスト数を増やしたい場合は、Google Cloud コンソールでプロジェクトの Document AI 割り当てリクエストを送信してください。
リクエストには、具体的なニーズとユースケースに関する情報を記載してください。
| リクエストの割り当て | デフォルト値 | メモ |
|---|---|---|
| 1 分あたりのリクエスト数 | 1 ユーザーあたり 1,800 件 | Google Cloud コンソールで割り当てを表示する |
| 1 分あたりのオンライン プロセス リクエスト数(米国) | プロセッサ タイプごとに 1 プロジェクトあたり 120 | Google Cloud コンソールで割り当てを表示する |
| 1 分あたりのオンライン プロセス リクエスト数(EU) | プロセッサ タイプごとに 1 プロジェクトあたり 120 | Google Cloud コンソールで割り当てを表示する |
| オンライン プロセス ドキュメントのページ数(米国)、1 分あたり、プロセッサ タイプとモデル バージョン別(Gemini 2.0 Flash を使用した Custom Extractor v1.4 のみ) | 1 分あたり 120 ページ* | Google Cloud コンソールで割り当てを表示する |
| 1 分あたりのオンライン処理ドキュメント ページ数(EU)(プロセッサ タイプとモデル バージョンごと)(Gemini 2.0 Flash を使用した Custom Extractor v1.4 のみ) | 1 分あたり 120 ページ* | Google Cloud コンソールで割り当てを表示する |
| オンライン処理ドキュメントのページ数(米国)、1 分あたり、プロセッサ タイプとモデル バージョン別(Gemini 2.5 Flash を使用した Custom Extractor v1.5 のみ) | 1 分あたり 120 ページ* | Google Cloud コンソールで割り当てを表示する |
| プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(EU)(Gemini 2.5 Flash を使用した Custom Extractor v1.5 のみ) | 1 分あたり 120 ページ* | Google Cloud コンソールで割り当てを表示する |
| 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(米国)、プロセッサ タイプとモデル バージョンごと | 1 分あたり 120 ページ‡ | Google Cloud コンソールで割り当てを表示する |
| 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(EU)、プロセッサ タイプとモデル バージョンごと | 1 分あたり 120 ページ‡ | Google Cloud コンソールで割り当てを表示する |
| 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(単一リージョン、プロセッサ タイプとモデル バージョンごと) | 1 分あたり 120 ページ‡ | Google Cloud コンソールで割り当てを表示する |
| 1 分あたりのオンライン プロセス リクエスト数(単一リージョン) | プロセッサ タイプごとにプロジェクトあたり 6 個 | Google Cloud コンソールで割り当てを表示する |
| プロジェクトとリージョンごとの同時実行バッチ処理リクエスト数(米国) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
| プロジェクトとリージョンごとの同時実行バッチ処理リクエスト数(EU) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
| プロセッサあたりの同時実行バッチ処理リクエスト数(単一リージョン) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能なプロセッサ バージョンのトレーニング リクエスト(米国) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能なプロセッサ バージョンのトレーニング リクエスト(EU) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能なプロセッサ バージョンのトレーニング リクエスト数(単一リージョン) | プロジェクトあたり 1 個† | Google Cloud コンソールで割り当てを表示する |
| デプロイされたカスタム プロセッサ バージョン(米国) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
| デプロイされたカスタム プロセッサ バージョン(EU) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
| デプロイされたカスタム プロセッサ バージョン(単一リージョン) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
| デプロイされた生成プロセッサ バージョン(米国) | プロジェクトあたり、カスタム抽出プロセッサあたり 100 | Google Cloud コンソールで割り当てを表示する |
| デプロイされた生成プロセッサ バージョン(EU) | プロジェクトあたり、カスタム抽出プロセッサあたり 100 | Google Cloud コンソールで割り当てを表示する |
| デプロイされた生成プロセッサ バージョン(単一リージョン) | プロジェクトあたり、カスタム抽出プロセッサあたり 100 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能なドキュメントのインポート リクエスト(米国) | 1 プロジェクトあたり 3 個 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能なドキュメントのインポート リクエスト(EU) | 1 プロジェクトあたり 3 個 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能なドキュメントのインポート リクエスト(単一リージョン) | 1 プロジェクトあたり 3 個 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能な輸出書類のリクエスト数(米国) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能な輸出書類のリクエスト(EU) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
| 同時実行可能なエクスポート ドキュメント リクエスト(単一リージョン) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
* このバージョンでは、割り当て調整リクエストはまだサポートされていません。
† 割り当ての調整リクエストで australia-southeast1 でサポートされています。
‡ Gemini のバージョンによって異なります。サービスティアをご覧ください。容量予約リクエストを行う方法を確認する。
プロジェクトでより多くの容量が必要な場合は、容量予約をご覧ください。