割り当てとシステム上限

このドキュメントでは、Gemini Enterprise に適用される割り当てとシステム上限の一覧を示します。

  • 割り当てにはデフォルト値がありますが、通常は調整をリクエストできます。
  • システムの上限は固定値で、変更できません。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

Gemini Enterprise リソースにはシステムの上限もあります。システムの上限は変更できません。

Gemini Enterprise の超過料金については、割り当てと超過料金をご覧ください。

数量に基づく割り当て

次の表に、Discovery Engine API の割り当てを示します。これらの割り当ては、時間が経過してもリセットされません。代わりに、リソースを解放すると解放されます。デフォルトの割り当てが不足している場合は、割り当ての増加をリクエストできます。

割り当て
プロジェクトあたりのデータストアの合計数 100*
プロジェクトあたりのエンジンの合計数 150
プロジェクトあたりの保留中のインポートの長時間実行オペレーションの数 300
プロジェクトあたりの保留中のドキュメント削除の長時間実行オペレーションの数 100
プロジェクトあたりのサービス提供コントロールの数 1,000
サービス構成あたりのブースト サービス提供コントロールの数 100
サービス構成あたりのフィルタ サービス提供コントロールの数 100
サービス構成あたりのリダイレクト サービス提供コントロールの数 100
サービス構成あたりの類義語サービス提供コントロールの数 100
プロジェクト、ロケーション(グローバル、米国、EU)ごとのリージョン データストアの数 100
プロジェクト、ロケーション(グローバル、米国、EU)ごとのリージョン ドキュメントの数 10,000,000
プロジェクト、ロケーション(グローバル、米国、EU)ごとのリージョン エンジンの数 150
リージョン別のプロジェクトあたりのユーザー イベントの数(グローバル、米国、EU) 40,000,000,000

* 技術的な制限により、データストアの最大割り当てはプロジェクトあたり 500 です。データストアがさらに必要な場合は、新しいプロジェクトを使用します。

技術的な制限により、エンジンあたりの最大割り当てはプロジェクトごとに 500 です。エンジンがさらに必要な場合は、新しいプロジェクトを使用します。

レートに基づく割り当て

Discovery Engine API リクエストには、次の割り当てが適用されます。デフォルトの割り当てが十分でない場合は、割り当ての増加をリクエストできます。

割り当て
1 プロジェクト、1 分あたりの完全なクエリ リクエスト数 300
1 プロジェクト、1 分あたりの会話型検索読み取りリクエスト数 300
1 プロジェクト、1 分あたりの会話型検索書き込みリクエスト数 300
1 プロジェクト、1 分あたりのドキュメント一括リクエスト数(インライン インポートや削除など) 100
1 プロジェクト、1 分あたりのドキュメント非同期インポート リクエスト数(Cloud Storage、BigQuery など) 5
1 プロジェクト、1 分あたりのドキュメント削除リクエスト数 100
1 プロジェクト、1 分あたりのドキュメント読み取りリクエスト数 300
1 プロジェクト、1 分あたりのドキュメント書き込みリクエスト数 12,000
1 プロジェクト、1 日あたりの評価作成リクエスト数 5
1 プロジェクト、1 分あたりの評価読み取りリクエスト数 100
1 プロジェクト、1 分あたりの評価書き込みリクエスト数 100
1 プロジェクト、1 分あたりのグラウンディング生成チェックのグラウンディング リクエスト数 300
1 プロジェクト、1 分あたりの LLM クエリ リクエスト数(検索の要約、マルチターンの検索) 60
1 分あたりの保留中の FHIR または BigQuery ストリーミング書き込みの数。 6,000
プロジェクトあたりのサンプルクエリ セットの数 100
1 プロジェクト、1 分あたりのランキング API リクエスト数 500
1 プロジェクト、1 分あたりの推奨リクエスト数 60,000
1 プロジェクト、1 分あたりのサンプルクエリ読み取りリクエスト数 200
1 プロジェクト、1 分あたりのサンプルクエリ セット読み取りリクエスト数 100
1 プロジェクト、1 分あたりのサンプルクエリ セット書き込みリクエスト数 100
1 プロジェクト、1 分あたりのサンプルクエリ書き込みリクエスト数 200
1 プロジェクト、1 分あたりのスキーマ読み取りリクエスト数 100
1 プロジェクト、1 分あたりのスキーマ書き込みリクエスト数 100
1 プロジェクト、1 ロケーション(グローバル、米国、EU)の 1 分あたりのリージョン検索リクエスト数 300
1 プロジェクト、1 分あたりのユーザー イベント バッチ リクエスト数(インポートや削除など) 100
1 プロジェクト、1 ユーザーの 1 分あたりのユーザー イベント収集リクエスト数 240
1 プロジェクト、1 分あたりのユーザー イベントの書き込みリクエスト数 60,000

割り当ての増加をリクエストする

通常、割り当てを調整するには Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。