このドキュメントでは、Gemini Enterprise の割り当てとシステム上限の一覧を示します。システム上限は固定値で、変更できません。他の Google Cloudサービスとは異なり、Gemini Enterprise の割り当てでは手動で増加をリクエストする必要はありません。割り当ては、購入したライセンスまたはシートの数に基づいて自動的に調整されます。
Google Cloud では、リソースの使用や可用性における公平性を保って急激な変動を抑えるために、割り当てが使用されています。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
詳細については、Cloud Quotas の概要をご覧ください。
Gemini Enterprise リソースにはシステムの上限もあります。システムの上限は変更できません。
Gemini Enterprise の超過料金については、割り当てと超過料金をご覧ください。
数量に基づく割り当て
次の表に、Discovery Engine API の割り当てを示します。これらの割り当ては、時間が経過してもリセットされません。代わりに、リソースを解放すると解放されます。
| 割り当て | 値 |
|---|---|
| プロジェクトあたりのデータストアの合計数 | 1001 |
| プロジェクトあたりのエンジンの合計数 | 1502 |
| プロジェクト、ロケーション(グローバル、米国、EU)ごとのリージョン データストアの数 | 100 |
| プロジェクト、ロケーション(グローバル、米国、EU)ごとのリージョン ドキュメントの数 | 10,000,000 |
| プロジェクト、ロケーション(グローバル、米国、EU)ごとのリージョン エンジンの数 | 150 |
1 技術的な制限により、データストアの最大割り当てはプロジェクトあたり 500 です。データストアがさらに必要な場合は、新しいプロジェクトを使用します。
データストア内の各エンティティはデータストア インスタンスとしてカウントされるため、この割り当てにカウントされます。たとえば、3 つのエンティティを含むデータストアは、割り当てに対して 3 つのデータストアとしてカウントされます。
2 技術的な制限により、エンジンあたりの最大割り当てはプロジェクトごとに 500 です。エンジンがさらに必要な場合は、新しいプロジェクトを使用します。
レートに基づく割り当て
Discovery Engine API リクエストには、次の割り当てが適用されます。
| 割り当て | 値 |
|---|---|
| 1 プロジェクト、1 分あたりの完全なクエリ リクエスト数 | 300 |
| 1 プロジェクト、1 ロケーション(グローバル、米国、EU)の 1 分あたりのリージョン検索リクエスト数 | 300 |