このドキュメントでは、Gemini Cloud Assist に適用される割り当てとシステムの上限を示します。
- 割り当てにはデフォルト値がありますが、通常は調整をリクエストできます。
- システムの上限は固定値で、変更できません。
Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
詳細については、Cloud Quotas の概要をご覧ください。
数量に基づく割り当て
割り当てでは、特定の時点でGoogle Cloud が使用できるリソースの量が制限されます。リソースを作成すると、そのリソースの使用可能な割り当てが減少します。リソースを削除すると、割り当てが復元されます。たとえば、割り当てでリソースのインスタンスが 100 個許可されていて、50 個使用している場合は、さらに 50 個まで作成できます。50 個のインスタンスを使用している場合に 1 つ削除すると、最大 51 個のインスタンスを作成できます。
次の表に、Gemini Cloud Assist に適用される割り当てと、各割り当てのデフォルト値を示します。
| 割り当て | 値 |
|---|---|
| リソース A | 30 |
| リソース B | 100 |
レートに基づく割り当て
レートに基づく割り当てでは、リソースの使用レートが制限されます。分単位のレート割り当ては毎分リセットされます。レートに基づく 1 日あたりの割り当ては、太平洋時間の午前 0 時にリセットされます。次の表に、Gemini Cloud Assist に適用されるレート割り当てと、各割り当てのデフォルト値を示します。
| 割り当て | 値 |
|---|---|
| 1 分あたりのリクエスト数 | 1,000 |
| 1 日の機能あたりの画像数 | 700,000 点 |
| 1 日の機能あたりの動画数 | 2,000 |
システム制限
次の表に、Gemini Cloud Assist に適用されるシステムの上限と、各システムの上限の値を示します。
| システムの上限 | 値 |
|---|---|
| イメージサイズ | 4 MB |
| リクエスト サイズ | 8 MB |
| リクエストあたりの画像数 | 16 |
割り当てとシステム上限の指標名を取得する
割り当てとシステム上限には、表示名と指標名の 2 種類の名前があります。表示名には、人間が読みやすいようにスペースと大文字が含まれています。指標名は小文字で、スペースの代わりにアンダースコアで区切られる傾向があります。正確な形式はサービスによって異なります。
次の手順では、 Google Cloud コンソールまたは gcloud CLI を使用して割り当てとシステム上限の指標名を取得する方法について説明します。
コンソール
Google Cloud コンソールで、[IAM と管理] > [割り当てとシステム上限] ページに移動します。
このページの表には、使用量または調整値がある割り当ておよびシステム上限と、その他の割り当ての参照エントリが表示されます。参照エントリには、[名前] 列のリストの末尾に「default」という単語がかっこで囲まれて表示されます。たとえば、
SetIAMPolicy requests per minute per region (default)は割り当てSetIamPolicyRequestsPerMinutePerProjectの参照エントリです。[指標] 列が表示されない場合は、次の操作を行います。
- [列表示オプション] をクリックします。
- [指標] を選択します。
- [OK] をクリックします。[指標] 列が表に表示されます。
[指標] 列に指標名が表示されます。結果をフィルタするには、[ フィルタ] の横のフィールドにプロパティ名または値を入力します。
gcloud
gcloud CLI を使用して Google Cloud サービスの指標名を取得するには、quotas info list コマンドを実行します。指標名がリストされていない行をスキップするには、grep などのコマンドに出力を渡し、metric: を検索キーワードとして指定するか、gcloud CLI の --format フラグを使用します。
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
次のように置き換えます。
PROJECT_ID_OR_NUMBER: プロジェクト ID またはプロジェクト番号。SERVICE_NAME: 割り当て指標を表示するサービスの名前。たとえば、Compute Engine のサービス名はcompute.googleapis.comです。サービス名のgoogleapis.com部分を含めます。
割り当ての調整をリクエストする
通常、割り当てを調整するには Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。