会話型分析 API の割り当てと上限

このドキュメントでは、会話型分析 API に適用される割り当てとシステムの上限について説明します。

割り当てにはデフォルト値がありますが、通常は調整をリクエストできます。
システムの上限は固定値で、変更できません。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワークコンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

Google Cloud のプロダクトとサービスの消費量をモニタリングする
これらのリソースの消費量を制限する
割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、 Google Cloud プロジェクトレベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

詳細については、Cloud Quotas の概要をご覧ください。

会話型分析 API エージェントの割り当てと上限

会話型分析 API エージェントには、次の割り当てと上限があります。

プロジェクトあたりの 1 分あたりの API リクエスト数は 600（1 秒あたり 10 秒間クエリ数）に制限されています。
プロジェクトあたりのユーザーあたりの 1 分あたりの API リクエスト数は 600（1 秒あたり 10 秒間クエリ数）に制限されています。
プロジェクトごとの 1 分あたりの Chat API リクエスト数は 60（1 秒あたり 1 クエリ）に制限されています。
プロジェクトあたりのユーザーあたりの 1 分あたりの Chat API リクエスト数は 60（1 秒あたり 1 クエリ）に制限されています。

割り当てを管理

会話型分析 API の使用状況は、関連付けられたプロジェクトの Google Cloud コンソールの API ダッシュボードで確認できます。API ダッシュボードの使用方法の詳細

割り当ての調整をリクエストする

通常、割り当てを調整するには Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。

会話型分析 API の割り当てと上限 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

会話型分析 API エージェントの割り当てと上限

割り当てを管理

割り当ての調整をリクエストする

関連資料

会話型分析 API の割り当てと上限