会話型分析 API の割り当てと上限

このドキュメントでは、会話型分析 API に適用される割り当てとシステムの上限について説明します。

  • 割り当てにはデフォルト値がありますが、通常は調整をリクエストできます。
  • システムの上限は固定値で、変更できません。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

詳細については、Cloud Quotas の概要をご覧ください。

会話型分析 API エージェントの割り当てと上限

会話型分析 API エージェントには、次の割り当てと上限があります。

  • プロジェクトあたりの 1 分あたりの API リクエスト数は 600(1 秒あたり 10 秒間クエリ数)に制限されています。
  • プロジェクトあたりのユーザーあたりの 1 分あたりの API リクエスト数は 600(1 秒あたり 10 秒間クエリ数)に制限されています。
  • プロジェクトごとの 1 分あたりの Chat API リクエスト数は 60(1 秒あたり 1 クエリ)に制限されています。
  • プロジェクトあたりのユーザーあたりの 1 分あたりの Chat API リクエスト数は 60(1 秒あたり 1 クエリ)に制限されています。

割り当てを管理

会話型分析 API の使用状況は、関連付けられたプロジェクトの Google Cloud コンソールの API ダッシュボードで確認できます。API ダッシュボードの使用方法の詳細

割り当ての調整をリクエストする

通常、割り当てを調整するには Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。

データソース、ビジュアリゼーション、クエリ、データ処理、質問タイプの制限事項について詳しくは、会話型分析の既知の制限事項のページをご覧ください。