割り当ての正確な見積もりは、各 API への秒間クエリ数(QPS)に基づいています。以降のセクションでは、各 Agent Assist 機能で使用される API の割り当てについて説明します。
割り当ての増加をリクエストする方法については、割り当てのページをご覧ください。リクエスト送信後に、Google から詳細について確認させていただく場合があります。リクエストの承認または却下の結果については、追ってお知らせいたします。
Google Cloud コンソールでマルチリージョン割り当ての割り当て増加をリクエストするときにディメンションを指定できない場合は、Google Cloud CLI を使用するか、Cloud カスタマーケアにお問い合わせください。
プロジェクトの種類
次の割り当て表には、コンシューマー プロジェクトとリソース プロジェクトの 2 種類のプロジェクトが記載されています。これらの 2 種類のプロジェクトの定義については、複数のプロジェクトの使用に関するドキュメントをご覧ください。
音声文字変換
この機能は、テレフォニー統合または gRPC 統合のいずれかを使用します。それぞれに異なる API 割り当てがあります。
テレフォニー統合
テレフォニー統合で使用される API については、Dialogflow の割り当てをご覧ください。
gRPC 統合
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent/StreamingAnalyzeContent リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 件の同時リクエスト | リージョン(グローバルと米国のマルチリージョン トラフィックは us-central1 リージョンでカウントされます)。 |
コンシューマー プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) | リージョンごとの同時双方向ストリーミング セッション数 |
Chirp モデルによる音声文字変換
音声文字変換は、次の Chirp モデルをサポートしています。
- chirp_2
- chirp_3
| 割り当て名 | デフォルト値 | リージョン | リソース プロジェクトまたはコンシューマー プロジェクトの課金 | 説明 |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
1 分あたり 20 件のリクエスト | リージョン(グローバルと米国のマルチリージョン トラフィックは us-central1 リージョンでカウントされます)。 |
コンシューマー プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) | 割り当てディメンション: resource_type={stt_model_name}(リソースタイプごとに STT V2 に送信される新しい StreamingRecognize リクエストの数) |
感情分析
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion | 300 リクエスト/分 | 米国(マルチリージョン) | コンシューマー プロジェクト | 割り当てディメンション: multi-region=us,version=v3。バージョンごと、マルチリージョンごとの AnalyzeContent または StreamingAnalyzeContent による感情分析リクエスト |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 リクエスト/分 | リージョン | コンシューマー プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
独自の支援機能を構築する
この機能では、次の AI モデルを使用します。
- text-bison@001(デフォルトの上限は 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 リクエスト/分 | グローバル | コンシューマー プロジェクト | モデルタイプ別の生成候補オペレーション |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 リクエスト/分 | リージョン | コンシューマー プロジェクト | 割り当てディメンション: model_type={model_name}。モデルタイプとリージョンごとの生成候補オペレーション |
スマート リプライ
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン モデル リクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン V2 モデル リクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 リクエスト/分 | リージョン | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン V2 モデル リクエストを取得する |
生成スマート リプライ
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン モデル リクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン V2 モデル リクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 リクエスト/分 | リージョン | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン V2 モデル リクエストを取得する |
要約
AI 生成の要約では、次のモデルが使用されます。
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
- summarization-6.0
次の表に、各バージョンの要約で使用される割り当てタイプとモデルを示します。
要約バージョン |
割り当てタイプ |
バックエンド モデル |
|---|---|---|
Generator 6.0 |
生成ツールベース |
事前トレーニング済みの Gemini-3.5-flash |
Generator 5.0 |
生成ツールベース |
事前トレーニング済みの Gemini-2.5-flash |
Generator 4.0 |
生成ツールベース |
事前トレーニング済みの Gemini-2.0-flash-001 |
Generator 3.1 |
生成ツールベース |
Lora-tuned gemini-1.5-flash-001 |
Generator 3.0 |
生成ツールベース |
Lora チューニング済み gemini-1.0-pro-002 |
Generator 2.1 |
生成ツールベース |
Lora チューニング済み text-bison-32k@002 |
Generator 2.0 |
生成ツールベース |
Lora チューニング済み text-bison-32k@002 |
Generator 1.0 |
生成ツールベース |
Lora チューニング済み text-bison@001 |
ベースライン v2 |
ベースライン v2 モデル |
text-bison |
ベースライン v1 |
Non Generator based |
LongT5 モデル |
Custom 2.0 |
Non Generator based |
LongT5 モデル |
前の表の割り当てタイプは、要約で使用される API の次の割り当てリストに反映されます。
割り当てタイプ |
割り当て上限名 |
デフォルト値 |
リージョン |
リソース/コンシューマー プロジェクトの課金 |
説明 |
|---|---|---|---|---|---|
生成ツールベース |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 リクエスト/分 |
地域 |
コンシューマー プロジェクト |
割り当てディメンション: model_type=summarization-{version_num}。モデルタイプとリージョンごとの生成候補オペレーション |
生成ツールベース |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 リクエスト/分 |
グローバル |
コンシューマー プロジェクト |
モデルタイプごとの生成候補オペレーション |
生成ツールベース |
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion |
10 リクエスト/分 |
米国(マルチリージョン) |
コンシューマー プロジェクト |
割り当てディメンション: multi-region=us, model_type=summarization-{version_num}。モデルタイプとリージョンごとの生成候補オペレーション |
生成ツールベース |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 リクエスト/分 |
グローバル |
リソース プロジェクト |
会話の要約オペレーションを提案する |
Non Generator based |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 ~ 2 リクエスト/分 |
地域 |
リソース プロジェクト |
各リージョンで会話の概要のオペレーションを提案する |
ベースライン v2 モデル |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 リクエスト/分 |
グローバル |
リソース プロジェクト |
会話の概要の提案 V2 ベースラインのポーリング リクエスト |
ベースライン v2 モデル |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 リクエスト/分 |
地域 |
リソース プロジェクト |
各リージョンにおける Conversation Summary Suggestion V2 ベースラインのポーリング リクエスト数 |
要約の自動評価
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 プロジェクトあたり 1 件のリクエスト | コンシューマー プロジェクト | 自動評価リクエスト |
追加の同時実行割り当てが必要な場合は、 Google Cloud コンソールからリクエストを送信してください。この機能では、プロジェクトごとに最大 4 つの同時割り当てをサポートできます。
生成ナレッジ アシスト
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマー プロジェクト | SearchKnowledge リクエスト |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 リクエスト/分 | リージョン | コンシューマー プロジェクト | 各リージョンの SearchKnowledge リクエスト数 |
| SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion | 30 リクエスト/分 | 米国(マルチリージョン) | コンシューマー プロジェクト | 割り当てディメンション: multi-region=us。各マルチリージョンでの SearchKnowledge リクエスト数 |
プロアクティブ生成ナレッジ アシスト
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | リソース プロジェクト | AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 リクエスト/分 | リージョン | リソース プロジェクト | 各リージョンでの AnalyzeContent または SuggestKnowledgeAssist による KnowledgeAssist リクエスト |
| SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion | 30 リクエスト/分 | 米国(マルチリージョン) | リソース プロジェクト | 割り当てディメンション: multi-region=us。各マルチリージョンにおける AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト |
AI コーチ(LLM)
この機能は agent-coaching-2.5 AI モデルを使用します。
| 割り当て上限名 | デフォルト値 | リージョン | リソース プロジェクトまたはコンシューマー プロジェクトの課金 | 説明 |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
1 分あたり 60 回のリクエスト | グローバル | コンシューマー プロジェクト | 割り当てディメンション: model_type=agent-coaching-2.5。モデルタイプ別の生成候補オペレーション |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
1 分あたり 60 回のリクエスト | リージョン | コンシューマー プロジェクト | 割り当てディメンション: model_type=agent-coaching-2.5。モデルタイプとリージョンごとの生成候補オペレーション |
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion |
1 分あたり 10 件のリクエスト | 米国(マルチリージョン) | コンシューマー プロジェクト | 割り当てディメンション: multi-region=us,model_type=agent-coaching-2.5。モデルタイプとマルチリージョンごとのジェネレータ提案オペレーション |
その他の API 割り当て
| 割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent と StreamingAnalyzeContent 以外の会話リクエスト(CreateConversation、CompleteConversation など)。割り当ては Dialogflow と Agent Assist で共有されます。 |
| MessagePollingOperationsPerMinutePerProject | 1,200 リクエスト / 分 | グローバル | コンシューマー プロジェクト | ListMessages リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
| AnswerRecordOperationsPerMinutePerProject | 300 リクエスト / 分 | グローバル | コンシューマー プロジェクト | AnswerRecord リクエスト |