割り当てを正確に見積もるには、各 API への 1 秒あたりのクエリ数(QPS)を把握する必要があります。以降のセクションでは、各 Agent Assist 機能で使用される API の割り当てについて説明します。
割り当ての増加をリクエストする方法について詳しくは、割り当てのページをご覧ください。リクエストを送信すると、Google から詳細についてご連絡する場合があります。また、リクエストが承認または拒否された場合にも通知が届きます。
プロジェクトの種類
次の割り当ての表には、コンシューマー プロジェクトとリソース プロジェクトの 2 種類のプロジェクトが記載されています。これらの 2 種類のプロジェクトの定義については、複数のプロジェクトを使用するをご覧ください。
音声文字変換
この機能では、テレフォニー統合または gRPC 統合を使用します。それぞれ API の割り当てが異なります。
テレフォニー統合
テレフォニー統合で使用される API については、Dialogflow の割り当てをご覧ください。
gRPC 統合
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent/StreamingAnalyzeContent リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 同時リクエスト 50 件 | リージョン(グローバル トラフィックは us-central1 リージョンでカウントされます) |
コンシューマー プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) | リージョンごとの同時双方向ストリーミング セッション数 |
Chirp モデルを使用した文字起こし
| 割り当て名 | デフォルト値 | リージョン | 課金対象リソースまたはコンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
1 分あたり 20 件のリクエスト | リージョン(グローバル トラフィックは us-central1 リージョンでカウントされます) |
コンシューマー プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) | リソースタイプごとに STT V2 に送信される新しい StreamingRecognize リクエストの数 |
感情分析
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| AnalyzeSentimentOperationsPerVersion | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
| AnalyzeSentimentOperationsPerVersionPerRegion | 300 リクエスト/分 | リージョン | コンシューマー プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 リクエスト/分 | リージョン | コンシューマー プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
独自のアシストを構築する
この機能では、次の AI モデルを使用します。
- text-bison@001(デフォルトの上限は 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 リクエスト/分 | グローバル | コンシューマー プロジェクト | モデルタイプごとの生成ツール候補オペレーション |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 リクエスト/分 | リージョン | コンシューマー プロジェクト | モデルタイプとリージョンごとの生成ツール候補オペレーション |
スマート リプライ
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン モデルのリクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン モデル V2 のリクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 リクエスト/分 | リージョン | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン モデル V2 のリクエストを取得する |
生成スマート リプライ
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン モデルのリクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン モデル V2 のリクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 リクエスト/分 | リージョン | コンシューマー プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン モデル V2 のリクエストを取得する |
要約
AI によって生成された要約では、次のモデルが使用されます。
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
次の表に、要約の各バージョンで使用される割り当てタイプとモデルを示します。
要約のバージョン |
割り当てタイプ |
バックエンド モデル |
|---|---|---|
Generator 5.0 |
Generator ベース |
事前トレーニング済み Gemini-2.5-flash |
Generator 4.0 |
Generator ベース |
事前トレーニング済み Gemini-2.0-flash-001 |
Generator 3.1 |
Generator ベース |
Lora チューニング済み gemini-1.5-flash-001 |
Generator 3.0 |
Generator ベース |
Lora チューニング済み gemini-1.0-pro-002 |
Generator 2.1 |
Generator ベース |
Lora チューニング済み text-bison-32k@002 |
Generator 2.0 |
Generator ベース |
Lora チューニング済み text-bison-32k@002 |
Generator 1.0 |
Generator ベース |
Lora チューニング済み text-bison@001 |
ベースライン v2 |
ベースライン v2 モデル |
text-bison |
ベースライン v1 |
Generator ベース以外 |
LongT5 モデル |
カスタム 2.0 |
Generator ベース以外 |
LongT5 モデル |
上の表の割り当てタイプは、要約で使用される API の次の割り当てリストに反映されます。
割り当てタイプ |
割り当て上限名 |
デフォルト値 |
リージョン |
課金対象リソース/コンシューマー プロジェクト |
説明 |
|---|---|---|---|---|---|
Generator ベース |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 リクエスト/分 |
リージョン |
コンシューマー プロジェクト |
モデルタイプとリージョンごとの生成ツール候補オペレーション |
Generator ベース |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 リクエスト/分 |
グローバル |
コンシューマー プロジェクト |
モデルタイプごとの生成ツール候補オペレーション |
Generator ベース |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 リクエスト/分 |
グローバル |
リソース プロジェクト |
会話の概要の提案オペレーション |
Generator ベース以外 |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 ~ 2 リクエスト/分 |
リージョン |
リソース プロジェクト |
各リージョンでの会話の概要の提案オペレーション |
ベースライン v2 モデル |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 リクエスト/分 |
グローバル |
リソース プロジェクト |
会話の概要の提案 V2 ベースラインのポーリング リクエスト |
ベースライン v2 モデル |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 リクエスト/分 |
リージョン |
リソース プロジェクト |
各リージョンでの会話の概要の提案 V2 ベースラインのポーリング リクエスト |
要約の自動評価
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 プロジェクトあたり 1 件のリクエスト | コンシューマー プロジェクト | 自動評価リクエスト |
同時実行割り当てを追加する必要がある場合は、 Google Cloud コンソールからリクエストを送信してください。この機能では、プロジェクトごとに最大 4 つの同時実行割り当てをサポートできます。
生成ナレッジ アシスト
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマー プロジェクト | SearchKnowledge リクエスト |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 リクエスト/分 | リージョン | コンシューマー プロジェクト | 各リージョンの SearchKnowledge リクエスト |
プロアクティブ生成ナレッジ アシスト
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | リソース プロジェクト | AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 リクエスト/分 | リージョン | リソース プロジェクト | 各リージョンでの AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト |
AI コーチ(LLM)
この機能では、agent-coaching-2.5 AI モデルを使用します。
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソースまたはコンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
1 分あたり 60 件のリクエスト | グローバル | コンシューマー プロジェクト | モデルタイプごとの生成ツール候補オペレーション |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
1 分あたり 60 件のリクエスト | リージョン | コンシューマー プロジェクト | モデルタイプとリージョンごとの生成ツール候補オペレーション |
その他の API 割り当て
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマー プロジェクト | 説明 |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent と StreamingAnalyzeContent 以外の会話リクエスト(CreateConversation、CompleteConversation など)。割り当ては Dialogflow と Agent Assist で共有されます。 |
| MessagePollingOperationsPerMinutePerProject | 1,200 リクエスト / 分 | グローバル | コンシューマー プロジェクト | ListMessages リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
| AnswerRecordOperationsPerMinutePerProject | 300 リクエスト / 分 | グローバル | コンシューマー プロジェクト | AnswerRecord リクエスト |