割り当てを正確に見積もるには、各 API への秒間クエリ数(QPS)を把握する必要があります。以降のセクションでは、各 Agent Assist 機能で使用される API の割り当てについて説明します。
割り当ての増加をリクエストする方法について詳しくは、割り当てのページをご覧ください。リクエストを送信すると、Google から詳細について連絡が届く場合があります。また、リクエストが承認または拒否された場合にも通知が届きます。
コンソールでマルチリージョン割り当ての割り当て増加をリクエストする際にディメンションを指定できない場合は、Google Cloud CLI を使用するか、Cloud カスタマーケアにお問い合わせください。 Google Cloud
プロジェクトの種類
次の割り当て表には、コンシューマ プロジェクトとリソース プロジェクトの 2 種類のプロジェクトが記載されています。これらの 2 種類のプロジェクトの 定義については、複数のプロジェクトの使用に関するドキュメントをご覧ください。
音声文字変換
この機能では、テレフォニー統合または gRPC 統合を使用します。それぞれ API 割り当てが異なります。
テレフォニー統合
テレフォニー統合で使用される API については、Dialogflow の割り当てをご覧ください。
gRPC 統合
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマ プロジェクト | AnalyzeContent/StreamingAnalyzeContent リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 同時リクエスト 50 件 | リージョン(グローバル トラフィックは us-central1 リージョンでカウントされます) |
コンシューマ プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) | リージョンごとの同時双方向ストリーミング セッション数 |
Chirp モデルを使用した文字変換
音声文字変換は、次の Chirp モデルをサポートしています。
- chirp_2
- chirp_3
| 割り当て名 | デフォルト値 | リージョン | 課金対象リソースまたはコンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
1 分あたり 20 件のリクエスト | リージョン(グローバル トラフィックは us-central1 リージョンでカウントされます) |
コンシューマ プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) | 割り当てディメンション: resource_type={stt_model_name}(リソースタイプごとに STT V2 に送信される新しい StreamingRecognize リクエストの数) |
感情分析
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion | 300 リクエスト/分 | 米国(マルチリージョン) | コンシューマ プロジェクト | 割り当てディメンション: multi-region=us,version=v3。
バージョンごと、マルチリージョンごとの AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマ プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 リクエスト/分 | リージョン | コンシューマ プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
独自のアシストを構築する
この機能では、次の AI モデルを使用します。
- text-bison@001(デフォルトの上限は 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 リクエスト/分 | グローバル | コンシューマ プロジェクト | モデルタイプごとの生成ツール候補オペレーション |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 リクエスト/分 | リージョン | コンシューマ プロジェクト | 割り当てディメンション: model_type={model_name}。モデルタイプとリージョンごとの生成ツール候補オペレーション |
スマート リプライ
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 リクエスト/分 | グローバル | コンシューマ プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン モデルのリクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマ プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン V2 モデルのリクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 リクエスト/分 | リージョン | コンシューマ プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン V2 モデルのリクエストを取得する |
生成スマート リプライ
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 リクエスト/分 | グローバル | コンシューマ プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン モデルのリクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマ プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン V2 モデルのリクエストを取得する |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 リクエスト/分 | リージョン | コンシューマ プロジェクト | AnalyzeContent または SuggestSmartReplies を介したスマート リプライのベースライン V2 モデルのリクエストを取得する |
要約
AI によって生成された要約では、次のモデルが使用されます。
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
次の表に、要約の各バージョンで使用される割り当てタイプとモデルを示します。
要約のバージョン |
割り当てタイプ |
バックエンド モデル |
|---|---|---|
Generator 5.0 |
Generator ベース |
事前トレーニング済み Gemini-2.5-flash |
Generator 4.0 |
Generator ベース |
事前トレーニング済み Gemini-2.0-flash-001 |
Generator 3.1 |
Generator ベース |
Lora チューニング済み gemini-1.5-flash-001 |
Generator 3.0 |
Generator ベース |
Lora チューニング済み gemini-1.0-pro-002 |
Generator 2.1 |
Generator ベース |
Lora チューニング済み text-bison-32k@002 |
Generator 2.0 |
Generator ベース |
Lora チューニング済み text-bison-32k@002 |
Generator 1.0 |
Generator ベース |
Lora チューニング済み text-bison@001 |
ベースライン v2 |
ベースライン v2 モデル |
text-bison |
ベースライン v1 |
Generator ベース以外 |
LongT5 モデル |
カスタム 2.0 |
Generator ベース以外 |
LongT5 モデル |
上の表の割り当てタイプは、要約で使用される API の次の割り当てリストに反映されます。
割り当てタイプ |
割り当て上限名 |
デフォルト値 |
リージョン |
課金対象リソース/コンシューマ プロジェクト |
説明 |
|---|---|---|---|---|---|
Generator ベース |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 リクエスト/分 |
リージョン |
コンシューマ プロジェクト |
割り当てディメンション: model_type=summarization-{version_num}。モデルタイプとリージョンごとの生成ツール候補オペレーション |
Generator ベース |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 リクエスト/分 |
グローバル |
コンシューマ プロジェクト |
モデルタイプごとの生成ツール候補オペレーション |
Generator ベース |
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion |
10 リクエスト/分 |
米国(マルチリージョン) |
コンシューマ プロジェクト |
割り当てディメンション: multi-region=us, model_type=summarization-{version_num}。モデルタイプとリージョンごとの生成ツール候補オペレーション |
Generator ベース |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 リクエスト/分 |
グローバル |
リソース プロジェクト |
会話の概要の提案オペレーション |
Generator ベース以外 |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 ~ 2 リクエスト/分 |
リージョン |
リソース プロジェクト |
各リージョンでの会話の概要の提案オペレーション |
ベースライン v2 モデル |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 リクエスト/分 |
グローバル |
リソース プロジェクト |
会話の概要の提案 V2 ベースラインのポーリング リクエスト |
ベースライン v2 モデル |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 リクエスト/分 |
リージョン |
リソース プロジェクト |
各リージョンでの会話の概要の提案 V2 ベースラインのポーリング リクエスト |
要約の自動評価
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | プロジェクトごとに 1 件のリクエスト | コンシューマ プロジェクト | 自動評価リクエスト |
同時実行割り当てを追加する必要がある場合は、 Google Cloud コンソールからリクエストを送信してください。この機能では、プロジェクトごとに最大 4 つの同時実行割り当てをサポートできます。
生成ナレッジ アシスト
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマ プロジェクト | SearchKnowledge リクエスト |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 リクエスト/分 | リージョン | コンシューマ プロジェクト | 各リージョンの SearchKnowledge リクエスト |
| SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion | 30 リクエスト/分 | 米国(マルチリージョン) | コンシューマ プロジェクト | 割り当てディメンション: multi-region=us。各マルチリージョンの SearchKnowledge リクエスト |
プロアクティブ生成ナレッジ アシスト
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | リソース プロジェクト | AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 リクエスト/分 | リージョン | リソース プロジェクト | 各リージョンの AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト |
| SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion | 30 リクエスト/分 | 米国(マルチリージョン) | リソース プロジェクト | 割り当てディメンション: multi-region=us。各マルチリージョンの AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト |
AI コーチ(LLM)
この機能では、agent-coaching-2.5 AI モデルを使用します。
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソースまたはコンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
1 分あたり 60 件のリクエスト | グローバル | コンシューマ プロジェクト | 割り当てディメンション: model_type=agent-coaching-2.5。
モデルタイプごとの生成ツール候補オペレーション |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
1 分あたり 60 件のリクエスト | リージョン | コンシューマ プロジェクト | 割り当てディメンション: model_type=agent-coaching-2.5。
モデルタイプとリージョンごとの生成ツール候補オペレーション |
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion |
1 分あたり 60 件のリクエスト | 米国(マルチリージョン) | コンシューマ プロジェクト | 割り当てディメンション: multi-region=us,model_type=agent-coaching-2.5。
モデルタイプとマルチリージョンごとの生成ツール候補オペレーション |
その他の API 割り当て
| 割り当て上限名 | デフォルト値 | リージョン | 課金対象リソース/コンシューマ プロジェクト | 説明 |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマ プロジェクト | AnalyzeContent と StreamingAnalyzeContent 以外の会話リクエスト(CreateConversation、CompleteConversation など)。割り当ては Dialogflow と Agent Assist で共有されます。 |
| MessagePollingOperationsPerMinutePerProject | 1,200 リクエスト / 分 | グローバル | コンシューマ プロジェクト | ListMessages リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
| AnswerRecordOperationsPerMinutePerProject | 300 リクエスト / 分 | グローバル | コンシューマ プロジェクト | AnswerRecord リクエスト |