Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

割り当て

割り当ての正確な見積もりは、各 API への秒間クエリ数（QPS）に基づいています。以降のセクションでは、各 Agent Assist 機能で使用される API の割り当てについて説明します。

割り当ての増加をリクエストする方法については、割り当てのページをご覧ください。リクエスト送信後に、Google から詳細について確認させていただく場合があります。リクエストの承認または却下の結果については、追ってお知らせいたします。

Google Cloud コンソールでマルチリージョン割り当ての割り当て増加をリクエストするときにディメンションを指定できない場合は、Google Cloud CLI を使用するか、Cloud カスタマーケアにお問い合わせください。

プロジェクトの種類

次の割り当て表には、コンシューマープロジェクトとリソースプロジェクトの 2 種類のプロジェクトが記載されています。これらの 2 種類のプロジェクトの定義については、複数のプロジェクトの使用に関するドキュメントをご覧ください。

音声文字変換

この機能は、テレフォニー統合または gRPC 統合のいずれかを使用します。それぞれに異なる API 割り当てがあります。

テレフォニー統合

テレフォニー統合で使用される API については、Dialogflow の割り当てをご覧ください。

gRPC 統合

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
AnalyzeContentOperationsPerMinutePerProject	300 リクエスト/分	グローバル	コンシューマープロジェクト	AnalyzeContent/StreamingAnalyzeContent リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 件の同時リクエスト	リージョン（グローバルと米国のマルチリージョントラフィックは `us-central1` リージョンでカウントされます）。	コンシューマープロジェクト（テレフォニー SipRec 統合のリソースプロジェクト）	リージョンごとの同時双方向ストリーミングセッション数

Chirp モデルによる音声文字変換

音声文字変換は、次の Chirp モデルをサポートしています。

chirp_2
chirp_3

割り当て名	デフォルト値	リージョン	リソースプロジェクトまたはコンシューマープロジェクトの課金	説明
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	1 分あたり 20 件のリクエスト	リージョン（グローバルと米国のマルチリージョントラフィックは `us-central1` リージョンでカウントされます）。	コンシューマープロジェクト（テレフォニー SipRec 統合のリソースプロジェクト）	割り当てディメンション: `resource_type={stt_model_name}`（リソースタイプごとに STT V2 に送信される新しい `StreamingRecognize` リクエストの数）

感情分析

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion	300 リクエスト/分	米国（マルチリージョン）	コンシューマープロジェクト	割り当てディメンション: `multi-region=us,version=v3`。バージョンごと、マルチリージョンごとの AnalyzeContent または StreamingAnalyzeContent による感情分析リクエスト
AnalyzeSentimentOperationsPerMinutePerProject	300 リクエスト/分	グローバル	コンシューマープロジェクト	AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 リクエスト/分	リージョン	コンシューマープロジェクト	AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。

独自の支援機能を構築する

この機能では、次の AI モデルを使用します。

text-bison@001（デフォルトの上限は 0）
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
GeneratorSuggestionOperationsPerMinutePerModelType	10 リクエスト/分	グローバル	コンシューマープロジェクト	モデルタイプ別の生成候補オペレーション
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 リクエスト/分	リージョン	コンシューマープロジェクト	割り当てディメンション: `model_type={model_name}`。モデルタイプとリージョンごとの生成候補オペレーション

スマートリプライ

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
SmartReplyBaselineModelOperationsPerMinutePerProject	120 リクエスト/分	グローバル	コンシューマープロジェクト	`AnalyzeContent` または `SuggestSmartReplies` を介してスマートリプライベースラインモデルリクエストを取得する
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 リクエスト/分	グローバル	コンシューマープロジェクト	`AnalyzeContent` または `SuggestSmartReplies` を介してスマートリプライベースライン V2 モデルリクエストを取得する
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 リクエスト/分	リージョン	コンシューマープロジェクト	`AnalyzeContent` または `SuggestSmartReplies` を介してスマートリプライベースライン V2 モデルリクエストを取得する

生成スマートリプライ

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
SmartReplyBaselineModelOperationsPerMinutePerProject	120 リクエスト/分	グローバル	コンシューマープロジェクト	`AnalyzeContent` または `SuggestSmartReplies` を介してスマートリプライベースラインモデルリクエストを取得する
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 リクエスト/分	グローバル	コンシューマープロジェクト	`AnalyzeContent` または `SuggestSmartReplies` を介してスマートリプライベースライン V2 モデルリクエストを取得する
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 リクエスト/分	リージョン	コンシューマープロジェクト	`AnalyzeContent` または `SuggestSmartReplies` を介してスマートリプライベースライン V2 モデルリクエストを取得する

要約

AI 生成の要約では、次のモデルが使用されます。

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0
summarization-6.0

次の表に、各バージョンの要約で使用される割り当てタイプとモデルを示します。

要約バージョン	割り当てタイプ	バックエンドモデル
Generator 6.0	生成ツールベース	事前トレーニング済みの Gemini-3.5-flash
Generator 5.0	生成ツールベース	事前トレーニング済みの Gemini-2.5-flash
Generator 4.0	生成ツールベース	事前トレーニング済みの Gemini-2.0-flash-001
Generator 3.1	生成ツールベース	Lora-tuned gemini-1.5-flash-001
Generator 3.0	生成ツールベース	Lora チューニング済み gemini-1.0-pro-002
Generator 2.1	生成ツールベース	Lora チューニング済み text-bison-32k@002
Generator 2.0	生成ツールベース	Lora チューニング済み text-bison-32k@002
Generator 1.0	生成ツールベース	Lora チューニング済み text-bison@001
ベースライン v2	ベースライン v2 モデル	text-bison
ベースライン v1	Non Generator based	LongT5 モデル
Custom 2.0	Non Generator based	LongT5 モデル

前の表の割り当てタイプは、要約で使用される API の次の割り当てリストに反映されます。

割り当てタイプ	割り当て上限名	デフォルト値	リージョン	リソース/コンシューマープロジェクトの課金	説明
生成ツールベース	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 リクエスト/分	地域	コンシューマープロジェクト	割り当てディメンション: `model_type=summarization-{version_num}`。モデルタイプとリージョンごとの生成候補オペレーション
生成ツールベース	GeneratorSuggestionOperationsPerMinutePerModelType	10 リクエスト/分	グローバル	コンシューマープロジェクト	モデルタイプごとの生成候補オペレーション
生成ツールベース	GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion	10 リクエスト/分	米国（マルチリージョン）	コンシューマープロジェクト	割り当てディメンション: `multi-region=us, model_type=summarization-{version_num}`。モデルタイプとリージョンごとの生成候補オペレーション
生成ツールベース	SuggestConversationSummaryOperationsPerMinutePerProject	60 リクエスト/分	グローバル	リソースプロジェクト	会話の要約オペレーションを提案する
Non Generator based	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0 ～ 2 リクエスト/分	地域	リソースプロジェクト	各リージョンで会話の概要のオペレーションを提案する
ベースライン v2 モデル	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 リクエスト/分	グローバル	リソースプロジェクト	会話の概要の提案 V2 ベースラインのポーリングリクエスト
ベースライン v2 モデル	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 リクエスト/分	地域	リソースプロジェクト	各リージョンにおける Conversation Summary Suggestion V2 ベースラインのポーリングリクエスト数

要約の自動評価

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
ConcurrentSummarizationEvaluationsPerProject	1 プロジェクトあたり 1 件のリクエスト	コンシューマープロジェクト	自動評価リクエスト

追加の同時実行割り当てが必要な場合は、 Google Cloud コンソールからリクエストを送信してください。この機能では、プロジェクトごとに最大 4 つの同時割り当てをサポートできます。

生成ナレッジアシスト

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
SearchKnowledgeRequestsPerMinutePerProject	60 リクエスト/分	グローバル	コンシューマープロジェクト	SearchKnowledge リクエスト
SearchKnowledgeRequestsPerMinutePerProjectPerRegion	30 リクエスト/分	リージョン	コンシューマープロジェクト	各リージョンの SearchKnowledge リクエスト数
SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion	30 リクエスト/分	米国（マルチリージョン）	コンシューマープロジェクト	割り当てディメンション: `multi-region=us`。各マルチリージョンでの SearchKnowledge リクエスト数

プロアクティブ生成ナレッジアシスト

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 リクエスト/分	グローバル	リソースプロジェクト	AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 リクエスト/分	リージョン	リソースプロジェクト	各リージョンでの AnalyzeContent または SuggestKnowledgeAssist による KnowledgeAssist リクエスト
SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion	30 リクエスト/分	米国（マルチリージョン）	リソースプロジェクト	割り当てディメンション: `multi-region=us`。各マルチリージョンにおける AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト

AI コーチ（LLM）

この機能は agent-coaching-2.5 AI モデルを使用します。

割り当て上限名	デフォルト値	リージョン	リソースプロジェクトまたはコンシューマープロジェクトの課金	説明
`GeneratorSuggestionOperationsPerMinutePerModelType`	1 分あたり 60 回のリクエスト	グローバル	コンシューマープロジェクト	割り当てディメンション: `model_type=agent-coaching-2.5`。モデルタイプ別の生成候補オペレーション
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	1 分あたり 60 回のリクエスト	リージョン	コンシューマープロジェクト	割り当てディメンション: `model_type=agent-coaching-2.5`。モデルタイプとリージョンごとの生成候補オペレーション
`GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion`	1 分あたり 10 件のリクエスト	米国（マルチリージョン）	コンシューマープロジェクト	割り当てディメンション: `multi-region=us,model_type=agent-coaching-2.5`。モデルタイプとマルチリージョンごとのジェネレータ提案オペレーション

その他の API 割り当て

割り当て上限名	デフォルト値	リージョン	課金リソース/コンシューマープロジェクト	説明
ConversationOperationsPerMinutePerProject	300 リクエスト/分	グローバル	コンシューマープロジェクト	AnalyzeContent と StreamingAnalyzeContent 以外の会話リクエスト（CreateConversation、CompleteConversation など）。割り当ては Dialogflow と Agent Assist で共有されます。
MessagePollingOperationsPerMinutePerProject	1,200 リクエスト / 分	グローバル	コンシューマープロジェクト	ListMessages リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。
AnswerRecordOperationsPerMinutePerProject	300 リクエスト / 分	グローバル	コンシューマープロジェクト	AnswerRecord リクエスト

割り当て コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。