割り当て

割り当ての正確な見積もりは、各 API への秒間クエリ数(QPS)に基づいています。以降のセクションでは、各 Agent Assist 機能で使用される API の割り当てについて説明します。

割り当ての増加をリクエストする方法については、割り当てのページをご覧ください。リクエスト送信後に、Google から詳細について確認させていただく場合があります。リクエストの承認または却下の結果については、追ってお知らせいたします。

Google Cloud コンソールでマルチリージョン割り当ての割り当て増加をリクエストするときにディメンションを指定できない場合は、Google Cloud CLI を使用するか、Cloud カスタマーケアにお問い合わせください。

プロジェクトの種類

次の割り当て表には、コンシューマー プロジェクトとリソース プロジェクトの 2 種類のプロジェクトが記載されています。これらの 2 種類のプロジェクトの定義については、複数のプロジェクトの使用に関するドキュメントをご覧ください。

音声文字変換

この機能は、テレフォニー統合または gRPC 統合のいずれかを使用します。それぞれに異なる API 割り当てがあります。

テレフォニー統合

テレフォニー統合で使用される API については、Dialogflow の割り当てをご覧ください。

gRPC 統合

割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
AnalyzeContentOperationsPerMinutePerProject 300 リクエスト/分 グローバル コンシューマー プロジェクト AnalyzeContent/StreamingAnalyzeContent リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 件の同時リクエスト リージョン(グローバルと米国のマルチリージョン トラフィックは us-central1 リージョンでカウントされます)。 コンシューマー プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) リージョンごとの同時双方向ストリーミング セッション数

Chirp モデルによる音声文字変換

音声文字変換は、次の Chirp モデルをサポートしています。

  • chirp_2
  • chirp_3
割り当て名 デフォルト値 リージョン リソース プロジェクトまたはコンシューマー プロジェクトの課金 説明
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 1 分あたり 20 件のリクエスト リージョン(グローバルと米国のマルチリージョン トラフィックは us-central1 リージョンでカウントされます)。 コンシューマー プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) 割り当てディメンション: resource_type={stt_model_name}(リソースタイプごとに STT V2 に送信される新しい StreamingRecognize リクエストの数)

感情分析

割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion 300 リクエスト/分 米国(マルチリージョン) コンシューマー プロジェクト 割り当てディメンション: multi-region=us,version=v3。バージョンごと、マルチリージョンごとの AnalyzeContent または StreamingAnalyzeContent による感情分析リクエスト
AnalyzeSentimentOperationsPerMinutePerProject 300 リクエスト/分 グローバル コンシューマー プロジェクト AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 リクエスト/分 リージョン コンシューマー プロジェクト AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。

独自の支援機能を構築する

この機能では、次の AI モデルを使用します。

  • text-bison@001(デフォルトの上限は 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
GeneratorSuggestionOperationsPerMinutePerModelType 10 リクエスト/分 グローバル コンシューマー プロジェクト モデルタイプ別の生成候補オペレーション
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 リクエスト/分 リージョン コンシューマー プロジェクト 割り当てディメンション: model_type={model_name}。モデルタイプとリージョンごとの生成候補オペレーション

スマート リプライ

割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
SmartReplyBaselineModelOperationsPerMinutePerProject 120 リクエスト/分 グローバル コンシューマー プロジェクト AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン モデル リクエストを取得する
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 リクエスト/分 グローバル コンシューマー プロジェクト AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン V2 モデル リクエストを取得する
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 リクエスト/分 リージョン コンシューマー プロジェクト AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン V2 モデル リクエストを取得する

生成スマート リプライ

割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
SmartReplyBaselineModelOperationsPerMinutePerProject 120 リクエスト/分 グローバル コンシューマー プロジェクト AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン モデル リクエストを取得する
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 リクエスト/分 グローバル コンシューマー プロジェクト AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン V2 モデル リクエストを取得する
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 リクエスト/分 リージョン コンシューマー プロジェクト AnalyzeContent または SuggestSmartReplies を介してスマート リプライ ベースライン V2 モデル リクエストを取得する

要約

AI 生成の要約では、次のモデルが使用されます。

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0
  • summarization-6.0

次の表に、各バージョンの要約で使用される割り当てタイプとモデルを示します。


要約バージョン

割り当てタイプ

バックエンド モデル

Generator 6.0

生成ツールベース

事前トレーニング済みの Gemini-3.5-flash

Generator 5.0

生成ツールベース

事前トレーニング済みの Gemini-2.5-flash

Generator 4.0

生成ツールベース

事前トレーニング済みの Gemini-2.0-flash-001

Generator 3.1

生成ツールベース

Lora-tuned gemini-1.5-flash-001

Generator 3.0

生成ツールベース

Lora チューニング済み gemini-1.0-pro-002

Generator 2.1

生成ツールベース

Lora チューニング済み text-bison-32k@002

Generator 2.0

生成ツールベース

Lora チューニング済み text-bison-32k@002

Generator 1.0

生成ツールベース

Lora チューニング済み text-bison@001

ベースライン v2

ベースライン v2 モデル

text-bison

ベースライン v1

Non Generator based

LongT5 モデル

Custom 2.0

Non Generator based

LongT5 モデル

前の表の割り当てタイプは、要約で使用される API の次の割り当てリストに反映されます。


割り当てタイプ

割り当て上限名

デフォルト値

リージョン

リソース/コンシューマー プロジェクトの課金

説明

生成ツールベース

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 リクエスト/分

地域

コンシューマー プロジェクト

割り当てディメンション: model_type=summarization-{version_num}。モデルタイプとリージョンごとの生成候補オペレーション

生成ツールベース

GeneratorSuggestionOperationsPerMinutePerModelType

10 リクエスト/分

グローバル

コンシューマー プロジェクト

モデルタイプごとの生成候補オペレーション

生成ツールベース

GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion

10 リクエスト/分

米国(マルチリージョン)

コンシューマー プロジェクト

割り当てディメンション: multi-region=us, model_type=summarization-{version_num}。モデルタイプとリージョンごとの生成候補オペレーション

生成ツールベース

SuggestConversationSummaryOperationsPerMinutePerProject

60 リクエスト/分

グローバル

リソース プロジェクト

会話の要約オペレーションを提案する

Non Generator based

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 ~ 2 リクエスト/分

地域

リソース プロジェクト

各リージョンで会話の概要のオペレーションを提案する

ベースライン v2 モデル

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 リクエスト/分

グローバル

リソース プロジェクト

会話の概要の提案 V2 ベースラインのポーリング リクエスト

ベースライン v2 モデル

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 リクエスト/分

地域

リソース プロジェクト

各リージョンにおける Conversation Summary Suggestion V2 ベースラインのポーリング リクエスト数

要約の自動評価

割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
ConcurrentSummarizationEvaluationsPerProject 1 プロジェクトあたり 1 件のリクエスト コンシューマー プロジェクト 自動評価リクエスト

追加の同時実行割り当てが必要な場合は、 Google Cloud コンソールからリクエストを送信してください。この機能では、プロジェクトごとに最大 4 つの同時割り当てをサポートできます。

生成ナレッジ アシスト

割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
SearchKnowledgeRequestsPerMinutePerProject 60 リクエスト/分 グローバル コンシューマー プロジェクト SearchKnowledge リクエスト
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 リクエスト/分 リージョン コンシューマー プロジェクト 各リージョンの SearchKnowledge リクエスト数
SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion 30 リクエスト/分 米国(マルチリージョン) コンシューマー プロジェクト 割り当てディメンション: multi-region=us。各マルチリージョンでの SearchKnowledge リクエスト数

プロアクティブ生成ナレッジ アシスト

割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 リクエスト/分 グローバル リソース プロジェクト AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 リクエスト/分 リージョン リソース プロジェクト 各リージョンでの AnalyzeContent または SuggestKnowledgeAssist による KnowledgeAssist リクエスト
SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion 30 リクエスト/分 米国(マルチリージョン) リソース プロジェクト 割り当てディメンション: multi-region=us。各マルチリージョンにおける AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト

AI コーチ(LLM)

この機能は agent-coaching-2.5 AI モデルを使用します。

割り当て上限名 デフォルト値 リージョン リソース プロジェクトまたはコンシューマー プロジェクトの課金 説明
GeneratorSuggestionOperationsPerMinutePerModelType 1 分あたり 60 回のリクエスト グローバル コンシューマー プロジェクト 割り当てディメンション: model_type=agent-coaching-2.5。モデルタイプ別の生成候補オペレーション
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 1 分あたり 60 回のリクエスト リージョン コンシューマー プロジェクト 割り当てディメンション: model_type=agent-coaching-2.5。モデルタイプとリージョンごとの生成候補オペレーション
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion 1 分あたり 10 件のリクエスト 米国(マルチリージョン) コンシューマー プロジェクト 割り当てディメンション: multi-region=us,model_type=agent-coaching-2.5。モデルタイプとマルチリージョンごとのジェネレータ提案オペレーション

その他の API 割り当て

割り当て上限名 デフォルト値 リージョン 課金リソース/コンシューマー プロジェクト 説明
ConversationOperationsPerMinutePerProject 300 リクエスト/分 グローバル コンシューマー プロジェクト AnalyzeContent と StreamingAnalyzeContent 以外の会話リクエスト(CreateConversation、CompleteConversation など)。割り当ては Dialogflow と Agent Assist で共有されます。
MessagePollingOperationsPerMinutePerProject 1,200 リクエスト / 分 グローバル コンシューマー プロジェクト ListMessages リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。
AnswerRecordOperationsPerMinutePerProject 300 リクエスト / 分 グローバル コンシューマー プロジェクト AnswerRecord リクエスト