Cotas

A estimativa precisa de cota se baseia no número de consultas por segundo (QPS) para cada API. As seções a seguir descrevem as cotas das APIs usadas com cada recurso do Agent Assist.

Consulte a página de cotas para mais informações sobre como solicitar um aumento de cota. Depois de enviar a solicitação, o Google poderá entrar em contato para pedir mais informações e informar quando ela for aprovada ou negada.

Tipos de projeto

As tabelas de cotas a seguir listam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre como usar vários projetos para ver as definições desses dois tipos.

Transcrição de voz

Esse recurso usa a integração de telefonia ou gRPC, que têm cotas de API diferentes.

Integração de telefonia

Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.

Integração do gRPC

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
AnalyzeContentOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Solicitações de AnalyzeContent/StreamingAnalyzeContent. A cota é compartilhada entre o Dialogflow e o Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 solicitações simultâneas Regional (o tráfego global é contabilizado na região us-central1) Projeto do consumidor (projeto de recurso para integração de telefonia SipRec) Sessões de streaming bidirecional simultâneas por região

Transcrição com modelos do Chirp

Nome da cota Valor padrão Região Recurso de cobrança ou projeto do consumidor Descrição
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 solicitações por minuto Regional (o tráfego global é contabilizado na região us-central1) Projeto do consumidor (projeto de recurso para integração de telefonia SipRec) Número de novas solicitações StreamingRecognize enviadas para a STT V2 por tipo de recurso

Análise de sentimento

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
AnalyzeSentimentOperationsPerVersion 300 solicitações/min Global Projeto do consumidor Solicitações de análise de sentimento por meio de AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion 300 solicitações/min Regional Projeto do consumidor Solicitações de análise de sentimento por meio de AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Solicitações de análise de sentimento por meio de AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 solicitações/min Regional Projeto do consumidor Solicitações de análise de sentimento por meio de AnalyzeContent ou StreamingAnalyzeContent.

Crie sua própria assistência

Esse recurso usa os seguintes modelos de IA:

  • text-bison@001 (limite padrão 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
GeneratorSuggestionOperationsPerMinutePerModelType 10 solicitações/min Global Projeto do consumidor Operações de sugestão do gerador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 solicitações/min Regional Projeto do consumidor Operações de sugestão do gerador por tipo de modelo e região

Resposta inteligente

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SmartReplyBaselineModelOperationsPerMinutePerProject 120 solicitações/min Global Projeto do consumidor Receber solicitações de modelo de referência de resposta inteligente por meio de AnalyzeContent ou SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 solicitações/min Global Projeto do consumidor Receber solicitações de modelo de referência de resposta inteligente V2 por meio de AnalyzeContent ou SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 solicitações/min Regional Projeto do consumidor Receber solicitações de modelo de referência de resposta inteligente V2 por meio de AnalyzeContent ou SuggestSmartReplies

Resposta inteligente generativa

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SmartReplyBaselineModelOperationsPerMinutePerProject 120 solicitações/min Global Projeto do consumidor Receber solicitações de modelo de referência de resposta inteligente por meio de AnalyzeContent ou SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 solicitações/min Global Projeto do consumidor Receber solicitações de modelo de referência de resposta inteligente V2 por meio de AnalyzeContent ou SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 solicitações/min Regional Projeto do consumidor Receber solicitações de modelo de referência de resposta inteligente V2 por meio de AnalyzeContent ou SuggestSmartReplies

Resumo

O resumo gerado por IA usa os seguintes modelos:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

A tabela a seguir mostra o tipo de cota e o modelo usado para cada versão do resumo.


Versão do resumo

Tipo de cota

Modelo de back-end

Gerador 5.0

Com base no gerador

Gemini-2.5-flash pré-treinado

Gerador 4.0

Com base no gerador

Gemini-2.0-flash-001 pré-treinado

Gerador 3.1

Com base no gerador

Gemini-1.5-flash-001 ajustado por Lora

Gerador 3.0

Com base no gerador

Gemini-1.0-pro-002 ajustado por Lora

Gerador 2.1

Com base no gerador

Text-bison-32k@002 ajustado por Lora

Gerador 2.0

Com base no gerador

Text-bison-32k@002 ajustado por Lora

Gerador 1.0

Com base no gerador

Text-bison@001 ajustado por Lora

Referência v2

Modelo de referência v2

text-bison

Referência v1

Não baseado no gerador

Modelo LongT5

Personalizado 2.0

Não baseado no gerador

Modelo LongT5

Os tipos de cota na tabela anterior são refletidos na lista de cotas a seguir para APIs usadas com o resumo.


Tipo de cota

Nome do limite de cota

Valor padrão

Região

Recurso de cobrança/projeto do consumidor

Descrição

Com base no gerador

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 solicitações/min

Regional

Projeto do consumidor

Operações de sugestão do gerador por tipo de modelo e região

Com base no gerador

GeneratorSuggestionOperationsPerMinutePerModelType

10 solicitações/min

Global

Projeto do consumidor

Operações de sugestão do gerador por tipo de modelo

Com base no gerador

SuggestConversationSummaryOperationsPerMinutePerProject

60 solicitações/min

Global

Projeto de recursos

Operações de resumo de conversa sugeridas

Não baseado no gerador

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 a 2 solicitações/min

Regional

Projeto de recursos

Operações de resumo de conversa sugeridas em cada região

Modelo de referência v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 solicitações/min

Global

Projeto de recursos

Solicitações de pesquisa de referência V2 de sugestão de resumo de conversa

Modelo de referência v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 solicitações/min

Regional

Projeto de recursos

Solicitações de pesquisa de referência V2 de sugestão de resumo de conversa em cada região

Avaliação automática de resumo

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
ConcurrentSummarizationEvaluationsPerProject 1 solicitação por projeto Projeto do consumidor Solicitações de avaliação automática

Se você precisar de mais cotas simultâneas, faça uma solicitação pelo Google Cloud console. Esse recurso pode oferecer suporte a até quatro cotas simultâneas por projeto.

Assistência de conhecimento generativo

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SearchKnowledgeRequestsPerMinutePerProject 60 solicitações/min Global Projeto do consumidor Solicitações de SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 solicitações/min Regional Projeto do consumidor Solicitações de SearchKnowledge em cada região

Assistência de conhecimento generativo proativa

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 solicitações/min Global Projeto de recursos Solicitações de KnowledgeAssist por meio de AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 solicitações/min Regional Projeto de recursos Solicitações de KnowledgeAssist por meio de AnalyzeContent ou SuggestKnowledgeAssist em cada região

Coach de IA (LLM)

Esse recurso usa o modelo de IA agent-coaching-2.5.

Nome do limite de cota Valor padrão Região Recurso de cobrança ou projeto do consumidor Descrição
GeneratorSuggestionOperationsPerMinutePerModelType 60 solicitações por minuto Global Projeto do consumidor Operações de sugestão do gerador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 solicitações por minuto Regional Projeto do consumidor Operações de sugestão do gerador por tipo de modelo e região

Outras cotas de API

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
ConversationOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Outras solicitações de conversa, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation, CompleteConversation. A cota é compartilhada entre o Dialogflow e o Agent Assist.
MessagePollingOperationsPerMinutePerProject 1.200 solicitações / min Global Projeto do consumidor Solicitações de ListMessages. A cota é compartilhada entre o Dialogflow e o Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 solicitações / min Global Projeto do consumidor Solicitações de AnswerRecord