Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Quotas

A estimativa precisa da quota baseia-se no número de consultas por segundo (CPS) que faz a cada API. As secções seguintes descrevem as quotas para APIs usadas com cada funcionalidade do Agent Assist.

Consulte a página de quotas para mais informações sobre como pedir um aumento da quota. Depois de enviar o seu pedido, a Google pode entrar em contacto consigo para obter mais informações e informá-lo quando o seu pedido for aprovado ou recusado.

Tipos de projetos

As tabelas de quotas seguintes apresentam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre a utilização de vários projetos para ver as definições destes dois tipos de projetos.

Transcrição de voz

Esta funcionalidade usa a telefonia ou a integração de gRPC, que têm quotas de API diferentes.

Integração de telefonia

Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.

Integração do gRPC

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
AnalyzeContentOperationsPerMinutePerProject	300 pedidos/min	Global	Projeto de consumidor	Pedidos AnalyzeContent/StreamingAnalyzeContent. A quota é partilhada entre o Dialogflow e o Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 pedidos simultâneos	Regional (o tráfego global é contabilizado na região `us-central1`)	Projeto de consumidor (projeto de recursos para integração de telefonia SipRec)	Sessões de streaming bidirecionais simultâneas por região

Transcrição com modelos Chirp

Nome da quota	Valor predefinido	Região	Cobrar recursos ou projetos de consumidor	Descrição
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 pedidos por minuto	Regional (o tráfego global é contabilizado na região `us-central1`)	Projeto de consumidor (projeto de recursos para integração de telefonia SipRec)	Número de novos pedidos `StreamingRecognize` enviados para o STT V2 por tipo de recurso

Análise de sensação geral

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
AnalyzeSentimentOperationsPerVersion	300 pedidos/min	Global	Projeto de consumidor	Pedidos de análise de sensação geral através de AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion	300 pedidos/min	Regional	Projeto de consumidor	Pedidos de análise de sensação geral através de AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject	300 pedidos/min	Global	Projeto de consumidor	Pedidos de análise de sensação geral através de AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 pedidos/min	Regional	Projeto de consumidor	Pedidos de análise de sensação geral através de AnalyzeContent ou StreamingAnalyzeContent.

Crie o seu próprio assistente

Esta funcionalidade usa os seguintes modelos de IA:

text-bison@001 (limite predefinido de 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
GeneratorSuggestionOperationsPerMinutePerModelType	10 pedidos/min	Global	Projeto de consumidor	Operações de sugestões do gerador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 pedidos/min	Regional	Projeto de consumidor	Operações de sugestões do gerador por tipo de modelo e região

Resposta inteligente

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
SmartReplyBaselineModelOperationsPerMinutePerProject	120 pedidos/min	Global	Projeto de consumidor	Receba pedidos de modelos de base de Resposta inteligente através de `AnalyzeContent` ou `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 pedidos/min	Global	Projeto de consumidor	Receba pedidos do modelo V2 de base da Resposta inteligente através de `AnalyzeContent` ou `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 pedidos/min	Regional	Projeto de consumidor	Receba pedidos do modelo V2 de base da Resposta inteligente através de `AnalyzeContent` ou `SuggestSmartReplies`

Resposta inteligente generativa

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
SmartReplyBaselineModelOperationsPerMinutePerProject	120 pedidos/min	Global	Projeto de consumidor	Receba pedidos de modelos de base de Resposta inteligente através de `AnalyzeContent` ou `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 pedidos/min	Global	Projeto de consumidor	Receba pedidos do modelo V2 de base da Resposta inteligente através de `AnalyzeContent` ou `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 pedidos/min	Regional	Projeto de consumidor	Receba pedidos do modelo V2 de base da Resposta inteligente através de `AnalyzeContent` ou `SuggestSmartReplies`

Resumo

O resumo gerado pela IA usa os seguintes modelos:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

A tabela seguinte mostra o tipo de quota e o modelo usado para cada versão da geração de resumos.

Versão de resumo	Tipo de quota	Modelo de back-end
Gerador 5.0	Baseado no gerador	Gemini-2.5-flash pré-treinado
Gerador 4.0	Baseado no gerador	Gemini-2.0-flash-001 pré-treinado
Gerador 3.1	Baseado no gerador	Lora-tuned gemini-1.5-flash-001
Gerador 3.0	Baseado no gerador	gemini-1.0-pro-002 com ajuste fino de Lora
Gerador 2.1	Baseado no gerador	Lora-tuned text-bison-32k@002
Gerador 2.0	Baseado no gerador	Lora-tuned text-bison-32k@002
Gerador 1.0	Baseado no gerador	Lora-tuned text-bison@001
Base v2	Modelo de valor de referência v2	text-bison
Base v1	Não baseado em gerador	Modelo LongT5
Personalizado 2.0	Não baseado em gerador	Modelo LongT5

Os tipos de quotas na tabela anterior refletem-se na seguinte lista de quotas para APIs usadas com a sumarização.

Tipo de quota	Nome do limite de quota	Valor predefinido	Região	Recurso de carregamento/projeto de consumo	Descrição
Baseado no gerador	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 pedidos/min	Regional	Projeto de consumo	Operações de sugestões do gerador por tipo de modelo e região
Baseado no gerador	GeneratorSuggestionOperationsPerMinutePerModelType	10 pedidos/min	Global	Projeto de consumo	Operações de sugestões do gerador por tipo de modelo
Baseado no gerador	SuggestConversationSummaryOperationsPerMinutePerProject	60 pedidos/minuto	Global	Projeto de recursos	Sugira operações de resumo de conversas
Não baseado em gerador	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0 a 2 pedidos/min	Regional	Projeto de recursos	Sugira operações de resumo de conversas em cada região
Modelo de valor de referência v2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 pedidos/min	Global	Projeto de recursos	Pedidos de sondagem de base da sugestão de resumo da conversa V2
Modelo de valor de referência v2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 pedidos/minuto	Regional	Projeto de recursos	Pedidos de sondagem de base da sugestão de resumo de conversas V2 em cada região

Avaliação automática de resumos

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
ConcurrentSummarizationEvaluationsPerProject	1 pedido por projeto	Projeto de consumidor	Solicitações de autoavaliação

Se precisar de quotas simultâneas adicionais, apresente um pedido através da Google Cloud consola. Esta funcionalidade pode suportar até quatro quotas simultâneas por projeto.

Assistência de conhecimentos generativa

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
SearchKnowledgeRequestsPerMinutePerProject	60 pedidos/min	Global	Projeto de consumidor	Pedidos SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion	30 pedidos/min	Regional	Projeto de consumidor	O SearchKnowledge pede cada região

Assistência de conhecimentos generativos proativa

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 pedidos/min	Global	Projeto de recursos	Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 pedidos/min	Regional	Projeto de recursos	Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist em cada região

Personal trainer de IA (LLM)

Esta funcionalidade usa o modelo de IA agent-coaching-2.5.

Nome do limite de quota	Valor predefinido	Região	Cobrar recursos ou projetos de consumidor	Descrição
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 pedidos por minuto	Global	Projeto de consumidor	Operações de sugestões do gerador por tipo de modelo
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 pedidos por minuto	Regional	Projeto de consumidor	Operações de sugestões do gerador por tipo de modelo e região

Outras quotas da API

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
ConversationOperationsPerMinutePerProject	300 pedidos/min	Global	Projeto de consumidor	Outros pedidos de conversação, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A quota é partilhada entre o Dialogflow e o Agent Assist.
MessagePollingOperationsPerMinutePerProject	1200 pedidos / min	Global	Projeto de consumidor	Pedidos ListMessages. A quota é partilhada entre o Dialogflow e o Agent Assist.
AnswerRecordOperationsPerMinutePerProject	300 pedidos / min	Global	Projeto de consumidor	Pedidos AnswerRecord

Quotas Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.