A estimativa precisa da quota baseia-se no número de consultas por segundo (CPS) que faz a cada API. As secções seguintes descrevem as quotas para APIs usadas com cada funcionalidade do Agent Assist.
Consulte a página de quotas para mais informações sobre como pedir um aumento da quota. Depois de enviar a sua solicitação, a Google pode entrar em contacto consigo para obter mais informações e informá-lo quando a sua solicitação for aprovada ou recusada.
Tipos de projetos
As tabelas de quotas seguintes apresentam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre a utilização de vários projetos para ver as definições destes dois tipos de projetos.
Transcrição de voz
Esta funcionalidade usa a telefonia ou a integração de gRPC, que têm quotas de API diferentes.
Integração de telefonia
Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.
Integração do gRPC
| Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 pedidos/min | Global | Projeto de consumo | Pedidos AnalyzeContent/StreamingAnalyzeContent. A quota é partilhada entre o Dialogflow e o Agent Assist. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 pedidos simultâneos | Regional (o tráfego global é contabilizado na região us-central1) |
Projeto de consumidor (projeto de recursos para integração de SipRec de telefonia) | Sessões de streaming bidirecionais simultâneas por região |
Análise de sensação geral
| Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
|---|---|---|---|---|
| AnalyzeSentimentOperationsPerMinutePerProject | 300 pedidos/min | Global | Projeto de consumo | Pedidos de análise de sensação geral através de AnalyzeContent ou StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 pedidos/min | Global | Projeto de consumo | Pedidos AnalyzeSentiment e StreamingAnalyzeSentiment. A quota é partilhada entre o Dialogflow e o Agent Assist. |
Crie o seu próprio assistente
Esta funcionalidade usa os seguintes modelos de IA:
- text-bison@001 (limite predefinido de 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 pedidos/min | Global | Projeto de consumo | Operações de sugestões do gerador por tipo de modelo |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 pedidos/min | Regional | Projeto de consumo | Operações de sugestões do gerador por tipo de modelo e região |
Resumo
O resumo gerado pela IA usa os seguintes modelos:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
A tabela seguinte mostra o tipo de quota e o modelo usado para cada versão da geração de resumos.
Versão de resumo |
Tipo de quota |
Modelo de back-end |
|---|---|---|
Gerador 5.0 |
Baseado no gerador |
Gemini-2.5-flash pré-treinado |
Generator 4.0 |
Baseado no gerador |
Gemini-2.0-flash-001 pré-treinado |
Gerador 3.1 |
Baseado no gerador |
Lora-tuned gemini-1.5-flash-001 |
Gerador 3.0 |
Baseado no gerador |
Gemini-1.0-pro-002 com ajuste fino de Lora |
Gerador 2.1 |
Baseado no gerador |
Lora-tuned text-bison-32k@002 |
Gerador 2.0 |
Baseado no gerador |
Lora-tuned text-bison-32k@002 |
Gerador 1.0 |
Baseado no gerador |
Lora-tuned text-bison@001 |
Base v2 |
Modelo de valor de referência v2 |
text-bison |
Base v1 |
Não baseado em gerador |
Modelo LongT5 |
Personalizado 2.0 |
Não baseado em gerador |
Modelo LongT5 |
Os tipos de quotas na tabela anterior refletem-se na seguinte lista de quotas para APIs usadas com a sumarização.
Tipo de quota |
Nome do limite de quota |
Valor predefinido |
Região |
Recurso de cobrança/projeto de consumo |
Descrição |
|---|---|---|---|---|---|
Baseado no gerador |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 pedidos/min |
Regional |
Projeto de consumo |
Operações de sugestões do gerador por tipo de modelo e região |
Baseado no gerador |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 pedidos/min |
Global |
Projeto de consumo |
Operações de sugestões do gerador por tipo de modelo |
Baseado no gerador |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 pedidos/minuto |
Global |
Projeto de recursos |
Sugira operações de resumo de conversas |
Não baseado em gerador |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 a 2 pedidos/min |
Regional |
Projeto de recursos |
Sugira operações de resumo de conversas em cada região |
Modelo de valor de referência v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 pedidos/min |
Global |
Projeto de recursos |
Pedidos de sondagem de base da sugestão de resumo da conversa V2 |
Modelo de valor de referência v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 pedidos/minuto |
Regional |
Projeto de recursos |
Pedidos de sondagem de base da sugestão de resumo de conversas V2 em cada região |
Avaliação automática de resumos
| Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 pedido por projeto | Projeto de consumo | Solicitações de autoavaliação |
Se precisar de quotas simultâneas adicionais, apresente um pedido através da Google Cloud consola. Esta funcionalidade pode suportar até quatro quotas simultâneas por projeto.
Assistência de conhecimentos generativa
| Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 pedidos/min | Global | Projeto de consumo | Pedidos SearchKnowledge |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 pedidos/min | Regional | Projeto de consumo | O SearchKnowledge pede cada região |
Assistência de conhecimento generativo proativa
| Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 pedidos/min | Global | Projeto de recursos | Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 pedidos/min | Regional | Projeto de recursos | Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist em cada região |
Coach de IA (LLM)
Esta funcionalidade usa o modelo de IA agent-coaching-2.5.
| Nome do limite de quota | Valor predefinido | Região | Cobrar recursos ou projetos de consumidor | Descrição |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 pedidos por minuto | Global | Projeto de consumo | Operações de sugestões do gerador por tipo de modelo |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 pedidos por minuto | Regional | Projeto de consumo | Operações de sugestões do gerador por tipo de modelo e região |
Outras quotas da API
| Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 pedidos/min | Global | Projeto de consumo | Outros pedidos de conversação, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A quota é partilhada entre o Dialogflow e o Agent Assist. |
| MessagePollingOperationsPerMinutePerProject | 1200 pedidos / min | Global | Projeto de consumo | Pedidos ListMessages. A quota é partilhada entre o Dialogflow e o Agent Assist. |
| AnswerRecordOperationsPerMinutePerProject | 300 pedidos / min | Global | Projeto de consumo | Pedidos AnswerRecord |