La estimación precisa de la cuota se basa en la cantidad de consultas por segundo (QPS) que envías a cada API. En las siguientes secciones, se describen las cuotas para las APIs que se usan con cada función de Agent Assist.
Consulta la página de cuotas para obtener más información sobre cómo solicitar un aumento de cuota. Después de enviar la solicitud, Google podría comunicarse contigo para pedirte más información y notificarte cuando se apruebe o rechace tu solicitud.
Tipos de proyecto
En las siguientes tablas de cuotas, se enumeran dos tipos de proyectos: consumidor y recurso. Consulta la documentación sobre el uso de varios proyectos para obtener definiciones de estos dos tipos de proyectos.
Transcripción de voz
Esta función usa la integración de telefonía o gRPC, que tienen diferentes cuotas de API.
Integración de telefonía
Consulta las cuotas de Dialogflow para las APIs que se usan con la integración de telefonía.
Integración de gRPC
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 solicitudes/min | Global | Proyecto del consumidor | Solicitudes de AnalyzeContent/StreamingAnalyzeContent. La cuota se comparte entre Dialogflow y Agent Assist. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 solicitudes simultáneas | Regional (el tráfico global se cuenta en la región us-central1) |
Proyecto del consumidor (proyecto de recursos para la integración de telefonía SipRec) | Sesiones de transmisión bidireccional simultáneas por región |
Transcripción con modelos de Chirp
| Nombre de la cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 solicitudes por minuto | Regional (el tráfico global se cuenta en la región us-central1). |
Proyecto del consumidor (proyecto de recursos para la integración de telefonía SipRec) | Cantidad de solicitudes nuevas de StreamingRecognize enviadas a STT V2 por tipo de recurso |
Análisis de opiniones
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| AnalyzeSentimentOperationsPerVersion | 300 solicitudes/min | Global | Proyecto del consumidor | Solicitudes de análisis de opiniones a través de AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerVersionPerRegion | 300 solicitudes/min | Regional | Proyecto del consumidor | Solicitudes de análisis de opiniones a través de AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 solicitudes/min | Global | Proyecto del consumidor | Solicitudes de análisis de opiniones a través de AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 solicitudes/min | Regional | Proyecto del consumidor | Solicitudes de análisis de opiniones a través de AnalyzeContent o StreamingAnalyzeContent. |
Crea tu propia asistencia
Esta función usa los siguientes modelos de IA:
- text-bison@001 (límite predeterminado 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 solicitudes/min | Global | Proyecto del consumidor | Operaciones de sugerencias del generador por tipo de modelo |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 solicitudes/min | Regional | Proyecto del consumidor | Operaciones de sugerencias del generador por tipo de modelo y región |
Respuesta inteligente
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 solicitudes/min | Global | Proyecto del consumidor | Obtén solicitudes de modelos de referencia de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies. |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 solicitudes/min | Global | Proyecto del consumidor | Obtén solicitudes de modelos de referencia V2 de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 solicitudes/min | Regional | Proyecto del consumidor | Obtén solicitudes de modelos de referencia V2 de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
Respuesta inteligente generativa
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 solicitudes/min | Global | Proyecto del consumidor | Obtén solicitudes de modelos de referencia de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies. |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 solicitudes/min | Global | Proyecto del consumidor | Obtén solicitudes de modelos de referencia V2 de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 solicitudes/min | Regional | Proyecto del consumidor | Obtén solicitudes de modelos de referencia V2 de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
Resúmenes
Los resúmenes generados por IA usan los siguientes modelos:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
En la siguiente tabla, se muestran el tipo de cuota y el modelo que se usan para cada versión de resúmenes.
Versión de resúmenes |
Tipo de cuota |
Modelo de backend |
|---|---|---|
Generador 5.0 |
Basado en generador |
Gemini-2.5-flash entrenado previamente |
Generador 4.0 |
Basado en generador |
Gemini-2.0-flash-001 entrenado previamente |
Generador 3.1 |
Basado en generador |
gemini-1.5-flash-001 ajustado con Lora |
Generador 3.0 |
Basado en generador |
gemini-1.0-pro-002 ajustado con Lora |
Generador 2.1 |
Basado en generador |
text-bison-32k@002 ajustado con Lora |
Generador 2.0 |
Basado en generador |
text-bison-32k@002 ajustado con Lora |
Generador 1.0 |
Basado en generador |
text-bison@001 ajustado con Lora |
Referencia v2 |
Modelo de referencia v2 |
text-bison |
Referencia v1 |
No basado en generador |
Modelo LongT5 |
Personalizado 2.0 |
No basado en generador |
Modelo LongT5 |
Los tipos de cuotas de la tabla anterior se reflejan en la siguiente lista de cuotas para las APIs que se usan con resúmenes.
Tipo de cuota |
Nombre del límite de cuota |
Valor predeterminado |
Región |
Recurso de facturación o proyecto del consumidor |
Descripción |
|---|---|---|---|---|---|
Basado en generador |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 solicitudes/min |
Regional |
Proyecto del consumidor |
Operaciones de sugerencias del generador por tipo de modelo y región |
Basado en generador |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 solicitudes/min |
Global |
Proyecto del consumidor |
Operaciones de sugerencias del generador por tipo de modelo |
Basado en generador |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 solicitudes/min |
Global |
Proyecto de recursos |
Operaciones de sugerencias de resúmenes de conversaciones |
No basado en generador |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 a 2 solicitudes/min |
Regional |
Proyecto de recursos |
Operaciones de sugerencias de resúmenes de conversaciones en cada región |
Modelo de referencia v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 solicitudes/min |
Global |
Proyecto de recursos |
Solicitudes de sondeo de referencia V2 de sugerencias de resúmenes de conversaciones |
Modelo de referencia v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 solicitudes/min |
Regional |
Proyecto de recursos |
Solicitudes de sondeo de referencia V2 de sugerencias de resúmenes de conversaciones en cada región |
Evaluación automática de resúmenes
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 solicitud por proyecto | Proyecto del consumidor | Solicitudes de evaluación automática |
Si necesitas cuotas simultáneas adicionales, envía una solicitud a través de la Google Cloud consola de. Esta función puede admitir hasta cuatro cuotas simultáneas por proyecto.
Knowledge Assist generativo
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 solicitudes/min | Global | Proyecto del consumidor | Solicitudes de SearchKnowledge |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 solicitudes/min | Regional | Proyecto del consumidor | Solicitudes de SearchKnowledge en cada región |
Knowledge Assist generativo proactivo
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 solicitudes/min | Global | Proyecto de recursos | Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 solicitudes/min | Regional | Proyecto de recursos | Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada región |
Coach de IA (LLM)
Esta función usa el modelo de IA agent-coaching-2.5.
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 solicitudes por minuto | Global | Proyecto del consumidor | Operaciones de sugerencias del generador por tipo de modelo |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 solicitudes por minuto | Regional | Proyecto del consumidor | Operaciones de sugerencias del generador por tipo de modelo y región |
Otras cuotas de la API
| Nombre del límite de cuota | Valor predeterminado | Región | Recurso de facturación o proyecto del consumidor | Descripción |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 solicitudes/min | Global | Proyecto del consumidor | Otras solicitudes de conversación, excepto AnalyzeContent y StreamingAnalyzeContent, por ejemplo, CreateConversation y CompleteConversation. La cuota se comparte entre Dialogflow y Agent Assist. |
| MessagePollingOperationsPerMinutePerProject | 1,200 solicitudes por minuto | Global | Proyecto del consumidor | Solicitudes de ListMessages. La cuota se comparte entre Dialogflow y Agent Assist. |
| AnswerRecordOperationsPerMinutePerProject | 300 solicitudes por minuto | Global | Proyecto del consumidor | Solicitudes de AnswerRecord |