La estimación precisa de la cuota se basa en la cantidad de consultas por segundo (QPS) que envías a cada API. En las siguientes secciones, se describen las cuotas para las APIs que se usan con cada función de Agent Assist.
Consulta la página de cuotas para obtener más información sobre cómo solicitar un aumento de cuota. Después de enviar la solicitud, Google podría comunicarse contigo para pedirte más información y notificarte cuando se apruebe o rechace.
Si no puedes especificar dimensiones cuando solicitas un aumento de cuota para las cuotas multirregionales en Google Cloud console, usa Google Cloud CLI o comunícate con Atención al cliente de Cloud.
Tipos de proyecto
En las siguientes tablas de cuotas, se enumeran dos tipos de proyectos: de consumidor y de recurso. Consulta la documentación sobre el uso de varios proyectos para ver las definiciones de estos dos tipos de proyectos.
Transcripción de voz
Esta función usa la integración de telefonía o gRPC, cada una con diferentes cuotas de API.
Integración de telefonía
Consulta las cuotas de Dialogflow para las APIs que se usan con la integración telefónica.
Integración de gRPC
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 solicitudes/min | Global | Proyecto del consumidor | Solicitudes de AnalyzeContent/StreamingAnalyzeContent La cuota se comparte entre Dialogflow y Agent Assist. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 solicitudes simultáneas | Regional (el tráfico global y el de varias regiones de EE.UU. se contabilizan en la región us-central1). |
Proyecto del consumidor (proyecto de recursos para la integración de SipRec de telefonía) | Sesiones de transmisión bidireccional simultáneas por región |
Transcripción con modelos de Chirp
La transcripción de voz admite los siguientes modelos de Chirp:
- chirp_2
- chirp_3
| Nombre de la cuota | Valor predeterminado | Región | Proyecto de consumidor o recurso de carga | Descripción |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 solicitudes por minuto | Regional (el tráfico global y el de varias regiones de EE.UU. se contabilizan en la región us-central1). |
Proyecto del consumidor (proyecto de recursos para la integración de SipRec de telefonía) | Dimensiones de la cuota: resource_type={stt_model_name} (cantidad de solicitudes nuevas de StreamingRecognize enviadas a STT V2 por tipo de recurso) |
Análisis de opiniones
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion | 300 solicitudes/min | EE.UU. multirregión | Proyecto del consumidor | Dimensiones de la cuota: multi-region=us,version=v3.
Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent por versión y por multirregión |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 solicitudes/min | Global | Proyecto del consumidor | Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 solicitudes/min | Regional | Proyecto del consumidor | Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent |
Crea tu propia asistencia
Esta función usa los siguientes modelos de IA:
- text-bison@001 (límite predeterminado: 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 solicitudes por minuto | Global | Proyecto del consumidor | Operaciones de sugerencias del generador por tipo de modelo |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 solicitudes por minuto | Regional | Proyecto del consumidor | Dimensiones de la cuota: model_type={model_name}. Operaciones de sugerencias del generador por tipo de modelo y región |
Respuesta inteligente
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 solicitudes por minuto | Global | Proyecto del consumidor | Obtén solicitudes del modelo de referencia de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 solicitudes por minuto | Global | Proyecto del consumidor | Obtén solicitudes del modelo de referencia de la versión 2 de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 solicitudes por minuto | Regional | Proyecto del consumidor | Obtén solicitudes del modelo de referencia de la versión 2 de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
Respuesta inteligente generativa
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 solicitudes por minuto | Global | Proyecto del consumidor | Obtén solicitudes del modelo de referencia de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 solicitudes por minuto | Global | Proyecto del consumidor | Obtén solicitudes del modelo de referencia de la versión 2 de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 solicitudes por minuto | Regional | Proyecto del consumidor | Obtén solicitudes del modelo de referencia de la versión 2 de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
Resúmenes
La generación de resúmenes con IA usa los siguientes modelos:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
En la siguiente tabla, se muestran el tipo de cuota y el modelo que se usan para cada versión del resumen.
Versión del resumen |
Tipo de cuota |
Modelo de backend |
|---|---|---|
Generator 5.0 |
Basado en generador |
Gemini-2.5-flash previamente entrenado |
Generador 4.0 |
Basado en generador |
Gemini-2.0-flash-001 entrenado previamente |
Generator 3.1 |
Basado en generador |
gemini-1.5-flash-001 ajustado con Lora |
Generator 3.0 |
Basado en generador |
gemini-1.0-pro-002 ajustado con Lora |
Generador 2.1 |
Basado en generador |
text-bison-32k@002 ajustado con Lora |
Generator 2.0 |
Basado en generador |
text-bison-32k@002 ajustado con Lora |
Generator 1.0 |
Basado en generador |
text-bison@001 ajustado con Lora |
Modelo de referencia v2 |
Modelo de referencia v2 |
text-bison |
Baseline v1 |
No se basa en un generador |
Modelo LongT5 |
Personalizado 2.0 |
No se basa en un generador |
Modelo LongT5 |
Los tipos de cuota de la tabla anterior se reflejan en la siguiente lista de cuotas para las APIs que se usan con la función de resumen.
Tipo de cuota |
Nombre del límite de cuota |
Valor predeterminado |
Región |
Proyecto de recursos de carga/consumidor |
Descripción |
|---|---|---|---|---|---|
Basado en generador |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 solicitudes por minuto |
Regional |
Proyecto del consumidor |
Dimensiones de la cuota: model_type=summarization-{version_num}.Operaciones de sugerencias del generador por tipo de modelo y región |
Basado en generador |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 solicitudes por minuto |
Global |
Proyecto del consumidor |
Operaciones de sugerencias del generador por tipo de modelo |
Basado en generador |
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion |
10 solicitudes por minuto |
Multirregión de EE.UU. |
Proyecto del consumidor |
Dimensiones de cuota: multi-region=us, model_type=summarization-{version_num}. Operaciones de sugerencias del generador por tipo de modelo y región |
Basado en generador |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 solicitudes/min |
Global |
Proyecto de recursos |
Sugerir operaciones de resumen de conversaciones |
No se basa en un generador |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 a 2 solicitudes por minuto |
Regional |
Proyecto de recursos |
Sugerir operaciones de resumen de conversaciones en cada región |
Modelo de referencia v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 solicitudes por minuto |
Global |
Proyecto de recursos |
Solicitudes de sondeo del modelo de referencia de la sugerencia de resumen de conversación V2 |
Modelo de referencia v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 solicitudes/min |
Regional |
Proyecto de recursos |
Solicitudes de sondeo de la versión 2 del modelo de referencia de sugerencias de resumen de conversaciones en cada región |
Autoevaluación de resúmenes
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 solicitud por proyecto | Proyecto del consumidor | Solicitudes de autoevaluación |
Si necesitas cuotas simultáneas adicionales, envía una solicitud a través de la consola de Google Cloud . Esta función admite hasta cuatro cuotas simultáneas por proyecto.
Asistente de conocimiento generativo
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 solicitudes por minuto | Global | Proyecto del consumidor | Solicitudes de SearchKnowledge |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 solicitudes por minuto | Regional | Proyecto del consumidor | SearchKnowledge solicita cada región |
| SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion | 30 solicitudes por minuto | EE.UU. multirregión | Proyecto del consumidor | Dimensiones de la cuota: multi-region=us. Solicitudes de SearchKnowledge para cada multirregión |
Asistente de conocimiento generativo proactivo
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 solicitudes por minuto | Global | Proyecto de recursos | Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 solicitudes por minuto | Regional | Proyecto de recursos | Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada región |
| SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion | 30 solicitudes por minuto | EE.UU. multirregión | Proyecto de recursos | Dimensiones de la cuota: multi-region=us. Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada multirregión |
Coach potenciado por IA (LLM)
Esta función usa el modelo de IA agent-coaching-2.5.
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de consumidor o recurso de carga | Descripción |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 solicitudes por minuto | Global | Proyecto del consumidor | Dimensiones de la cuota: model_type=agent-coaching-2.5.
Operaciones de sugerencias del generador por tipo de modelo |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 solicitudes por minuto | Regional | Proyecto del consumidor | Dimensiones de la cuota: model_type=agent-coaching-2.5.
Operaciones de sugerencias del generador por tipo de modelo y región |
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion |
10 solicitudes por minuto | EE.UU. multirregión | Proyecto del consumidor | Dimensiones de la cuota: multi-region=us,model_type=agent-coaching-2.5.
Operaciones de sugerencias del generador por tipo de modelo y multirregión |
Otras cuotas de la API
| Nombre del límite de cuota | Valor predeterminado | Región | Proyecto de recursos/consumidor de cargos | Descripción |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 solicitudes/min | Global | Proyecto del consumidor | Otras solicitudes de conversación, excepto AnalyzeContent y StreamingAnalyzeContent, por ejemplo, CreateConversation y CompleteConversation. La cuota se comparte entre Dialogflow y Agent Assist. |
| MessagePollingOperationsPerMinutePerProject | 1,200 solicitudes por minuto | Global | Proyecto del consumidor | Son solicitudes de ListMessages. La cuota se comparte entre Dialogflow y Agent Assist. |
| AnswerRecordOperationsPerMinutePerProject | 300 solicitudes por minuto | Global | Proyecto del consumidor | Solicitudes de AnswerRecord |