Google utiliza tecnología de IA para traducir contenido a tu idioma preferido. Las traducciones realizadas con IA pueden contener errores.

Cuotas

La estimación precisa de la cuota se basa en la cantidad de consultas por segundo (QPS) que envías a cada API. En las siguientes secciones, se describen las cuotas de las APIs que se usan con cada función de Agent Assist.

Tipos de proyecto

En las siguientes tablas de cuotas, se enumeran dos tipos de proyectos: de consumidor y de recursos. Consulta la documentación sobre el uso de varios proyectos para ver las definiciones de estos dos tipos de proyectos.

Transcripción de voz

Esta función usa la integración de telefonía o gRPC, cada una con diferentes cuotas de API.

Integración de telefonía

Consulta las cuotas de Dialogflow para las APIs que se usan con la integración telefónica.

Integración de gRPC

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`AnalyzeContentOperationsPerMinutePerProject`	300 solicitudes/min	Global	Proyecto del consumidor	Solicitudes de AnalyzeContent/StreamingAnalyzeContent La cuota se comparte entre Dialogflow y Agent Assist.
`ConcurrentBidiStreamingSessionsPerProjectPerRegion`	50 solicitudes simultáneas	Regional (el tráfico global se cuenta en la región `us-central1`)	Proyecto del consumidor (proyecto de recursos para la integración de SipRec de telefonía)	Sesiones de transmisión bidireccional simultáneas por región

Transcripción con modelos de Chirp

Nombre de la cuota	Valor predeterminado	Región	Proyecto de consumidor o recurso de carga	Descripción
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 solicitudes por minuto	Regional (el tráfico global se cuenta en la región `us-central1`)	Proyecto del consumidor (proyecto de recursos para la integración de SipRec de telefonía)	Cantidad de solicitudes nuevas de `StreamingRecognize` enviadas a STT V2 por tipo de recurso.

Análisis de opiniones

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`AnalyzeSentimentOperationsPerVersion`	300 solicitudes/min	Global	Proyecto del consumidor	Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent
`AnalyzeSentimentOperationsPerVersionPerRegion`	300 solicitudes/min	Regional	Proyecto del consumidor	Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent
`AnalyzeSentimentOperationsPerMinutePerProject`	300 solicitudes/min	Global	Proyecto del consumidor	Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent
`AnalyzeSentimentOperationsPerMinutePerProjectPerRegion`	300 solicitudes/min	Regional	Proyecto del consumidor	Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent

Crea tu propia asistencia

Esta función usa los siguientes modelos de IA:

text-bison@001 (límite predeterminado: 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`GeneratorSuggestionOperationsPerMinutePerModelType`	10 solicitudes por minuto	Global	Proyecto del consumidor	Operaciones de sugerencias del generador por tipo de modelo.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	10 solicitudes por minuto	Regional	Proyecto del consumidor	Operaciones de sugerencias del generador por tipo de modelo y región.

Respuesta inteligente

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`SmartReplyBaselineModelOperationsPerMinutePerProject`	120 solicitudes por minuto	Global	Proyecto del consumidor	Obtén solicitudes del modelo de referencia de respuestas inteligentes a través de `AnalyzeContent` o `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	60 solicitudes por minuto	Global	Proyecto del consumidor	Obtén solicitudes del modelo de referencia de la versión 2 de la respuesta inteligente a través de `AnalyzeContent` o `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	60 solicitudes por minuto	Regional	Proyecto del consumidor	Obtén solicitudes del modelo de referencia de la versión 2 de la respuesta inteligente a través de `AnalyzeContent` o `SuggestSmartReplies`.

Respuesta inteligente generativa

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`SmartReplyBaselineModelOperationsPerMinutePerProject`	120 solicitudes por minuto	Global	Proyecto del consumidor	Obtén solicitudes del modelo de referencia de respuestas inteligentes a través de `AnalyzeContent` o `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	60 solicitudes por minuto	Global	Proyecto del consumidor	Obtén solicitudes del modelo de referencia de la versión 2 de la respuesta inteligente a través de `AnalyzeContent` o `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	60 solicitudes por minuto	Regional	Proyecto del consumidor	Obtén solicitudes del modelo de referencia de la versión 2 de la respuesta inteligente a través de `AnalyzeContent` o `SuggestSmartReplies`.

Resúmenes

La generación de resúmenes con IA usa los siguientes modelos:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

En la siguiente tabla, se muestran el tipo de cuota y el modelo que se usan para cada versión del resumen.

Versión del resumen	Tipo de cuota	Modelo de backend
Generator 5.0	Basado en generador	Gemini-2.5-flash preentrenado
Generador 4.0	Basado en generador	Gemini-2.0-flash-001 previamente entrenado
Generador 3.1	Basado en generador	gemini-1.5-flash-001 ajustado con Lora
Generator 3.0	Basado en generador	gemini-1.0-pro-002 ajustado con Lora
Generador 2.1	Basado en generador	Lora-tuned text-bison-32k@002
Generator 2.0	Basado en generador	Lora-tuned text-bison-32k@002
Generator 1.0	Basado en generador	text-bison@001 ajustado con Lora
Modelo de referencia v2	Modelo de referencia v2	text-bison
Modelo de referencia v1	No se basa en el generador	Modelo LongT5
Personalizado 2.0	No se basa en el generador	Modelo LongT5

Los tipos de cuota de la tabla anterior se reflejan en la siguiente lista de cuotas para las APIs que se usan con la función de resumen.

Tipo de cuota	Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos de carga/consumidor	Descripción
Basado en generador	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 solicitudes por minuto	Regional	Proyecto del consumidor	Operaciones de sugerencias del generador por tipo de modelo y región
Basado en generador	GeneratorSuggestionOperationsPerMinutePerModelType	10 solicitudes por minuto	Global	Proyecto del consumidor	Operaciones de sugerencias del generador por tipo de modelo
Basado en generador	SuggestConversationSummaryOperationsPerMinutePerProject	60 solicitudes/min	Global	Proyecto de recursos	Sugerir operaciones de resumen de conversaciones
No se basa en el generador	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0 a 2 solicitudes por minuto	Regional	Proyecto de recursos	Sugerir operaciones de resumen de conversaciones en cada región
Modelo de referencia v2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 solicitudes por minuto	Global	Proyecto de recursos	Solicitudes de sondeo del modelo de referencia de la versión 2 de la sugerencia de resumen de conversación
Modelo de referencia v2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 solicitudes/min	Regional	Proyecto de recursos	Solicitudes de sondeo de la versión 2 del modelo de referencia de sugerencias de resumen de conversaciones en cada región

Autoevaluación de resúmenes

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`ConcurrentSummarizationEvaluationsPerProject`	1 solicitud por proyecto	Proyecto del consumidor	Solicitudes de autoevaluación

Si necesitas cuotas simultáneas adicionales, envía una solicitud a través de la consola de Google Cloud . Esta función admite hasta cuatro cuotas simultáneas por proyecto.

Asistente de conocimiento generativo

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`SearchKnowledgeRequestsPerMinutePerProject`	60 solicitudes por minuto	Global	Proyecto del consumidor	Son solicitudes de SearchKnowledge.
`SearchKnowledgeRequestsPerMinutePerProjectPerRegion`	30 solicitudes por minuto	Regional	Proyecto del consumidor	SearchKnowledge solicita cada región.

Asistente de conocimiento generativo proactivo, versión 1

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`SuggestKnowledgeAssistOperationsPerMinutePerProject`	60 solicitudes por minuto	Global	Proyecto de recursos	Solicitudes de KnowledgeAssist a través de `AnalyzeContent` o `SuggestKnowledgeAssist`.
`SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion`	30 solicitudes por minuto	Regional	Proyecto de recursos	Solicitudes de KnowledgeAssist a través de `AnalyzeContent` o `SuggestKnowledgeAssist` en cada región
`SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion`	30 solicitudes por minuto	MultiRegional	Proyecto de recursos	Solicitudes de KnowledgeAssist a través de `AnalyzeContent` o `SuggestKnowledgeAssist` dirigidas a extremos multirregionales, como US o EU.

Asistente de conocimiento generativo proactivo V2

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`KnowledgeAssistOpsPerMinutePerProjectPerVersion`	30 solicitudes por minuto	Global	Proyecto de recursos	KnowledgeAssist solicita una versión específica del modelo cuando la solicitud se dirige al extremo de ubicación global.
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion`	30 solicitudes por minuto	Regional	Proyecto de recursos	Solicitudes de KnowledgeAssist dirigidas a una Google Cloud región específica, como `us-central1` o `europe-west1`.
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion`	30 solicitudes por minuto	MultiRegional	Proyecto de recursos	Solicitudes de KnowledgeAssist dirigidas a extremos multirregionales, como US o EU.

Coach potenciado por IA (LLM)

Esta función usa el modelo de IA agent-coaching-2.5.

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de consumidor o recurso de carga	Descripción
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 solicitudes por minuto	Global	Proyecto del consumidor	Operaciones de sugerencias del generador por tipo de modelo.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 solicitudes por minuto	Regional	Proyecto del consumidor	Operaciones de sugerencias del generador por tipo de modelo y región.

Otras cuotas de la API

Nombre del límite de cuota	Valor predeterminado	Región	Proyecto de recursos/consumidor de cargos	Descripción
`ConversationOperationsPerMinutePerProject`	300 solicitudes/min	Global	Proyecto del consumidor	Otras solicitudes de conversación, excepto AnalyzeContent y StreamingAnalyzeContent, por ejemplo, CreateConversation y CompleteConversation. La cuota se comparte entre Dialogflow y Agent Assist.
`MessagePollingOperationsPerMinutePerProject`	1,200 solicitudes por minuto	Global	Proyecto del consumidor	Son solicitudes de ListMessages. La cuota se comparte entre Dialogflow y Agent Assist.
`AnswerRecordOperationsPerMinutePerProject`	300 solicitudes por minuto	Global	Proyecto del consumidor	Solicitudes de AnswerRecord

¿Qué sigue?

Para obtener más información sobre cómo solicitar un aumento de la cuota, consulta la página de cuotas.
Después de enviar la solicitud, Google podría comunicarse contigo para pedirte más información y notificarte cuando se apruebe o rechace.

Cuotas Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.