Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cuotas

Para estimar la cuota con precisión, se tiene en cuenta el número de consultas por segundo (CPS) que envías a cada API. En las siguientes secciones se describen las cuotas de las APIs que se usan con cada función de Asistente.

Consulta la página de cuotas para obtener más información sobre cómo solicitar un aumento de la cuota. Después de enviar tu solicitud, es posible que nos pongamos en contacto contigo para pedirte más información y comunicarte si la aprobamos o no.

Tipos de proyectos

En las siguientes tablas de cuotas se indican dos tipos de proyectos: de consumidor y de recurso. Consulta la documentación sobre cómo usar varios proyectos para ver las definiciones de estos dos tipos de proyectos.

Transcripción de voz

Esta función usa la integración de telefonía o gRPC, y cada una tiene cuotas de API diferentes.

Integración de telefonía

Consulta las cuotas de Dialogflow de las APIs que se usan con la integración de telefonía.

Integración de gRPC

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
AnalyzeContentOperationsPerMinutePerProject	300 solicitudes por minuto	Global	Proyecto de consumidor	Solicitudes AnalyzeContent o StreamingAnalyzeContent. La cuota se comparte entre Dialogflow y Asistente para agentes.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 solicitudes simultáneas	Regionales (el tráfico global se contabiliza en la región `us-central1`)	Proyecto de consumidor (proyecto de recursos para la integración de SipRec de telefonía)	Sesiones de streaming bidireccionales simultáneas por región

Transcripción con modelos de Chirp

Nombre de la cuota	Valor predeterminado	Region	Recurso de carga o proyecto de consumidor	Descripción
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 solicitudes por minuto	Regional (el tráfico global se contabiliza en la región `us-central1`).	Proyecto de consumidor (proyecto de recursos para la integración de SipRec de telefonía)	Número de solicitudes de `StreamingRecognize` enviadas a STT V2 por tipo de recurso

Análisis de sentimiento

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
AnalyzeSentimentOperationsPerVersion	300 solicitudes por minuto	Global	Proyecto de consumidor	Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion	300 solicitudes por minuto	Regional	Proyecto de consumidor	Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject	300 solicitudes por minuto	Global	Proyecto de consumidor	Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 solicitudes por minuto	Regional	Proyecto de consumidor	Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent.

Crea tu propia asistencia

Esta función usa los siguientes modelos de IA:

text-bison@001 (límite predeterminado: 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
GeneratorSuggestionOperationsPerMinutePerModelType	10 solicitudes por minuto	Global	Proyecto de consumidor	Operaciones de sugerencias de generador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 solicitudes por minuto	Regional	Proyecto de consumidor	Operaciones de sugerencias de generador por tipo de modelo y región

Respuesta Inteligente

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
SmartReplyBaselineModelOperationsPerMinutePerProject	120 solicitudes por minuto	Global	Proyecto de consumidor	Obtener solicitudes de modelos de referencia de Respuesta inteligente a través de `AnalyzeContent` o `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 solicitudes por minuto	Global	Proyecto de consumidor	Obtener solicitudes del modelo de referencia de Respuesta inteligente V2 a través de `AnalyzeContent` o `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 solicitudes por minuto	Regional	Proyecto de consumidor	Obtener solicitudes del modelo de referencia de Respuesta inteligente V2 a través de `AnalyzeContent` o `SuggestSmartReplies`

Respuesta inteligente generativa

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
SmartReplyBaselineModelOperationsPerMinutePerProject	120 solicitudes por minuto	Global	Proyecto de consumidor	Obtener solicitudes de modelos de referencia de Respuesta inteligente a través de `AnalyzeContent` o `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 solicitudes por minuto	Global	Proyecto de consumidor	Obtener solicitudes del modelo de referencia de Respuesta inteligente V2 a través de `AnalyzeContent` o `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 solicitudes por minuto	Regional	Proyecto de consumidor	Obtener solicitudes del modelo de referencia de Respuesta inteligente V2 a través de `AnalyzeContent` o `SuggestSmartReplies`

Creación de resúmenes

La función de resumen generada por IA usa los siguientes modelos:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

En la siguiente tabla se muestra el tipo de cuota y el modelo que se usan en cada versión de la función de resumen.

Versión de la creación de resúmenes	Tipo de cuota	Modelo de backend
Generator 5.0	Basado en generadores	Gemini 2.5 Flash preentrenado
Generador 4.0	Basado en generadores	Gemini-2.0-flash-001 preentrenado
Generador 3.1	Basado en generadores	gemini-1.5-flash-001 ajustado con Lora
Generador 3.0	Basado en generadores	gemini-1.0-pro-002 ajustado con Lora
Generador 2.1	Basado en generadores	Lora-tuned text-bison-32k@002
Generador 2.0	Basado en generadores	Lora-tuned text-bison-32k@002
Generator 1.0	Basado en generadores	Lora-tuned text-bison@001
Versión 2 de la referencia	Modelo de referencia de la versión 2	text-bison
Valor de referencia (versión 1)	No se basa en un generador	Modelo LongT5
Custom 2.0	No se basa en un generador	Modelo LongT5

Los tipos de cuota de la tabla anterior se reflejan en la siguiente lista de cuotas de las APIs que se usan con la función de resumen.

Tipo de cuota	Nombre del límite de cuota	Valor predeterminado	Región	Recurso de carga o proyecto de consumidor	Descripción
Basado en generadores	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 solicitudes por minuto	Regional	Proyecto de consumidor	Operaciones de sugerencias del generador por tipo de modelo y región
Basado en generadores	GeneratorSuggestionOperationsPerMinutePerModelType	10 solicitudes por minuto	Global	Proyecto de consumidor	Operaciones de sugerencias de generador por tipo de modelo
Basado en generadores	SuggestConversationSummaryOperationsPerMinutePerProject	60 solicitudes/min	Global	Proyecto de recurso	Sugerir operaciones de resumen de conversaciones
No se basa en un generador	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0-2 solicitudes/min	Regional	Proyecto de recurso	Sugerir operaciones de resumen de conversaciones en cada región
Modelo de referencia de la versión 2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 solicitudes/min	Global	Proyecto de recurso	Solicitudes de sondeo de la versión 2 de la línea de base de sugerencias de resumen de conversaciones
Modelo de referencia de la versión 2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 solicitudes/min	Regional	Proyecto de recurso	Solicitudes de sondeo de la versión 2 de la línea de base de sugerencias de resumen de conversaciones en cada región

Autoevaluación de resúmenes

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
ConcurrentSummarizationEvaluationsPerProject	1 solicitud por proyecto	Proyecto de consumidor	Solicitudes de autoevaluación

Si necesitas cuotas simultáneas adicionales, envía una solicitud a través de la Google Cloud consola. Esta función puede admitir hasta cuatro cuotas simultáneas por proyecto.

Asistencia de conocimientos generativa

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
SearchKnowledgeRequestsPerMinutePerProject	60 solicitudes por minuto	Global	Proyecto de consumidor	Solicitudes de SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion	30 solicitudes por minuto	Regional	Proyecto de consumidor	Solicitudes de SearchKnowledge por región

Ayuda proactiva con conocimientos generativos

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 solicitudes por minuto	Global	Proyecto de recursos	Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 solicitudes por minuto	Regional	Proyecto de recursos	Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada región

Entrenador de IA (LLM)

Esta función usa el modelo de IA agent-coaching-2.5.

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de carga o proyecto de consumidor	Descripción
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 solicitudes por minuto	Global	Proyecto de consumidor	Operaciones de sugerencias de generador por tipo de modelo
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 solicitudes por minuto	Regional	Proyecto de consumidor	Operaciones de sugerencias de generador por tipo de modelo y región

Otras cuotas de API

Nombre del límite de cuota	Valor predeterminado	Region	Recurso de facturación o proyecto de consumidor	Descripción
ConversationOperationsPerMinutePerProject	300 solicitudes por minuto	Global	Proyecto de consumidor	Otras solicitudes de conversación, excepto AnalyzeContent y StreamingAnalyzeContent. Por ejemplo, CreateConversation y CompleteConversation. La cuota se comparte entre Dialogflow y Asistente para agentes.
MessagePollingOperationsPerMinutePerProject	1200 solicitudes por minuto	Global	Proyecto de consumidor	Solicitudes de ListMessages. La cuota se comparte entre Dialogflow y Asistente para agentes.
AnswerRecordOperationsPerMinutePerProject	300 solicitudes por minuto	Global	Proyecto de consumidor	Solicitudes de AnswerRecord

Cuotas Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.