Cuotas

La estimación precisa de la cuota se basa en la cantidad de consultas por segundo (QPS) que envías a cada API. En las siguientes secciones, se describen las cuotas para las APIs que se usan con cada función de Agent Assist.

Consulta la página de cuotas para obtener más información sobre cómo solicitar un aumento de cuota. Después de enviar la solicitud, Google podría comunicarse contigo para pedirte más información y notificarte cuando se apruebe o rechace.

Si no puedes especificar dimensiones cuando solicitas un aumento de cuota para las cuotas multirregionales en Google Cloud console, usa Google Cloud CLI o comunícate con Atención al cliente de Cloud.

Tipos de proyecto

En las siguientes tablas de cuotas, se enumeran dos tipos de proyectos: de consumidor y de recurso. Consulta la documentación sobre el uso de varios proyectos para ver las definiciones de estos dos tipos de proyectos.

Transcripción de voz

Esta función usa la integración de telefonía o gRPC, cada una con diferentes cuotas de API.

Integración de telefonía

Consulta las cuotas de Dialogflow para las APIs que se usan con la integración telefónica.

Integración de gRPC

Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
AnalyzeContentOperationsPerMinutePerProject 300 solicitudes/min Global Proyecto del consumidor Solicitudes de AnalyzeContent/StreamingAnalyzeContent La cuota se comparte entre Dialogflow y Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 solicitudes simultáneas Regional (el tráfico global y el de varias regiones de EE.UU. se contabilizan en la región us-central1). Proyecto del consumidor (proyecto de recursos para la integración de SipRec de telefonía) Sesiones de transmisión bidireccional simultáneas por región

Transcripción con modelos de Chirp

La transcripción de voz admite los siguientes modelos de Chirp:

  • chirp_2
  • chirp_3
Nombre de la cuota Valor predeterminado Región Proyecto de consumidor o recurso de carga Descripción
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 solicitudes por minuto Regional (el tráfico global y el de varias regiones de EE.UU. se contabilizan en la región us-central1). Proyecto del consumidor (proyecto de recursos para la integración de SipRec de telefonía) Dimensiones de la cuota: resource_type={stt_model_name} (cantidad de solicitudes nuevas de StreamingRecognize enviadas a STT V2 por tipo de recurso)

Análisis de opiniones

Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion 300 solicitudes/min EE.UU. multirregión Proyecto del consumidor Dimensiones de la cuota: multi-region=us,version=v3. Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent por versión y por multirregión
AnalyzeSentimentOperationsPerMinutePerProject 300 solicitudes/min Global Proyecto del consumidor Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 solicitudes/min Regional Proyecto del consumidor Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent

Crea tu propia asistencia

Esta función usa los siguientes modelos de IA:

  • text-bison@001 (límite predeterminado: 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
GeneratorSuggestionOperationsPerMinutePerModelType 10 solicitudes por minuto Global Proyecto del consumidor Operaciones de sugerencias del generador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 solicitudes por minuto Regional Proyecto del consumidor Dimensiones de la cuota: model_type={model_name}. Operaciones de sugerencias del generador por tipo de modelo y región

Respuesta inteligente

Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
SmartReplyBaselineModelOperationsPerMinutePerProject 120 solicitudes por minuto Global Proyecto del consumidor Obtén solicitudes del modelo de referencia de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 solicitudes por minuto Global Proyecto del consumidor Obtén solicitudes del modelo de referencia de la versión 2 de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 solicitudes por minuto Regional Proyecto del consumidor Obtén solicitudes del modelo de referencia de la versión 2 de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies

Respuesta inteligente generativa

Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
SmartReplyBaselineModelOperationsPerMinutePerProject 120 solicitudes por minuto Global Proyecto del consumidor Obtén solicitudes del modelo de referencia de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 solicitudes por minuto Global Proyecto del consumidor Obtén solicitudes del modelo de referencia de la versión 2 de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 solicitudes por minuto Regional Proyecto del consumidor Obtén solicitudes del modelo de referencia de la versión 2 de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies

Resúmenes

La generación de resúmenes con IA usa los siguientes modelos:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

En la siguiente tabla, se muestran el tipo de cuota y el modelo que se usan para cada versión del resumen.


Versión del resumen

Tipo de cuota

Modelo de backend

Generator 5.0

Basado en generador

Gemini-2.5-flash previamente entrenado

Generador 4.0

Basado en generador

Gemini-2.0-flash-001 entrenado previamente

Generator 3.1

Basado en generador

gemini-1.5-flash-001 ajustado con Lora

Generator 3.0

Basado en generador

gemini-1.0-pro-002 ajustado con Lora

Generador 2.1

Basado en generador

text-bison-32k@002 ajustado con Lora

Generator 2.0

Basado en generador

text-bison-32k@002 ajustado con Lora

Generator 1.0

Basado en generador

text-bison@001 ajustado con Lora

Modelo de referencia v2

Modelo de referencia v2

text-bison

Baseline v1

No se basa en un generador
Modelo
LongT5

Personalizado 2.0

No se basa en un generador
Modelo
LongT5

Los tipos de cuota de la tabla anterior se reflejan en la siguiente lista de cuotas para las APIs que se usan con la función de resumen.


Tipo de cuota

Nombre del límite de cuota

Valor predeterminado

Región

Proyecto de recursos de carga/consumidor

Descripción

Basado en generador

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 solicitudes por minuto

Regional

Proyecto del consumidor

Dimensiones de la cuota: model_type=summarization-{version_num}.Operaciones de sugerencias del generador por tipo de modelo y región

Basado en generador

GeneratorSuggestionOperationsPerMinutePerModelType

10 solicitudes por minuto

Global

Proyecto del consumidor

Operaciones de sugerencias del generador por tipo de modelo

Basado en generador

GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion

10 solicitudes por minuto

Multirregión de EE.UU.

Proyecto del consumidor

Dimensiones de cuota: multi-region=us, model_type=summarization-{version_num}. Operaciones de sugerencias del generador por tipo de modelo y región

Basado en generador

SuggestConversationSummaryOperationsPerMinutePerProject

60 solicitudes/min

Global

Proyecto de recursos

Sugerir operaciones de resumen de conversaciones

No se basa en un generador

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 a 2 solicitudes por minuto

Regional

Proyecto de recursos

Sugerir operaciones de resumen de conversaciones en cada región

Modelo de referencia v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 solicitudes por minuto

Global

Proyecto de recursos

Solicitudes de sondeo del modelo de referencia de la sugerencia de resumen de conversación V2

Modelo de referencia v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 solicitudes/min

Regional

Proyecto de recursos

Solicitudes de sondeo de la versión 2 del modelo de referencia de sugerencias de resumen de conversaciones en cada región

Autoevaluación de resúmenes

Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
ConcurrentSummarizationEvaluationsPerProject 1 solicitud por proyecto Proyecto del consumidor Solicitudes de autoevaluación

Si necesitas cuotas simultáneas adicionales, envía una solicitud a través de la consola de Google Cloud . Esta función admite hasta cuatro cuotas simultáneas por proyecto.

Asistente de conocimiento generativo

Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
SearchKnowledgeRequestsPerMinutePerProject 60 solicitudes por minuto Global Proyecto del consumidor Solicitudes de SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 solicitudes por minuto Regional Proyecto del consumidor SearchKnowledge solicita cada región
SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion 30 solicitudes por minuto EE.UU. multirregión Proyecto del consumidor Dimensiones de la cuota: multi-region=us. Solicitudes de SearchKnowledge para cada multirregión

Asistente de conocimiento generativo proactivo

Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 solicitudes por minuto Global Proyecto de recursos Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 solicitudes por minuto Regional Proyecto de recursos Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada región
SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion 30 solicitudes por minuto EE.UU. multirregión Proyecto de recursos Dimensiones de la cuota: multi-region=us. Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada multirregión

Coach potenciado por IA (LLM)

Esta función usa el modelo de IA agent-coaching-2.5.

Nombre del límite de cuota Valor predeterminado Región Proyecto de consumidor o recurso de carga Descripción
GeneratorSuggestionOperationsPerMinutePerModelType 60 solicitudes por minuto Global Proyecto del consumidor Dimensiones de la cuota: model_type=agent-coaching-2.5. Operaciones de sugerencias del generador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 solicitudes por minuto Regional Proyecto del consumidor Dimensiones de la cuota: model_type=agent-coaching-2.5. Operaciones de sugerencias del generador por tipo de modelo y región
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion 10 solicitudes por minuto EE.UU. multirregión Proyecto del consumidor Dimensiones de la cuota: multi-region=us,model_type=agent-coaching-2.5. Operaciones de sugerencias del generador por tipo de modelo y multirregión

Otras cuotas de la API

Nombre del límite de cuota Valor predeterminado Región Proyecto de recursos/consumidor de cargos Descripción
ConversationOperationsPerMinutePerProject 300 solicitudes/min Global Proyecto del consumidor Otras solicitudes de conversación, excepto AnalyzeContent y StreamingAnalyzeContent, por ejemplo, CreateConversation y CompleteConversation. La cuota se comparte entre Dialogflow y Agent Assist.
MessagePollingOperationsPerMinutePerProject 1,200 solicitudes por minuto Global Proyecto del consumidor Son solicitudes de ListMessages. La cuota se comparte entre Dialogflow y Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 solicitudes por minuto Global Proyecto del consumidor Solicitudes de AnswerRecord