Cuotas

La estimación precisa de la cuota se basa en la cantidad de consultas por segundo (QPS) que envías a cada API. En las siguientes secciones, se describen las cuotas para las APIs que se usan con cada función de Agent Assist.

Consulta la página de cuotas para obtener más información sobre cómo solicitar un aumento de cuota. Después de enviar la solicitud, Google podría comunicarse contigo para pedirte más información y notificarte cuando se apruebe o rechace tu solicitud.

Tipos de proyecto

En las siguientes tablas de cuotas, se enumeran dos tipos de proyectos: consumidor y recurso. Consulta la documentación sobre el uso de varios proyectos para obtener definiciones de estos dos tipos de proyectos.

Transcripción de voz

Esta función usa la integración de telefonía o gRPC, que tienen diferentes cuotas de API.

Integración de telefonía

Consulta las cuotas de Dialogflow para las APIs que se usan con la integración de telefonía.

Integración de gRPC

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
AnalyzeContentOperationsPerMinutePerProject 300 solicitudes/min Global Proyecto del consumidor Solicitudes de AnalyzeContent/StreamingAnalyzeContent. La cuota se comparte entre Dialogflow y Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 solicitudes simultáneas Regional (el tráfico global se cuenta en la región us-central1) Proyecto del consumidor (proyecto de recursos para la integración de telefonía SipRec) Sesiones de transmisión bidireccional simultáneas por región

Transcripción con modelos de Chirp

Nombre de la cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 solicitudes por minuto Regional (el tráfico global se cuenta en la región us-central1). Proyecto del consumidor (proyecto de recursos para la integración de telefonía SipRec) Cantidad de solicitudes nuevas de StreamingRecognize enviadas a STT V2 por tipo de recurso

Análisis de opiniones

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
AnalyzeSentimentOperationsPerVersion 300 solicitudes/min Global Proyecto del consumidor Solicitudes de análisis de opiniones a través de AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion 300 solicitudes/min Regional Proyecto del consumidor Solicitudes de análisis de opiniones a través de AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject 300 solicitudes/min Global Proyecto del consumidor Solicitudes de análisis de opiniones a través de AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 solicitudes/min Regional Proyecto del consumidor Solicitudes de análisis de opiniones a través de AnalyzeContent o StreamingAnalyzeContent.

Crea tu propia asistencia

Esta función usa los siguientes modelos de IA:

  • text-bison@001 (límite predeterminado 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
GeneratorSuggestionOperationsPerMinutePerModelType 10 solicitudes/min Global Proyecto del consumidor Operaciones de sugerencias del generador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 solicitudes/min Regional Proyecto del consumidor Operaciones de sugerencias del generador por tipo de modelo y región

Respuesta inteligente

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
SmartReplyBaselineModelOperationsPerMinutePerProject 120 solicitudes/min Global Proyecto del consumidor Obtén solicitudes de modelos de referencia de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 solicitudes/min Global Proyecto del consumidor Obtén solicitudes de modelos de referencia V2 de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 solicitudes/min Regional Proyecto del consumidor Obtén solicitudes de modelos de referencia V2 de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies

Respuesta inteligente generativa

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
SmartReplyBaselineModelOperationsPerMinutePerProject 120 solicitudes/min Global Proyecto del consumidor Obtén solicitudes de modelos de referencia de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 solicitudes/min Global Proyecto del consumidor Obtén solicitudes de modelos de referencia V2 de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 solicitudes/min Regional Proyecto del consumidor Obtén solicitudes de modelos de referencia V2 de respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies

Resúmenes

Los resúmenes generados por IA usan los siguientes modelos:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

En la siguiente tabla, se muestran el tipo de cuota y el modelo que se usan para cada versión de resúmenes.


Versión de resúmenes

Tipo de cuota

Modelo de backend

Generador 5.0

Basado en generador

Gemini-2.5-flash entrenado previamente

Generador 4.0

Basado en generador

Gemini-2.0-flash-001 entrenado previamente

Generador 3.1

Basado en generador

gemini-1.5-flash-001 ajustado con Lora

Generador 3.0

Basado en generador

gemini-1.0-pro-002 ajustado con Lora

Generador 2.1

Basado en generador

text-bison-32k@002 ajustado con Lora

Generador 2.0

Basado en generador

text-bison-32k@002 ajustado con Lora

Generador 1.0

Basado en generador

text-bison@001 ajustado con Lora

Referencia v2

Modelo de referencia v2

text-bison

Referencia v1

No basado en generador

Modelo LongT5

Personalizado 2.0

No basado en generador

Modelo LongT5

Los tipos de cuotas de la tabla anterior se reflejan en la siguiente lista de cuotas para las APIs que se usan con resúmenes.


Tipo de cuota

Nombre del límite de cuota

Valor predeterminado

Región

Recurso de facturación o proyecto del consumidor

Descripción

Basado en generador

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 solicitudes/min

Regional

Proyecto del consumidor

Operaciones de sugerencias del generador por tipo de modelo y región

Basado en generador

GeneratorSuggestionOperationsPerMinutePerModelType

10 solicitudes/min

Global

Proyecto del consumidor

Operaciones de sugerencias del generador por tipo de modelo

Basado en generador

SuggestConversationSummaryOperationsPerMinutePerProject

60 solicitudes/min

Global

Proyecto de recursos

Operaciones de sugerencias de resúmenes de conversaciones

No basado en generador

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 a 2 solicitudes/min

Regional

Proyecto de recursos

Operaciones de sugerencias de resúmenes de conversaciones en cada región

Modelo de referencia v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 solicitudes/min

Global

Proyecto de recursos

Solicitudes de sondeo de referencia V2 de sugerencias de resúmenes de conversaciones

Modelo de referencia v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 solicitudes/min

Regional

Proyecto de recursos

Solicitudes de sondeo de referencia V2 de sugerencias de resúmenes de conversaciones en cada región

Evaluación automática de resúmenes

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
ConcurrentSummarizationEvaluationsPerProject 1 solicitud por proyecto Proyecto del consumidor Solicitudes de evaluación automática

Si necesitas cuotas simultáneas adicionales, envía una solicitud a través de la Google Cloud consola de. Esta función puede admitir hasta cuatro cuotas simultáneas por proyecto.

Knowledge Assist generativo

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
SearchKnowledgeRequestsPerMinutePerProject 60 solicitudes/min Global Proyecto del consumidor Solicitudes de SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 solicitudes/min Regional Proyecto del consumidor Solicitudes de SearchKnowledge en cada región

Knowledge Assist generativo proactivo

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 solicitudes/min Global Proyecto de recursos Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 solicitudes/min Regional Proyecto de recursos Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada región

Coach de IA (LLM)

Esta función usa el modelo de IA agent-coaching-2.5.

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
GeneratorSuggestionOperationsPerMinutePerModelType 60 solicitudes por minuto Global Proyecto del consumidor Operaciones de sugerencias del generador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 solicitudes por minuto Regional Proyecto del consumidor Operaciones de sugerencias del generador por tipo de modelo y región

Otras cuotas de la API

Nombre del límite de cuota Valor predeterminado Región Recurso de facturación o proyecto del consumidor Descripción
ConversationOperationsPerMinutePerProject 300 solicitudes/min Global Proyecto del consumidor Otras solicitudes de conversación, excepto AnalyzeContent y StreamingAnalyzeContent, por ejemplo, CreateConversation y CompleteConversation. La cuota se comparte entre Dialogflow y Agent Assist.
MessagePollingOperationsPerMinutePerProject 1,200 solicitudes por minuto Global Proyecto del consumidor Solicitudes de ListMessages. La cuota se comparte entre Dialogflow y Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 solicitudes por minuto Global Proyecto del consumidor Solicitudes de AnswerRecord