Para estimar la cuota con precisión, se tiene en cuenta el número de consultas por segundo (CPS) que envías a cada API. En las siguientes secciones se describen las cuotas de las APIs que se usan con cada función de Asistente.
Consulta la página de cuotas para obtener más información sobre cómo solicitar un aumento de la cuota. Después de enviar tu solicitud, es posible que nos pongamos en contacto contigo para pedirte más información y comunicarte si la aprobamos o no.
Tipos de proyectos
En las siguientes tablas de cuotas se indican dos tipos de proyectos: de consumidor y de recurso. Consulta la documentación sobre cómo usar varios proyectos para ver las definiciones de estos dos tipos de proyectos.
Transcripción de voz
Esta función usa la integración de telefonía o gRPC, y cada una tiene cuotas de API diferentes.
Integración de telefonía
Consulta las cuotas de Dialogflow de las APIs que se usan con la integración de telefonía.
Integración de gRPC
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 solicitudes por minuto | Global | Proyecto de consumidor | Solicitudes AnalyzeContent o StreamingAnalyzeContent. La cuota se comparte entre Dialogflow y Asistente para agentes. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 solicitudes simultáneas | Regionales (el tráfico global se contabiliza en la región us-central1) |
Proyecto de consumidor (proyecto de recursos para la integración de SipRec de telefonía) | Sesiones de streaming bidireccionales simultáneas por región |
Transcripción con modelos de Chirp
| Nombre de la cuota | Valor predeterminado | Region | Recurso de carga o proyecto de consumidor | Descripción |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 solicitudes por minuto | Regional (el tráfico global se contabiliza en la región us-central1). |
Proyecto de consumidor (proyecto de recursos para la integración de SipRec de telefonía) | Número de solicitudes de StreamingRecognize enviadas a STT V2 por tipo de recurso |
Análisis de sentimiento
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| AnalyzeSentimentOperationsPerVersion | 300 solicitudes por minuto | Global | Proyecto de consumidor | Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerVersionPerRegion | 300 solicitudes por minuto | Regional | Proyecto de consumidor | Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 solicitudes por minuto | Global | Proyecto de consumidor | Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 solicitudes por minuto | Regional | Proyecto de consumidor | Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent. |
Crea tu propia asistencia
Esta función usa los siguientes modelos de IA:
- text-bison@001 (límite predeterminado: 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 solicitudes por minuto | Global | Proyecto de consumidor | Operaciones de sugerencias de generador por tipo de modelo |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 solicitudes por minuto | Regional | Proyecto de consumidor | Operaciones de sugerencias de generador por tipo de modelo y región |
Respuesta Inteligente
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 solicitudes por minuto | Global | Proyecto de consumidor | Obtener solicitudes de modelos de referencia de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 solicitudes por minuto | Global | Proyecto de consumidor | Obtener solicitudes del modelo de referencia de Respuesta inteligente V2 a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 solicitudes por minuto | Regional | Proyecto de consumidor | Obtener solicitudes del modelo de referencia de Respuesta inteligente V2 a través de AnalyzeContent o SuggestSmartReplies |
Respuesta inteligente generativa
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 solicitudes por minuto | Global | Proyecto de consumidor | Obtener solicitudes de modelos de referencia de Respuesta inteligente a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 solicitudes por minuto | Global | Proyecto de consumidor | Obtener solicitudes del modelo de referencia de Respuesta inteligente V2 a través de AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 solicitudes por minuto | Regional | Proyecto de consumidor | Obtener solicitudes del modelo de referencia de Respuesta inteligente V2 a través de AnalyzeContent o SuggestSmartReplies |
Creación de resúmenes
La función de resumen generada por IA usa los siguientes modelos:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
En la siguiente tabla se muestra el tipo de cuota y el modelo que se usan en cada versión de la función de resumen.
Versión de la creación de resúmenes |
Tipo de cuota |
Modelo de backend |
|---|---|---|
Generator 5.0 |
Basado en generadores |
Gemini 2.5 Flash preentrenado |
Generador 4.0 |
Basado en generadores |
Gemini-2.0-flash-001 preentrenado |
Generador 3.1 |
Basado en generadores |
gemini-1.5-flash-001 ajustado con Lora |
Generador 3.0 |
Basado en generadores |
gemini-1.0-pro-002 ajustado con Lora |
Generador 2.1 |
Basado en generadores |
Lora-tuned text-bison-32k@002 |
Generador 2.0 |
Basado en generadores |
Lora-tuned text-bison-32k@002 |
Generator 1.0 |
Basado en generadores |
Lora-tuned text-bison@001 |
Versión 2 de la referencia |
Modelo de referencia de la versión 2 |
text-bison |
Valor de referencia (versión 1) |
No se basa en un generador |
Modelo LongT5 |
Custom 2.0 |
No se basa en un generador |
Modelo LongT5 |
Los tipos de cuota de la tabla anterior se reflejan en la siguiente lista de cuotas de las APIs que se usan con la función de resumen.
Tipo de cuota |
Nombre del límite de cuota |
Valor predeterminado |
Región |
Recurso de carga o proyecto de consumidor |
Descripción |
|---|---|---|---|---|---|
Basado en generadores |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 solicitudes por minuto |
Regional |
Proyecto de consumidor |
Operaciones de sugerencias del generador por tipo de modelo y región |
Basado en generadores |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 solicitudes por minuto |
Global |
Proyecto de consumidor |
Operaciones de sugerencias de generador por tipo de modelo |
Basado en generadores |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 solicitudes/min |
Global |
Proyecto de recurso |
Sugerir operaciones de resumen de conversaciones |
No se basa en un generador |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0-2 solicitudes/min |
Regional |
Proyecto de recurso |
Sugerir operaciones de resumen de conversaciones en cada región |
Modelo de referencia de la versión 2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 solicitudes/min |
Global |
Proyecto de recurso |
Solicitudes de sondeo de la versión 2 de la línea de base de sugerencias de resumen de conversaciones |
Modelo de referencia de la versión 2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 solicitudes/min |
Regional |
Proyecto de recurso |
Solicitudes de sondeo de la versión 2 de la línea de base de sugerencias de resumen de conversaciones en cada región |
Autoevaluación de resúmenes
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 solicitud por proyecto | Proyecto de consumidor | Solicitudes de autoevaluación |
Si necesitas cuotas simultáneas adicionales, envía una solicitud a través de la Google Cloud consola. Esta función puede admitir hasta cuatro cuotas simultáneas por proyecto.
Asistencia de conocimientos generativa
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 solicitudes por minuto | Global | Proyecto de consumidor | Solicitudes de SearchKnowledge |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 solicitudes por minuto | Regional | Proyecto de consumidor | Solicitudes de SearchKnowledge por región |
Ayuda proactiva con conocimientos generativos
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 solicitudes por minuto | Global | Proyecto de recursos | Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 solicitudes por minuto | Regional | Proyecto de recursos | Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada región |
Entrenador de IA (LLM)
Esta función usa el modelo de IA agent-coaching-2.5.
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de carga o proyecto de consumidor | Descripción |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 solicitudes por minuto | Global | Proyecto de consumidor | Operaciones de sugerencias de generador por tipo de modelo |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 solicitudes por minuto | Regional | Proyecto de consumidor | Operaciones de sugerencias de generador por tipo de modelo y región |
Otras cuotas de API
| Nombre del límite de cuota | Valor predeterminado | Region | Recurso de facturación o proyecto de consumidor | Descripción |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 solicitudes por minuto | Global | Proyecto de consumidor | Otras solicitudes de conversación, excepto AnalyzeContent y StreamingAnalyzeContent. Por ejemplo, CreateConversation y CompleteConversation. La cuota se comparte entre Dialogflow y Asistente para agentes. |
| MessagePollingOperationsPerMinutePerProject | 1200 solicitudes por minuto | Global | Proyecto de consumidor | Solicitudes de ListMessages. La cuota se comparte entre Dialogflow y Asistente para agentes. |
| AnswerRecordOperationsPerMinutePerProject | 300 solicitudes por minuto | Global | Proyecto de consumidor | Solicitudes de AnswerRecord |