L'estimation précise des quotas est basée sur le nombre de requêtes par seconde (RPS) adressées à chaque API. Les sections suivantes décrivent les quotas des API utilisées avec chaque fonctionnalité d'Agent Assist.
Pour en savoir plus sur la demande d'augmentation de quota, consultez la page relative aux quotas. Après avoir envoyé votre demande, Google pourra vous contacter pour obtenir plus d'informations et vous indiquer si elle a été approuvée ou refusée.
Types de projets
Les tableaux de quotas suivants répertorient deux types de projets : client et ressource. Pour obtenir la définition de ces deux types de projets, consultez la documentation sur l'utilisation de plusieurs projets.
Transcription vocale
Cette fonctionnalité utilise l'intégration de la téléphonie ou de gRPC, qui ont chacune des quotas d'API différents.
Intégration de la téléphonie
Consultez les quotas Dialogflow pour les API utilisées avec l'intégration de la téléphonie.
Intégration de gRPC
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet client | Requêtes AnalyzeContent/StreamingAnalyzeContent. Le quota est partagé entre Dialogflow et Agent Assist. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 requêtes simultanées | Régional (le trafic mondial est comptabilisé dans la région us-central1) |
Projet client (projet de ressources pour l'intégration de la téléphonie SipRec) | Sessions de streaming bidirectionnel simultanées par région |
Transcription avec les modèles Chirp
| Nom du quota | Valeur par défaut | Région | Ressource facturée ou projet client | Description |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 requêtes par minute | Régional (le trafic mondial est comptabilisé dans la région us-central1) |
Projet client (projet de ressources pour l'intégration de la téléphonie SipRec) | Nombre de nouvelles requêtes StreamingRecognize envoyées à STT V2 par type de ressource |
Analyse des sentiments
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| AnalyzeSentimentOperationsPerVersion | 300 requêtes/minute | Monde | Projet client | Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerVersionPerRegion | 300 requêtes/minute | Régional | Projet client | Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet client | Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 requêtes/minute | Régional | Projet client | Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent. |
Créer votre propre assistant
Cette fonctionnalité utilise les modèles d'IA suivants :
- text-bison@001 (limite par défaut : 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 requêtes/minute | Monde | Projet client | Opérations de suggestion de générateur par type de modèle |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 requêtes/minute | Régional | Projet client | Opérations de suggestion de générateur par type de modèle et par région |
Réponse suggérée
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 requêtes/minute | Monde | Projet client | Obtenir des requêtes de modèle de référence de réponse suggérée via AnalyzeContent ou SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 requêtes/minute | Monde | Projet client | Obtenir des requêtes de modèle de référence V2 de réponse suggérée via AnalyzeContent ou SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 requêtes/minute | Régional | Projet client | Obtenir des requêtes de modèle de référence V2 de réponse suggérée via AnalyzeContent ou SuggestSmartReplies |
Réponse suggérée générative
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 requêtes/minute | Monde | Projet client | Obtenir des requêtes de modèle de référence de réponse suggérée via AnalyzeContent ou SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 requêtes/minute | Monde | Projet client | Obtenir des requêtes de modèle de référence V2 de réponse suggérée via AnalyzeContent ou SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 requêtes/minute | Régional | Projet client | Obtenir des requêtes de modèle de référence V2 de réponse suggérée via AnalyzeContent ou SuggestSmartReplies |
Synthèse
La synthèse générée par l'IA utilise les modèles suivants :
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
Le tableau suivant indique le type de quota et le modèle utilisé pour chaque version de la synthèse.
Version de la synthèse |
Type de quota |
Modèle de backend |
|---|---|---|
Générateur 5.0 |
Basé sur le générateur |
Gemini-2.5-flash pré-entraîné |
Générateur 4.0 |
Basé sur le générateur |
Gemini-2.0-flash-001 pré-entraîné |
Générateur 3.1 |
Basé sur le générateur |
Gemini-1.5-flash-001 ajusté avec Lora |
Générateur 3.0 |
Basé sur le générateur |
Gemini-1.0-pro-002 ajusté avec Lora |
Générateur 2.1 |
Basé sur le générateur |
Text-bison-32k@002 ajusté avec Lora |
Générateur 2.0 |
Basé sur le générateur |
Text-bison-32k@002 ajusté avec Lora |
Générateur 1.0 |
Basé sur le générateur |
Text-bison@001 ajusté avec Lora |
Référence v2 |
Modèle de référence v2 |
text-bison |
Référence v1 |
Non basé sur le générateur |
Modèle LongT5 |
Personnalisé 2.0 |
Non basé sur le générateur |
Modèle LongT5 |
Les types de quotas du tableau précédent sont reflétés dans la liste de quotas suivante pour les API utilisées avec la synthèse.
Type de quota |
Nom de la limite de quota |
Valeur par défaut |
Région |
Ressource facturée/Projet client |
Description |
|---|---|---|---|---|---|
Basé sur le générateur |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 requêtes/minute |
Régional |
Projet client |
Opérations de suggestion de générateur par type de modèle et par région |
Basé sur le générateur |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 requêtes/minute |
Monde |
Projet client |
Opérations de suggestion de générateur par type de modèle |
Basé sur le générateur |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 requêtes/minute |
Monde |
Projet de ressources |
Suggérer des opérations de résumé de conversation |
Non basé sur le générateur |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 à 2 requêtes/minute |
Régional |
Projet de ressources |
Suggérer des opérations de résumé de conversation dans chaque région |
Modèle de référence v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 requêtes/minute |
Monde |
Projet de ressources |
Requêtes d'interrogation de référence V2 de suggestion de résumé de conversation |
Modèle de référence v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 requêtes/minute |
Régional |
Projet de ressources |
Requêtes d'interrogation de référence V2 de suggestion de résumé de conversation dans chaque région |
Évaluation automatique de la synthèse
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 requête par projet | Projet client | Requêtes d'évaluation automatique |
Si vous avez besoin de quotas simultanés supplémentaires, envoyez une demande via la Google Cloud console. Cette fonctionnalité peut accepter jusqu'à quatre quotas simultanés par projet.
Assistance générative pour la base de connaissances
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 requêtes/minute | Monde | Projet client | Requêtes SearchKnowledge |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 requêtes/minute | Régional | Projet client | Requêtes SearchKnowledge par région |
Assistance générative proactive pour la base de connaissances
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 requêtes/minute | Monde | Projet de ressources | Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 requêtes/minute | Régional | Projet de ressources | Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist dans chaque région |
Coach IA (LLM)
Cette fonctionnalité utilise le modèle d'IA agent-coaching-2.5.
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée ou projet client | Description |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 requêtes par minute | Monde | Projet client | Opérations de suggestion de générateur par type de modèle |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 requêtes par minute | Régional | Projet client | Opérations de suggestion de générateur par type de modèle et par région |
Autres quotas d'API
| Nom de la limite de quota | Valeur par défaut | Région | Ressource facturée/Projet client | Description |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet client | Autres requêtes de conversation, à l'exception d'AnalyzeContent et de StreamingAnalyzeContent, par exemple CreateConversation, CompleteConversation. Le quota est partagé entre Dialogflow et Agent Assist. |
| MessagePollingOperationsPerMinutePerProject | 1 200 requêtes / minute | Monde | Projet client | Requêtes ListMessages. Le quota est partagé entre Dialogflow et Agent Assist. |
| AnswerRecordOperationsPerMinutePerProject | 300 requêtes / minute | Monde | Projet client | Requêtes AnswerRecord |