Pour estimer précisément votre quota, nous nous basons sur le nombre de requêtes par seconde (RPS) que vous envoyez à chaque API. Les sections suivantes décrivent les quotas pour les API utilisées avec chaque fonctionnalité d'Assistance de l'agent.
Pour savoir comment demander une augmentation de quota, consultez la page relative aux quotas. Une fois votre demande envoyée, il est possible que Google vous contacte pour obtenir des détails supplémentaires et vous informer de l'approbation ou du refus de votre demande.
Types de projets
Les tableaux de quotas suivants listent deux types de projets : les projets consommateurs et les projets ressources. Pour obtenir les définitions de ces deux types de projets, consultez la documentation sur l'utilisation de plusieurs projets.
Transcription vocale
Cette fonctionnalité utilise l'intégration de la téléphonie ou de gRPC, qui ont chacune des quotas d'API différents.
Intégration de la téléphonie
Consultez les quotas Dialogflow pour les API utilisées avec l'intégration de la téléphonie.
Intégration de gRPC
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet du client | Requêtes AnalyzeContent/StreamingAnalyzeContent. Le quota est partagé entre Dialogflow et Agent Assist. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 requêtes simultanées | Régional (le trafic mondial est comptabilisé dans la région us-central1) |
Projet client (projet de ressources pour l'intégration SipRec de la téléphonie) | Sessions de streaming bidirectionnel simultanées par région |
Transcription avec les modèles Chirp
| Nom du quota | Valeur par défaut | Région | Facturer un projet de ressource ou de consommateur | Description |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 requêtes par minute | Régional (le trafic mondial est comptabilisé dans la région us-central1) |
Projet client (projet de ressources pour l'intégration SipRec de la téléphonie) | Nombre de nouvelles requêtes StreamingRecognize envoyées à STT V2 par type de ressource |
Analyse des sentiments
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion | 300 requêtes/minute | États-Unis (multirégional) | Projet du client | Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent par version et par ensemble multirégional |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet du client | Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 requêtes/minute | Régional | Projet du client | Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent. |
Créer votre propre assistance
Cette fonctionnalité utilise les modèles d'IA suivants :
- text-bison@001 (limite par défaut : 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 requêtes/minute | Monde | Projet du client | Opérations de suggestion de générateur par type de modèle |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 requêtes/minute | Régional | Projet du client | Opérations de suggestions de générateur par type de modèle et région |
Réponse suggérée
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 requêtes/minute | Monde | Projet du client | Obtenir des requêtes de modèle de référence de réponse suggérée via AnalyzeContent ou SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 requêtes/minute | Monde | Projet du client | Obtenez des requêtes de modèle de référence V2 pour les réponses suggérées via AnalyzeContent ou SuggestSmartReplies. |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 requêtes/minute | Régional | Projet du client | Obtenez des requêtes de modèle de référence V2 pour les réponses suggérées via AnalyzeContent ou SuggestSmartReplies. |
Réponses suggérées génératives
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 requêtes/minute | Monde | Projet du client | Obtenir des requêtes de modèle de référence de réponse suggérée via AnalyzeContent ou SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 requêtes/minute | Monde | Projet du client | Obtenez des requêtes de modèle de référence V2 pour les réponses suggérées via AnalyzeContent ou SuggestSmartReplies. |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 requêtes/minute | Régional | Projet du client | Obtenez des requêtes de modèle de référence V2 pour la réponse suggérée via AnalyzeContent ou SuggestSmartReplies. |
Synthèse
La synthèse générée par l'IA utilise les modèles suivants :
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
Le tableau suivant indique le type de quota et le modèle utilisés pour chaque version de la fonctionnalité de synthèse.
Version de la synthèse |
Type de quota |
Modèle de backend |
|---|---|---|
Generator 5.0 |
Basé sur un générateur |
Gemini-2.5-flash préentraîné |
Generator 4.0 |
Basé sur un générateur |
Gemini-2.0-flash-001 préentraîné |
Generator 3.1 |
Basé sur un générateur |
gemini-1.5-flash-001 affiné avec Lora |
Generator 3.0 |
Basé sur un générateur |
gemini-1.0-pro-002 affiné avec Lora |
Generator 2.1 |
Basé sur un générateur |
Lora-tuned text-bison-32k@002 |
Generator 2.0 |
Basé sur un générateur |
Lora-tuned text-bison-32k@002 |
Generator 1.0 |
Basé sur un générateur |
Lora-tuned text-bison@001 |
Baseline v2 |
Modèle de référence V2 |
text-bison |
Référence v1 |
Non basé sur un générateur |
Modèle LongT5
|
Personnalisé 2.0 |
Non basé sur un générateur |
Modèle LongT5
|
Les types de quotas du tableau précédent sont reflétés dans la liste de quotas suivante pour les API utilisées avec la synthèse.
Type de quota |
Nom de la limite de quota |
Valeur par défaut |
Région |
Ressource de recharge/Projet consommateur |
Description |
|---|---|---|---|---|---|
Basé sur un générateur |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 requêtes/minute |
Régional |
Projet client |
Opérations de suggestions du générateur par type de modèle et par région |
Basé sur un générateur |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 requêtes/minute |
Global |
Projet client |
Opérations de suggestions du générateur par type de modèle |
Basé sur un générateur |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 requêtes/min |
Global |
Projet de ressources |
Suggérer des opérations de résumé de conversation |
Non basé sur un générateur |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 à 2 requêtes/min |
Régional |
Projet de ressources |
Suggérer des opérations de résumé de conversation dans chaque région |
Modèle de référence V2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 requêtes/minute |
Global |
Projet de ressources |
Requêtes d'interrogation de référence pour la suggestion de résumé de conversation V2 |
Modèle de référence V2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 requêtes/min |
Régional |
Projet de ressources |
Demandes d'interrogation de référence V2 pour la suggestion de résumé de conversation dans chaque région |
Évaluation automatique de la synthèse
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 requête par projet | Projet du client | Demandes d'auto-évaluation |
Si vous avez besoin de quotas simultanés supplémentaires, envoyez une demande via la console Google Cloud . Cette fonctionnalité peut accepter jusqu'à quatre quotas simultanés par projet.
Assistance base de connaissances générative
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 requêtes/minute | Monde | Projet du client | Demandes SearchKnowledge |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 requêtes/minute | Régional | Projet du client | Requêtes SearchKnowledge pour chaque région |
| SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion | 30 requêtes/minute | États-Unis (multirégional) | Projet du client | Requêtes SearchKnowledge pour chaque emplacement multirégional |
Assistance proactive basée sur l'IA générative
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 requêtes/minute | Monde | Projet de ressources | Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 requêtes/minute | Régional | Projet de ressources | Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist dans chaque région |
| SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion | 30 requêtes/minute | États-Unis (multirégional) | Projet de ressources | Requêtes Knowledge Assist via AnalyzeContent ou SuggestKnowledgeAssist dans chaque ensemble multirégional |
Coach IA (LLM)
Cette fonctionnalité utilise le modèle d'IA agent-coaching-2.5.
| Nom de la limite de quota | Valeur par défaut | Région | Facturer un projet de ressource ou de consommateur | Description |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 requêtes par minute | Monde | Projet du client | Opérations de suggestion de générateur par type de modèle |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 requêtes par minute | Régional | Projet du client | Opérations de suggestions de générateur par type de modèle et région |
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion |
60 requêtes par minute | États-Unis (multirégional) | Projet du client | Opérations de suggestion de générateur par type de modèle et multirégion |
Autres quotas d'API
| Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet du client | Autres requêtes de conversation, à l'exception d'AnalyzeContent et de StreamingAnalyzeContent (par exemple, CreateConversation, CompleteConversation). Le quota est partagé entre Dialogflow et Agent Assist. |
| MessagePollingOperationsPerMinutePerProject | 1 200 requêtes / min | Monde | Projet du client | Requêtes ListMessages. Le quota est partagé entre Dialogflow et Agent Assist. |
| AnswerRecordOperationsPerMinutePerProject | 300 requêtes / min | Monde | Projet du client | Requêtes AnswerRecord |