Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Quotas

Pour estimer précisément les quotas, vous devez connaître le nombre de requêtes par seconde (RPS) que vous envoyez à chaque API. Les sections suivantes décrivent les quotas des API utilisées avec chaque fonctionnalité Agent Assist.

Types de projets

Les tableaux de quotas suivants listent deux types de projets : les projets consommateurs et les projets ressources. Pour obtenir les définitions de ces deux types de projets, consultez la documentation sur l'utilisation de plusieurs projets.

Transcription vocale

Cette fonctionnalité utilise l'intégration de la téléphonie ou de gRPC, qui ont chacune des quotas d'API différents.

Intégration de la téléphonie

Consultez les quotas Dialogflow pour les API utilisées avec l'intégration de la téléphonie.

Intégration de gRPC

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`AnalyzeContentOperationsPerMinutePerProject`	300 requêtes/minute	Monde	Projet du client	Requêtes AnalyzeContent/StreamingAnalyzeContent. Le quota est partagé entre Dialogflow et Agent Assist.
`ConcurrentBidiStreamingSessionsPerProjectPerRegion`	50 requêtes simultanées	Régional (le trafic mondial est comptabilisé dans la région `us-central1`)	Projet client (projet de ressources pour l'intégration SipRec de la téléphonie)	Sessions de streaming bidirectionnel simultanées par région.

Transcription avec les modèles Chirp

Nom du quota	Valeur par défaut	Région	Facturer un projet de ressource ou de consommateur	Description
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 requêtes par minute	Régional (le trafic mondial est comptabilisé dans la région `us-central1`)	Projet client (projet de ressources pour l'intégration SipRec de la téléphonie)	Nombre de nouvelles requêtes `StreamingRecognize` envoyées à STT V2 par type de ressource.

Analyse des sentiments

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`AnalyzeSentimentOperationsPerVersion`	300 requêtes/minute	Monde	Projet du client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
`AnalyzeSentimentOperationsPerVersionPerRegion`	300 requêtes/minute	Régional	Projet du client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
`AnalyzeSentimentOperationsPerMinutePerProject`	300 requêtes/minute	Monde	Projet du client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
`AnalyzeSentimentOperationsPerMinutePerProjectPerRegion`	300 requêtes/minute	Régional	Projet du client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.

Créer votre propre assistance

Cette fonctionnalité utilise les modèles d'IA suivants :

text-bison@001 (limite par défaut : 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`GeneratorSuggestionOperationsPerMinutePerModelType`	10 requêtes/minute	Monde	Projet du client	Opérations de suggestions du générateur par type de modèle.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	10 requêtes/minute	Régional	Projet du client	Opérations de suggestions du générateur par type de modèle et par région.

Réponse suggérée

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`SmartReplyBaselineModelOperationsPerMinutePerProject`	120 requêtes/minute	Monde	Projet du client	Obtenez des requêtes de modèle de référence de réponses suggérées via `AnalyzeContent` ou `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	60 requêtes/minute	Monde	Projet du client	Obtenez des requêtes de modèle de référence V2 pour les réponses suggérées via `AnalyzeContent` ou `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	60 requêtes/minute	Régional	Projet du client	Obtenez des requêtes de modèle de référence V2 pour les réponses suggérées via `AnalyzeContent` ou `SuggestSmartReplies`.

Réponses suggérées génératives

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`SmartReplyBaselineModelOperationsPerMinutePerProject`	120 requêtes/minute	Monde	Projet du client	Obtenez des requêtes de modèle de référence de réponses suggérées via `AnalyzeContent` ou `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	60 requêtes/minute	Monde	Projet du client	Obtenez des requêtes de modèle de référence V2 pour les réponses suggérées via `AnalyzeContent` ou `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	60 requêtes/minute	Régional	Projet du client	Obtenez des requêtes de modèle de référence V2 pour les réponses suggérées via `AnalyzeContent` ou `SuggestSmartReplies`.

Synthèse

La synthèse générée par l'IA utilise les modèles suivants :

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

Le tableau suivant indique le type de quota et le modèle utilisés pour chaque version de la fonctionnalité de synthèse.

Version de la synthèse	Type de quota	Modèle de backend
Générateur 5.0	Basé sur un générateur	Gemini-2.5-flash préentraîné
Generator 4.0	Basé sur un générateur	Gemini-2.0-flash-001 préentraîné
Générateur 3.1	Basé sur un générateur	gemini-1.5-flash-001 ajusté avec Lora
Generator 3.0	Basé sur un générateur	gemini-1.0-pro-002 affiné avec LoRA
Generator 2.1	Basé sur un générateur	Lora-tuned text-bison-32k@002
Generator 2.0	Basé sur un générateur	Lora-tuned text-bison-32k@002
Générateur 1.0	Basé sur un générateur	Lora-tuned text-bison@001
Référence v2	Modèle de référence V2	text-bison
Référence v1	Non basé sur un générateur	Modèle LongT5
Personnalisé 2.0	Non basé sur un générateur	Modèle LongT5

Les types de quotas du tableau précédent sont reflétés dans la liste de quotas suivante pour les API utilisées avec la synthèse.

Type de quota	Nom de la limite de quota	Valeur par défaut	Région	Ressource de recharge/Projet consommateur	Description
Basé sur un générateur	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 requêtes/minute	Régional	Projet client	Opérations de suggestions du générateur par type de modèle et par région
Basé sur un générateur	GeneratorSuggestionOperationsPerMinutePerModelType	10 requêtes/minute	Global	Projet client	Opérations de suggestions du générateur par type de modèle
Basé sur un générateur	SuggestConversationSummaryOperationsPerMinutePerProject	60 requêtes/min	Global	Projet de ressources	Suggérer des opérations de résumé de conversation
Non basé sur un générateur	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0 à 2 requêtes/min	Régional	Projet de ressources	Suggérer des opérations de résumé de conversation dans chaque région
Modèle de référence V2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 requêtes/minute	Global	Projet de ressources	Requêtes d'interrogation de référence V2 pour les suggestions de résumés de conversations
Modèle de référence V2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 requêtes/min	Régional	Projet de ressources	Demandes d'interrogation de référence V2 pour la suggestion de résumé de conversation dans chaque région

Auto-évaluation de la synthèse

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`ConcurrentSummarizationEvaluationsPerProject`	1 requête par projet	Projet du client	Demandes d'auto-évaluation

Si vous avez besoin de quotas simultanés supplémentaires, envoyez une demande via la console Google Cloud . Cette fonctionnalité peut accepter jusqu'à quatre quotas simultanés par projet.

Assistance base de connaissances générative

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`SearchKnowledgeRequestsPerMinutePerProject`	60 requêtes/minute	Monde	Projet du client	Demandes Search Knowledge.
`SearchKnowledgeRequestsPerMinutePerProjectPerRegion`	30 requêtes/minute	Régional	Projet du client	SearchKnowledge requests each region.

Assistance proactive basée sur l'IA générative (V1)

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`SuggestKnowledgeAssistOperationsPerMinutePerProject`	60 requêtes/minute	Monde	Projet de ressources	Demandes KnowledgeAssist via `AnalyzeContent` ou `SuggestKnowledgeAssist`.
`SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion`	30 requêtes/minute	Régional	Projet de ressources	Requêtes Knowledge Assist via `AnalyzeContent` ou `SuggestKnowledgeAssist` dans chaque région.

Assistance proactive basée sur l'IA générative V2

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`KnowledgeAssistOpsPerMinutePerProjectPerVersion`	30 requêtes/minute	Monde	Projet de ressources	KnowledgeAssist demande une version de modèle spécifique lorsque la requête est adressée au point de terminaison de localisation globale.
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion`	30 requêtes/minute	Régional	Projet de ressources	Requêtes KnowledgeAssist adressées à une seule région Google Cloud spécifique, comme `us-central1` ou `europe-west1`.
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion`	30 requêtes/minute	MultiRegional	Projet de ressources	Requêtes KnowledgeAssist adressées à des points de terminaison multirégionaux, tels que les États-Unis ou l'UE.

Coach IA (LLM)

Cette fonctionnalité utilise le modèle d'IA agent-coaching-2.5.

Nom de la limite de quota	Valeur par défaut	Région	Facturer un projet de ressource ou de consommateur	Description
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 requêtes par minute	Monde	Projet du client	Opérations de suggestions du générateur par type de modèle.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 requêtes par minute	Régional	Projet du client	Opérations de suggestions du générateur par type de modèle et par région.

Autres quotas d'API

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
`ConversationOperationsPerMinutePerProject`	300 requêtes/minute	Monde	Projet du client	Autres requêtes de conversation, à l'exception d'AnalyzeContent et de StreamingAnalyzeContent (par exemple, CreateConversation, CompleteConversation). Le quota est partagé entre Dialogflow et Agent Assist.
`MessagePollingOperationsPerMinutePerProject`	1 200 requêtes / min	Monde	Projet du client	Requêtes ListMessages. Le quota est partagé entre Dialogflow et Agent Assist.
`AnswerRecordOperationsPerMinutePerProject`	300 requêtes / min	Monde	Projet du client	Requêtes AnswerRecord.

Étapes suivantes

Pour savoir comment demander une augmentation de quota, consultez la page Quotas.
Une fois votre demande envoyée, il est possible que Google vous contacte pour obtenir des détails supplémentaires et vous informe de l'approbation ou du refus de votre demande.

Quotas Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.