Quotas

L'estimation précise des quotas est basée sur le nombre de requêtes par seconde (RPS) adressées à chaque API. Les sections suivantes décrivent les quotas des API utilisées avec chaque fonctionnalité d'Agent Assist.

Pour en savoir plus sur la demande d'augmentation de quota, consultez la page relative aux quotas. Après avoir envoyé votre demande, Google pourra vous contacter pour obtenir plus d'informations et vous indiquer si elle a été approuvée ou refusée.

Types de projets

Les tableaux de quotas suivants répertorient deux types de projets : client et ressource. Pour obtenir la définition de ces deux types de projets, consultez la documentation sur l'utilisation de plusieurs projets.

Transcription vocale

Cette fonctionnalité utilise l'intégration de la téléphonie ou de gRPC, qui ont chacune des quotas d'API différents.

Intégration de la téléphonie

Consultez les quotas Dialogflow pour les API utilisées avec l'intégration de la téléphonie.

Intégration de gRPC

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
AnalyzeContentOperationsPerMinutePerProject	300 requêtes/minute	Monde	Projet client	Requêtes AnalyzeContent/StreamingAnalyzeContent. Le quota est partagé entre Dialogflow et Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 requêtes simultanées	Régional (le trafic mondial est comptabilisé dans la région `us-central1`)	Projet client (projet de ressources pour l'intégration de la téléphonie SipRec)	Sessions de streaming bidirectionnel simultanées par région

Transcription avec les modèles Chirp

Nom du quota	Valeur par défaut	Région	Ressource facturée ou projet client	Description
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 requêtes par minute	Régional (le trafic mondial est comptabilisé dans la région `us-central1`)	Projet client (projet de ressources pour l'intégration de la téléphonie SipRec)	Nombre de nouvelles requêtes `StreamingRecognize` envoyées à STT V2 par type de ressource

Analyse des sentiments

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
AnalyzeSentimentOperationsPerVersion	300 requêtes/minute	Monde	Projet client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion	300 requêtes/minute	Régional	Projet client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject	300 requêtes/minute	Monde	Projet client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 requêtes/minute	Régional	Projet client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.

Créer votre propre assistant

Cette fonctionnalité utilise les modèles d'IA suivants :

text-bison@001 (limite par défaut : 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
GeneratorSuggestionOperationsPerMinutePerModelType	10 requêtes/minute	Monde	Projet client	Opérations de suggestion de générateur par type de modèle
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 requêtes/minute	Régional	Projet client	Opérations de suggestion de générateur par type de modèle et par région

Réponse suggérée

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
SmartReplyBaselineModelOperationsPerMinutePerProject	120 requêtes/minute	Monde	Projet client	Obtenir des requêtes de modèle de référence de réponse suggérée via `AnalyzeContent` ou `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 requêtes/minute	Monde	Projet client	Obtenir des requêtes de modèle de référence V2 de réponse suggérée via `AnalyzeContent` ou `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 requêtes/minute	Régional	Projet client	Obtenir des requêtes de modèle de référence V2 de réponse suggérée via `AnalyzeContent` ou `SuggestSmartReplies`

Réponse suggérée générative

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
SmartReplyBaselineModelOperationsPerMinutePerProject	120 requêtes/minute	Monde	Projet client	Obtenir des requêtes de modèle de référence de réponse suggérée via `AnalyzeContent` ou `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 requêtes/minute	Monde	Projet client	Obtenir des requêtes de modèle de référence V2 de réponse suggérée via `AnalyzeContent` ou `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 requêtes/minute	Régional	Projet client	Obtenir des requêtes de modèle de référence V2 de réponse suggérée via `AnalyzeContent` ou `SuggestSmartReplies`

Synthèse

La synthèse générée par l'IA utilise les modèles suivants :

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

Le tableau suivant indique le type de quota et le modèle utilisé pour chaque version de la synthèse.

Version de la synthèse	Type de quota	Modèle de backend
Générateur 5.0	Basé sur le générateur	Gemini-2.5-flash pré-entraîné
Générateur 4.0	Basé sur le générateur	Gemini-2.0-flash-001 pré-entraîné
Générateur 3.1	Basé sur le générateur	Gemini-1.5-flash-001 ajusté avec Lora
Générateur 3.0	Basé sur le générateur	Gemini-1.0-pro-002 ajusté avec Lora
Générateur 2.1	Basé sur le générateur	Text-bison-32k@002 ajusté avec Lora
Générateur 2.0	Basé sur le générateur	Text-bison-32k@002 ajusté avec Lora
Générateur 1.0	Basé sur le générateur	Text-bison@001 ajusté avec Lora
Référence v2	Modèle de référence v2	text-bison
Référence v1	Non basé sur le générateur	Modèle LongT5
Personnalisé 2.0	Non basé sur le générateur	Modèle LongT5

Les types de quotas du tableau précédent sont reflétés dans la liste de quotas suivante pour les API utilisées avec la synthèse.

Type de quota	Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
Basé sur le générateur	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 requêtes/minute	Régional	Projet client	Opérations de suggestion de générateur par type de modèle et par région
Basé sur le générateur	GeneratorSuggestionOperationsPerMinutePerModelType	10 requêtes/minute	Monde	Projet client	Opérations de suggestion de générateur par type de modèle
Basé sur le générateur	SuggestConversationSummaryOperationsPerMinutePerProject	60 requêtes/minute	Monde	Projet de ressources	Suggérer des opérations de résumé de conversation
Non basé sur le générateur	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0 à 2 requêtes/minute	Régional	Projet de ressources	Suggérer des opérations de résumé de conversation dans chaque région
Modèle de référence v2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 requêtes/minute	Monde	Projet de ressources	Requêtes d'interrogation de référence V2 de suggestion de résumé de conversation
Modèle de référence v2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 requêtes/minute	Régional	Projet de ressources	Requêtes d'interrogation de référence V2 de suggestion de résumé de conversation dans chaque région

Évaluation automatique de la synthèse

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
ConcurrentSummarizationEvaluationsPerProject	1 requête par projet	Projet client	Requêtes d'évaluation automatique

Si vous avez besoin de quotas simultanés supplémentaires, envoyez une demande via la Google Cloud console. Cette fonctionnalité peut accepter jusqu'à quatre quotas simultanés par projet.

Assistance générative pour la base de connaissances

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
SearchKnowledgeRequestsPerMinutePerProject	60 requêtes/minute	Monde	Projet client	Requêtes SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion	30 requêtes/minute	Régional	Projet client	Requêtes SearchKnowledge par région

Assistance générative proactive pour la base de connaissances

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 requêtes/minute	Monde	Projet de ressources	Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 requêtes/minute	Régional	Projet de ressources	Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist dans chaque région

Coach IA (LLM)

Cette fonctionnalité utilise le modèle d'IA agent-coaching-2.5.

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée ou projet client	Description
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 requêtes par minute	Monde	Projet client	Opérations de suggestion de générateur par type de modèle
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 requêtes par minute	Régional	Projet client	Opérations de suggestion de générateur par type de modèle et par région

Autres quotas d'API

Nom de la limite de quota	Valeur par défaut	Région	Ressource facturée/Projet client	Description
ConversationOperationsPerMinutePerProject	300 requêtes/minute	Monde	Projet client	Autres requêtes de conversation, à l'exception d'AnalyzeContent et de StreamingAnalyzeContent, par exemple CreateConversation, CompleteConversation. Le quota est partagé entre Dialogflow et Agent Assist.
MessagePollingOperationsPerMinutePerProject	1 200 requêtes / minute	Monde	Projet client	Requêtes ListMessages. Le quota est partagé entre Dialogflow et Agent Assist.
AnswerRecordOperationsPerMinutePerProject	300 requêtes / minute	Monde	Projet client	Requêtes AnswerRecord

Quotas Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.