Quotas

L'estimation précise des quotas est basée sur le nombre de requêtes par seconde (RPS) adressées à chaque API. Les sections suivantes décrivent les quotas des API utilisées avec chaque fonctionnalité d'Agent Assist.

Pour en savoir plus sur la demande d'augmentation de quota, consultez la page relative aux quotas. Après avoir envoyé votre demande, Google pourra vous contacter pour obtenir plus d'informations et vous indiquer si elle a été approuvée ou refusée.

Types de projets

Les tableaux de quotas suivants répertorient deux types de projets : client et ressource. Pour obtenir la définition de ces deux types de projets, consultez la documentation sur l'utilisation de plusieurs projets.

Transcription vocale

Cette fonctionnalité utilise l'intégration de la téléphonie ou de gRPC, qui ont chacune des quotas d'API différents.

Intégration de la téléphonie

Consultez les quotas Dialogflow pour les API utilisées avec l'intégration de la téléphonie.

Intégration de gRPC

Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
AnalyzeContentOperationsPerMinutePerProject 300 requêtes/minute Monde Projet client Requêtes AnalyzeContent/StreamingAnalyzeContent. Le quota est partagé entre Dialogflow et Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 requêtes simultanées Régional (le trafic mondial est comptabilisé dans la région us-central1) Projet client (projet de ressources pour l'intégration de la téléphonie SipRec) Sessions de streaming bidirectionnel simultanées par région

Transcription avec les modèles Chirp

Nom du quota Valeur par défaut Région Ressource facturée ou projet client Description
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 requêtes par minute Régional (le trafic mondial est comptabilisé dans la région us-central1) Projet client (projet de ressources pour l'intégration de la téléphonie SipRec) Nombre de nouvelles requêtes StreamingRecognize envoyées à STT V2 par type de ressource

Analyse des sentiments

Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
AnalyzeSentimentOperationsPerVersion 300 requêtes/minute Monde Projet client Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion 300 requêtes/minute Régional Projet client Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject 300 requêtes/minute Monde Projet client Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 requêtes/minute Régional Projet client Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.

Créer votre propre assistant

Cette fonctionnalité utilise les modèles d'IA suivants :

  • text-bison@001 (limite par défaut : 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
GeneratorSuggestionOperationsPerMinutePerModelType 10 requêtes/minute Monde Projet client Opérations de suggestion de générateur par type de modèle
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 requêtes/minute Régional Projet client Opérations de suggestion de générateur par type de modèle et par région

Réponse suggérée

Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
SmartReplyBaselineModelOperationsPerMinutePerProject 120 requêtes/minute Monde Projet client Obtenir des requêtes de modèle de référence de réponse suggérée via AnalyzeContent ou SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 requêtes/minute Monde Projet client Obtenir des requêtes de modèle de référence V2 de réponse suggérée via AnalyzeContent ou SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 requêtes/minute Régional Projet client Obtenir des requêtes de modèle de référence V2 de réponse suggérée via AnalyzeContent ou SuggestSmartReplies

Réponse suggérée générative

Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
SmartReplyBaselineModelOperationsPerMinutePerProject 120 requêtes/minute Monde Projet client Obtenir des requêtes de modèle de référence de réponse suggérée via AnalyzeContent ou SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 requêtes/minute Monde Projet client Obtenir des requêtes de modèle de référence V2 de réponse suggérée via AnalyzeContent ou SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 requêtes/minute Régional Projet client Obtenir des requêtes de modèle de référence V2 de réponse suggérée via AnalyzeContent ou SuggestSmartReplies

Synthèse

La synthèse générée par l'IA utilise les modèles suivants :

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

Le tableau suivant indique le type de quota et le modèle utilisé pour chaque version de la synthèse.


Version de la synthèse

Type de quota

Modèle de backend

Générateur 5.0

Basé sur le générateur

Gemini-2.5-flash pré-entraîné

Générateur 4.0

Basé sur le générateur

Gemini-2.0-flash-001 pré-entraîné

Générateur 3.1

Basé sur le générateur

Gemini-1.5-flash-001 ajusté avec Lora

Générateur 3.0

Basé sur le générateur

Gemini-1.0-pro-002 ajusté avec Lora

Générateur 2.1

Basé sur le générateur

Text-bison-32k@002 ajusté avec Lora

Générateur 2.0

Basé sur le générateur

Text-bison-32k@002 ajusté avec Lora

Générateur 1.0

Basé sur le générateur

Text-bison@001 ajusté avec Lora

Référence v2

Modèle de référence v2

text-bison

Référence v1

Non basé sur le générateur

Modèle LongT5

Personnalisé 2.0

Non basé sur le générateur

Modèle LongT5

Les types de quotas du tableau précédent sont reflétés dans la liste de quotas suivante pour les API utilisées avec la synthèse.


Type de quota

Nom de la limite de quota

Valeur par défaut

Région

Ressource facturée/Projet client

Description

Basé sur le générateur

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 requêtes/minute

Régional

Projet client

Opérations de suggestion de générateur par type de modèle et par région

Basé sur le générateur

GeneratorSuggestionOperationsPerMinutePerModelType

10 requêtes/minute

Monde

Projet client

Opérations de suggestion de générateur par type de modèle

Basé sur le générateur

SuggestConversationSummaryOperationsPerMinutePerProject

60 requêtes/minute

Monde

Projet de ressources

Suggérer des opérations de résumé de conversation

Non basé sur le générateur

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 à 2 requêtes/minute

Régional

Projet de ressources

Suggérer des opérations de résumé de conversation dans chaque région

Modèle de référence v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 requêtes/minute

Monde

Projet de ressources

Requêtes d'interrogation de référence V2 de suggestion de résumé de conversation

Modèle de référence v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 requêtes/minute

Régional

Projet de ressources

Requêtes d'interrogation de référence V2 de suggestion de résumé de conversation dans chaque région

Évaluation automatique de la synthèse

Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
ConcurrentSummarizationEvaluationsPerProject 1 requête par projet Projet client Requêtes d'évaluation automatique

Si vous avez besoin de quotas simultanés supplémentaires, envoyez une demande via la Google Cloud console. Cette fonctionnalité peut accepter jusqu'à quatre quotas simultanés par projet.

Assistance générative pour la base de connaissances

Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
SearchKnowledgeRequestsPerMinutePerProject 60 requêtes/minute Monde Projet client Requêtes SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 requêtes/minute Régional Projet client Requêtes SearchKnowledge par région

Assistance générative proactive pour la base de connaissances

Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 requêtes/minute Monde Projet de ressources Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 requêtes/minute Régional Projet de ressources Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist dans chaque région

Coach IA (LLM)

Cette fonctionnalité utilise le modèle d'IA agent-coaching-2.5.

Nom de la limite de quota Valeur par défaut Région Ressource facturée ou projet client Description
GeneratorSuggestionOperationsPerMinutePerModelType 60 requêtes par minute Monde Projet client Opérations de suggestion de générateur par type de modèle
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 requêtes par minute Régional Projet client Opérations de suggestion de générateur par type de modèle et par région

Autres quotas d'API

Nom de la limite de quota Valeur par défaut Région Ressource facturée/Projet client Description
ConversationOperationsPerMinutePerProject 300 requêtes/minute Monde Projet client Autres requêtes de conversation, à l'exception d'AnalyzeContent et de StreamingAnalyzeContent, par exemple CreateConversation, CompleteConversation. Le quota est partagé entre Dialogflow et Agent Assist.
MessagePollingOperationsPerMinutePerProject 1 200 requêtes / minute Monde Projet client Requêtes ListMessages. Le quota est partagé entre Dialogflow et Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 requêtes / minute Monde Projet client Requêtes AnswerRecord