Kontingente

Eine genaue Kontingentschätzung basiert auf der Anzahl Ihrer Abfragen pro Sekunde (Queries per Second, QPS) an jede API. In den folgenden Abschnitten werden die Kontingente für APIs beschrieben, die mit den einzelnen Agent Assist-Funktionen verwendet werden.

Weitere Informationen zum Anfordern einer Kontingenterhöhung finden Sie auf der Seite zu den Kontingenten. Nachdem Sie Ihre Anfrage gesendet haben, kontaktiert Google Sie möglicherweise, um weitere Informationen zu erhalten. Sie werden benachrichtigt, wenn Ihre Anfrage genehmigt oder abgelehnt wurde.

Projekttypen

In den folgenden Kontingenttabellen sind zwei Arten von Projekten aufgeführt: Nutzerprojekte und Ressourcenprojekte. Definitionen dieser beiden Projekttypen finden Sie in der Dokumentation zur Verwendung mehrerer Projekte für Definitionen.

Sprachtranskription

Diese Funktion verwendet entweder die Telefonie- oder die gRPC-Integration, die jeweils unterschiedliche API-Kontingente haben.

Telefonieintegration

Informationen zu den Dialogflow-Kontingenten für die APIs, die mit der Telefonieintegration verwendet werden, finden Sie unter Dialogflow-Kontingente.

gRPC-Integration

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
AnalyzeContentOperationsPerMinutePerProject	300 Anfragen/Min.	Global	Nutzerprojekt	Anfragen vom Typ „AnalyzeContent“/„StreamingAnalyzeContent“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 gleichzeitige Anfragen	Regional (globaler Traffic wird in der `us-central1` Region gezählt)	Nutzerprojekt (Ressourcenprojekt für die Telefonieintegration von SipRec)	Gleichzeitige bidirektionale Streaming-Sitzungen pro Region

Transkription mit Chirp-Modellen

Kontingentname	Standardwert	Region	Abrechnungsressource oder Nutzerprojekt	Beschreibung
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 Anfragen pro Minute	Regional (globaler Traffic wird in der `us-central1` Region gezählt)	Nutzerprojekt (Ressourcenprojekt für die Telefonieintegration von SipRec)	Anzahl der neuen `StreamingRecognize`-Anfragen, die pro Ressourcentyp an STT V2 gesendet werden

Sentimentanalyse

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
AnalyzeSentimentOperationsPerVersion	300 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“.
AnalyzeSentimentOperationsPerVersionPerRegion	300 Anfragen/Min.	Regional	Nutzerprojekt	Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“.
AnalyzeSentimentOperationsPerMinutePerProject	300 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 Anfragen/Min.	Regional	Nutzerprojekt	Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“.

Eigene Assistenz erstellen

Diese Funktion verwendet die folgenden KI-Modelle:

text-bison@001 (Standardlimit: 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
GeneratorSuggestionOperationsPerMinutePerModelType	10 Anfragen/Min.	Global	Nutzerprojekt	Generatorvorschlagsoperationen pro Modelltyp
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 Anfragen/Min.	Regional	Nutzerprojekt	Generatorvorschlagsoperationen pro Modelltyp und Region

Intelligente Antwort

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
SmartReplyBaselineModelOperationsPerMinutePerProject	120 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zum intelligenten Antwort-Basismodell über `AnalyzeContent` oder `SuggestSmartReplies` abrufen
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zum intelligenten Antwort-Basismodell V2 über `AnalyzeContent` oder `SuggestSmartReplies` abrufen
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 Anfragen/Min.	Regional	Nutzerprojekt	Anfragen zum intelligenten Antwort-Basismodell V2 über `AnalyzeContent` oder `SuggestSmartReplies` abrufen

Generative intelligente Antwort

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
SmartReplyBaselineModelOperationsPerMinutePerProject	120 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zum intelligenten Antwort-Basismodell über `AnalyzeContent` oder `SuggestSmartReplies` abrufen
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zum intelligenten Antwort-Basismodell V2 über `AnalyzeContent` oder `SuggestSmartReplies` abrufen
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 Anfragen/Min.	Regional	Nutzerprojekt	Anfragen zum intelligenten Antwort-Basismodell V2 über `AnalyzeContent` oder `SuggestSmartReplies` abrufen

Zusammenfassung

Für die KI-generierte Zusammenfassung werden die folgenden Modelle verwendet:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

In der folgenden Tabelle sind der Kontingenttyp und das Modell für jede Version der Zusammenfassung aufgeführt.

Version der Zusammenfassung	Kontingenttyp	Back-End-Modell
Generator 5.0	Generatorbasiert	Vortrainiertes Gemini-2.5-flash
Generator 4.0	Generatorbasiert	Vortrainiertes Gemini-2.0-flash-001
Generator 3.1	Generatorbasiert	Lora-optimiertes Gemini-1.5-flash-001
Generator 3.0	Generatorbasiert	Lora-optimiertes Gemini-1.0-pro-002
Generator 2.1	Generatorbasiert	Lora-optimiertes text-bison-32k@002
Generator 2.0	Generatorbasiert	Lora-optimiertes text-bison-32k@002
Generator 1.0	Generatorbasiert	Lora-optimiertes text-bison@001
Baseline V2	Basismodell V2	text-bison
Baseline V1	Nicht generatorbasiert	LongT5-Modell
Benutzerdefiniert 2.0	Nicht generatorbasiert	LongT5-Modell

Die Kontingenttypen in der vorherigen Tabelle werden in der folgenden Kontingentliste für APIs verwendet, die mit der Zusammenfassung verwendet werden.

Kontingenttyp	Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
Generatorbasiert	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 Anfragen/Min.	Regional	Nutzerprojekt	Generatorvorschlagsoperationen pro Modelltyp und Region
Generatorbasiert	GeneratorSuggestionOperationsPerMinutePerModelType	10 Anfragen/Min.	Global	Nutzerprojekt	Generatorvorschlagsoperationen pro Modelltyp
Generatorbasiert	SuggestConversationSummaryOperationsPerMinutePerProject	60 Anfragen/Min.	Global	Ressourcenprojekt	Operationen zum Vorschlagen von Unterhaltungszusammenfassungen
Nicht generatorbasiert	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0–2 Anfragen/Min.	Regional	Ressourcenprojekt	Operationen zum Vorschlagen von Unterhaltungszusammenfassungen in jeder Region
Basismodell V2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 Anfragen/Min.	Global	Ressourcenprojekt	Polling-Anfragen für Vorschläge für Unterhaltungszusammenfassungen V2
Basismodell V2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 Anfragen/Min.	Regional	Ressourcenprojekt	Polling-Anfragen für Vorschläge für Unterhaltungszusammenfassungen V2 in jeder Region

Automatische Bewertung der Zusammenfassung

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
ConcurrentSummarizationEvaluationsPerProject	1 Anfrage pro Projekt	Nutzerprojekt	Anfragen zur automatischen Bewertung

Wenn Sie zusätzliche gleichzeitige Kontingente benötigen, stellen Sie über die Google Cloud Console eine Anfrage. Diese Funktion kann bis zu vier gleichzeitige Kontingente pro Projekt unterstützen.

Generative Knowledge Assist-Funktion

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
SearchKnowledgeRequestsPerMinutePerProject	60 Anfragen/Min.	Global	Nutzerprojekt	SearchKnowledge-Anfragen
SearchKnowledgeRequestsPerMinutePerProjectPerRegion	30 Anfragen/Min.	Regional	Nutzerprojekt	SearchKnowledge-Anfragen in jeder Region

Proaktive generative Knowledge Assist-Funktion

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 Anfragen/Min.	Global	Ressourcenprojekt	KnowledgeAssist-Anfragen über „AnalyzeContent“ oder „SuggestKnowledgeAssist“
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 Anfragen/Min.	Regional	Ressourcenprojekt	KnowledgeAssist-Anfragen über „AnalyzeContent“ oder „SuggestKnowledgeAssist“ in jeder Region

KI-Coach (LLM)

Diese Funktion verwendet das KI-Modell agent-coaching-2.5.

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource oder Nutzerprojekt	Beschreibung
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 Anfragen pro Minute	Global	Nutzerprojekt	Generatorvorschlagsoperationen pro Modelltyp
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 Anfragen pro Minute	Regional	Nutzerprojekt	Generatorvorschlagsoperationen pro Modelltyp und Region

Andere API-Kontingente

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Nutzerprojekt	Beschreibung
ConversationOperationsPerMinutePerProject	300 Anfragen/Min.	Global	Nutzerprojekt	Andere Unterhaltungsanfragen als „AnalyzeContent“ und „StreamingAnalyzeContent“, z. B. „CreateConversation“ und „CompleteConversation“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
MessagePollingOperationsPerMinutePerProject	1.200 Anfragen / Min.	Global	Nutzerprojekt	Anfragen vom Typ „ListMessages“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
AnswerRecordOperationsPerMinutePerProject	300 Anfragen / Min.	Global	Nutzerprojekt	Anfragen vom Typ „AnswerRecord“

Kontingente Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.