Eine genaue Kontingentschätzung basiert auf der Anzahl Ihrer Abfragen pro Sekunde (Queries per Second, QPS) an jede API. In den folgenden Abschnitten werden die Kontingente für APIs beschrieben, die mit den einzelnen Agent Assist-Funktionen verwendet werden.
Weitere Informationen zum Anfordern einer Kontingenterhöhung finden Sie auf der Seite zu den Kontingenten. Nachdem Sie Ihre Anfrage gesendet haben, kontaktiert Google Sie möglicherweise, um weitere Informationen zu erhalten. Sie werden benachrichtigt, wenn Ihre Anfrage genehmigt oder abgelehnt wurde.
Projekttypen
In den folgenden Kontingenttabellen sind zwei Arten von Projekten aufgeführt: Nutzerprojekte und Ressourcenprojekte. Definitionen dieser beiden Projekttypen finden Sie in der Dokumentation zur Verwendung mehrerer Projekte für Definitionen.
Sprachtranskription
Diese Funktion verwendet entweder die Telefonie- oder die gRPC-Integration, die jeweils unterschiedliche API-Kontingente haben.
Telefonieintegration
Informationen zu den Dialogflow-Kontingenten für die APIs, die mit der Telefonieintegration verwendet werden, finden Sie unter Dialogflow-Kontingente.
gRPC-Integration
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 Anfragen/Min. | Global | Nutzerprojekt | Anfragen vom Typ „AnalyzeContent“/„StreamingAnalyzeContent“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 gleichzeitige Anfragen | Regional (globaler Traffic wird in der us-central1 Region gezählt) |
Nutzerprojekt (Ressourcenprojekt für die Telefonieintegration von SipRec) | Gleichzeitige bidirektionale Streaming-Sitzungen pro Region |
Transkription mit Chirp-Modellen
| Kontingentname | Standardwert | Region | Abrechnungsressource oder Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 Anfragen pro Minute | Regional (globaler Traffic wird in der us-central1 Region gezählt) |
Nutzerprojekt (Ressourcenprojekt für die Telefonieintegration von SipRec) | Anzahl der neuen StreamingRecognize-Anfragen, die pro Ressourcentyp an STT V2 gesendet werden |
Sentimentanalyse
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| AnalyzeSentimentOperationsPerVersion | 300 Anfragen/Min. | Global | Nutzerprojekt | Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“. |
| AnalyzeSentimentOperationsPerVersionPerRegion | 300 Anfragen/Min. | Regional | Nutzerprojekt | Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“. |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 Anfragen/Min. | Global | Nutzerprojekt | Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“. |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 Anfragen/Min. | Regional | Nutzerprojekt | Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“. |
Eigene Assistenz erstellen
Diese Funktion verwendet die folgenden KI-Modelle:
- text-bison@001 (Standardlimit: 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 Anfragen/Min. | Global | Nutzerprojekt | Generatorvorschlagsoperationen pro Modelltyp |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 Anfragen/Min. | Regional | Nutzerprojekt | Generatorvorschlagsoperationen pro Modelltyp und Region |
Intelligente Antwort
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 Anfragen/Min. | Global | Nutzerprojekt | Anfragen zum intelligenten Antwort-Basismodell über AnalyzeContent oder SuggestSmartReplies abrufen |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 Anfragen/Min. | Global | Nutzerprojekt | Anfragen zum intelligenten Antwort-Basismodell V2 über AnalyzeContent oder SuggestSmartReplies abrufen |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 Anfragen/Min. | Regional | Nutzerprojekt | Anfragen zum intelligenten Antwort-Basismodell V2 über AnalyzeContent oder SuggestSmartReplies abrufen |
Generative intelligente Antwort
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 Anfragen/Min. | Global | Nutzerprojekt | Anfragen zum intelligenten Antwort-Basismodell über AnalyzeContent oder SuggestSmartReplies abrufen |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 Anfragen/Min. | Global | Nutzerprojekt | Anfragen zum intelligenten Antwort-Basismodell V2 über AnalyzeContent oder SuggestSmartReplies abrufen |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 Anfragen/Min. | Regional | Nutzerprojekt | Anfragen zum intelligenten Antwort-Basismodell V2 über AnalyzeContent oder SuggestSmartReplies abrufen |
Zusammenfassung
Für die KI-generierte Zusammenfassung werden die folgenden Modelle verwendet:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
In der folgenden Tabelle sind der Kontingenttyp und das Modell für jede Version der Zusammenfassung aufgeführt.
Version der Zusammenfassung |
Kontingenttyp |
Back-End-Modell |
|---|---|---|
Generator 5.0 |
Generatorbasiert |
Vortrainiertes Gemini-2.5-flash |
Generator 4.0 |
Generatorbasiert |
Vortrainiertes Gemini-2.0-flash-001 |
Generator 3.1 |
Generatorbasiert |
Lora-optimiertes Gemini-1.5-flash-001 |
Generator 3.0 |
Generatorbasiert |
Lora-optimiertes Gemini-1.0-pro-002 |
Generator 2.1 |
Generatorbasiert |
Lora-optimiertes text-bison-32k@002 |
Generator 2.0 |
Generatorbasiert |
Lora-optimiertes text-bison-32k@002 |
Generator 1.0 |
Generatorbasiert |
Lora-optimiertes text-bison@001 |
Baseline V2 |
Basismodell V2 |
text-bison |
Baseline V1 |
Nicht generatorbasiert |
LongT5-Modell |
Benutzerdefiniert 2.0 |
Nicht generatorbasiert |
LongT5-Modell |
Die Kontingenttypen in der vorherigen Tabelle werden in der folgenden Kontingentliste für APIs verwendet, die mit der Zusammenfassung verwendet werden.
Kontingenttyp |
Name des Kontingentlimits |
Standardwert |
Region |
Abrechnungsressource/Nutzerprojekt |
Beschreibung |
|---|---|---|---|---|---|
Generatorbasiert |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 Anfragen/Min. |
Regional |
Nutzerprojekt |
Generatorvorschlagsoperationen pro Modelltyp und Region |
Generatorbasiert |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 Anfragen/Min. |
Global |
Nutzerprojekt |
Generatorvorschlagsoperationen pro Modelltyp |
Generatorbasiert |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 Anfragen/Min. |
Global |
Ressourcenprojekt |
Operationen zum Vorschlagen von Unterhaltungszusammenfassungen |
Nicht generatorbasiert |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0–2 Anfragen/Min. |
Regional |
Ressourcenprojekt |
Operationen zum Vorschlagen von Unterhaltungszusammenfassungen in jeder Region |
Basismodell V2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 Anfragen/Min. |
Global |
Ressourcenprojekt |
Polling-Anfragen für Vorschläge für Unterhaltungszusammenfassungen V2 |
Basismodell V2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 Anfragen/Min. |
Regional |
Ressourcenprojekt |
Polling-Anfragen für Vorschläge für Unterhaltungszusammenfassungen V2 in jeder Region |
Automatische Bewertung der Zusammenfassung
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 Anfrage pro Projekt | Nutzerprojekt | Anfragen zur automatischen Bewertung |
Wenn Sie zusätzliche gleichzeitige Kontingente benötigen, stellen Sie über die Google Cloud Console eine Anfrage. Diese Funktion kann bis zu vier gleichzeitige Kontingente pro Projekt unterstützen.
Generative Knowledge Assist-Funktion
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 Anfragen/Min. | Global | Nutzerprojekt | SearchKnowledge-Anfragen |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 Anfragen/Min. | Regional | Nutzerprojekt | SearchKnowledge-Anfragen in jeder Region |
Proaktive generative Knowledge Assist-Funktion
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 Anfragen/Min. | Global | Ressourcenprojekt | KnowledgeAssist-Anfragen über „AnalyzeContent“ oder „SuggestKnowledgeAssist“ |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 Anfragen/Min. | Regional | Ressourcenprojekt | KnowledgeAssist-Anfragen über „AnalyzeContent“ oder „SuggestKnowledgeAssist“ in jeder Region |
KI-Coach (LLM)
Diese Funktion verwendet das KI-Modell agent-coaching-2.5.
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource oder Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 Anfragen pro Minute | Global | Nutzerprojekt | Generatorvorschlagsoperationen pro Modelltyp |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 Anfragen pro Minute | Regional | Nutzerprojekt | Generatorvorschlagsoperationen pro Modelltyp und Region |
Andere API-Kontingente
| Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Nutzerprojekt | Beschreibung |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 Anfragen/Min. | Global | Nutzerprojekt | Andere Unterhaltungsanfragen als „AnalyzeContent“ und „StreamingAnalyzeContent“, z. B. „CreateConversation“ und „CompleteConversation“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt. |
| MessagePollingOperationsPerMinutePerProject | 1.200 Anfragen / Min. | Global | Nutzerprojekt | Anfragen vom Typ „ListMessages“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt. |
| AnswerRecordOperationsPerMinutePerProject | 300 Anfragen / Min. | Global | Nutzerprojekt | Anfragen vom Typ „AnswerRecord“ |