Kontingente

Eine genaue Kontingentschätzung basiert auf der Anzahl Ihrer Abfragen pro Sekunde (Queries per Second, QPS) an jede API. In den folgenden Abschnitten werden die Kontingente für APIs beschrieben, die mit den einzelnen Agent Assist-Funktionen verwendet werden.

Weitere Informationen zum Anfordern einer Kontingenterhöhung finden Sie auf der Seite zu den Kontingenten. Nachdem Sie Ihre Anfrage gesendet haben, kontaktiert Google Sie möglicherweise, um weitere Informationen zu erhalten. Sie werden benachrichtigt, wenn Ihre Anfrage genehmigt oder abgelehnt wurde.

Projekttypen

In den folgenden Kontingenttabellen sind zwei Arten von Projekten aufgeführt: Nutzerprojekte und Ressourcenprojekte. Definitionen dieser beiden Projekttypen finden Sie in der Dokumentation zur Verwendung mehrerer Projekte für Definitionen.

Sprachtranskription

Diese Funktion verwendet entweder die Telefonie- oder die gRPC-Integration, die jeweils unterschiedliche API-Kontingente haben.

Telefonieintegration

Informationen zu den Dialogflow-Kontingenten für die APIs, die mit der Telefonieintegration verwendet werden, finden Sie unter Dialogflow-Kontingente.

gRPC-Integration

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
AnalyzeContentOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt Anfragen vom Typ „AnalyzeContent“/„StreamingAnalyzeContent“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 gleichzeitige Anfragen Regional (globaler Traffic wird in der us-central1 Region gezählt) Nutzerprojekt (Ressourcenprojekt für die Telefonieintegration von SipRec) Gleichzeitige bidirektionale Streaming-Sitzungen pro Region

Transkription mit Chirp-Modellen

Kontingentname Standardwert Region Abrechnungsressource oder Nutzerprojekt Beschreibung
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 Anfragen pro Minute Regional (globaler Traffic wird in der us-central1 Region gezählt) Nutzerprojekt (Ressourcenprojekt für die Telefonieintegration von SipRec) Anzahl der neuen StreamingRecognize-Anfragen, die pro Ressourcentyp an STT V2 gesendet werden

Sentimentanalyse

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
AnalyzeSentimentOperationsPerVersion 300 Anfragen/Min. Global Nutzerprojekt Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“.
AnalyzeSentimentOperationsPerVersionPerRegion 300 Anfragen/Min. Regional Nutzerprojekt Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“.
AnalyzeSentimentOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 Anfragen/Min. Regional Nutzerprojekt Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“.

Eigene Assistenz erstellen

Diese Funktion verwendet die folgenden KI-Modelle:

  • text-bison@001 (Standardlimit: 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
GeneratorSuggestionOperationsPerMinutePerModelType 10 Anfragen/Min. Global Nutzerprojekt Generatorvorschlagsoperationen pro Modelltyp
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 Anfragen/Min. Regional Nutzerprojekt Generatorvorschlagsoperationen pro Modelltyp und Region

Intelligente Antwort

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
SmartReplyBaselineModelOperationsPerMinutePerProject 120 Anfragen/Min. Global Nutzerprojekt Anfragen zum intelligenten Antwort-Basismodell über AnalyzeContent oder SuggestSmartReplies abrufen
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 Anfragen/Min. Global Nutzerprojekt Anfragen zum intelligenten Antwort-Basismodell V2 über AnalyzeContent oder SuggestSmartReplies abrufen
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 Anfragen/Min. Regional Nutzerprojekt Anfragen zum intelligenten Antwort-Basismodell V2 über AnalyzeContent oder SuggestSmartReplies abrufen

Generative intelligente Antwort

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
SmartReplyBaselineModelOperationsPerMinutePerProject 120 Anfragen/Min. Global Nutzerprojekt Anfragen zum intelligenten Antwort-Basismodell über AnalyzeContent oder SuggestSmartReplies abrufen
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 Anfragen/Min. Global Nutzerprojekt Anfragen zum intelligenten Antwort-Basismodell V2 über AnalyzeContent oder SuggestSmartReplies abrufen
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 Anfragen/Min. Regional Nutzerprojekt Anfragen zum intelligenten Antwort-Basismodell V2 über AnalyzeContent oder SuggestSmartReplies abrufen

Zusammenfassung

Für die KI-generierte Zusammenfassung werden die folgenden Modelle verwendet:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

In der folgenden Tabelle sind der Kontingenttyp und das Modell für jede Version der Zusammenfassung aufgeführt.


Version der Zusammenfassung

Kontingenttyp

Back-End-Modell

Generator 5.0

Generatorbasiert

Vortrainiertes Gemini-2.5-flash

Generator 4.0

Generatorbasiert

Vortrainiertes Gemini-2.0-flash-001

Generator 3.1

Generatorbasiert

Lora-optimiertes Gemini-1.5-flash-001

Generator 3.0

Generatorbasiert

Lora-optimiertes Gemini-1.0-pro-002

Generator 2.1

Generatorbasiert

Lora-optimiertes text-bison-32k@002

Generator 2.0

Generatorbasiert

Lora-optimiertes text-bison-32k@002

Generator 1.0

Generatorbasiert

Lora-optimiertes text-bison@001

Baseline V2

Basismodell V2

text-bison

Baseline V1

Nicht generatorbasiert

LongT5-Modell

Benutzerdefiniert 2.0

Nicht generatorbasiert

LongT5-Modell

Die Kontingenttypen in der vorherigen Tabelle werden in der folgenden Kontingentliste für APIs verwendet, die mit der Zusammenfassung verwendet werden.


Kontingenttyp

Name des Kontingentlimits

Standardwert

Region

Abrechnungsressource/Nutzerprojekt

Beschreibung

Generatorbasiert

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 Anfragen/Min.

Regional

Nutzerprojekt

Generatorvorschlagsoperationen pro Modelltyp und Region

Generatorbasiert

GeneratorSuggestionOperationsPerMinutePerModelType

10 Anfragen/Min.

Global

Nutzerprojekt

Generatorvorschlagsoperationen pro Modelltyp

Generatorbasiert

SuggestConversationSummaryOperationsPerMinutePerProject

60 Anfragen/Min.

Global

Ressourcenprojekt

Operationen zum Vorschlagen von Unterhaltungszusammenfassungen

Nicht generatorbasiert

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0–2 Anfragen/Min.

Regional

Ressourcenprojekt

Operationen zum Vorschlagen von Unterhaltungszusammenfassungen in jeder Region

Basismodell V2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 Anfragen/Min.

Global

Ressourcenprojekt

Polling-Anfragen für Vorschläge für Unterhaltungszusammenfassungen V2

Basismodell V2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 Anfragen/Min.

Regional

Ressourcenprojekt

Polling-Anfragen für Vorschläge für Unterhaltungszusammenfassungen V2 in jeder Region

Automatische Bewertung der Zusammenfassung

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
ConcurrentSummarizationEvaluationsPerProject 1 Anfrage pro Projekt Nutzerprojekt Anfragen zur automatischen Bewertung

Wenn Sie zusätzliche gleichzeitige Kontingente benötigen, stellen Sie über die Google Cloud Console eine Anfrage. Diese Funktion kann bis zu vier gleichzeitige Kontingente pro Projekt unterstützen.

Generative Knowledge Assist-Funktion

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
SearchKnowledgeRequestsPerMinutePerProject 60 Anfragen/Min. Global Nutzerprojekt SearchKnowledge-Anfragen
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 Anfragen/Min. Regional Nutzerprojekt SearchKnowledge-Anfragen in jeder Region

Proaktive generative Knowledge Assist-Funktion

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 Anfragen/Min. Global Ressourcenprojekt KnowledgeAssist-Anfragen über „AnalyzeContent“ oder „SuggestKnowledgeAssist“
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 Anfragen/Min. Regional Ressourcenprojekt KnowledgeAssist-Anfragen über „AnalyzeContent“ oder „SuggestKnowledgeAssist“ in jeder Region

KI-Coach (LLM)

Diese Funktion verwendet das KI-Modell agent-coaching-2.5.

Name des Kontingentlimits Standardwert Region Abrechnungsressource oder Nutzerprojekt Beschreibung
GeneratorSuggestionOperationsPerMinutePerModelType 60 Anfragen pro Minute Global Nutzerprojekt Generatorvorschlagsoperationen pro Modelltyp
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 Anfragen pro Minute Regional Nutzerprojekt Generatorvorschlagsoperationen pro Modelltyp und Region

Andere API-Kontingente

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Nutzerprojekt Beschreibung
ConversationOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt Andere Unterhaltungsanfragen als „AnalyzeContent“ und „StreamingAnalyzeContent“, z. B. „CreateConversation“ und „CompleteConversation“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
MessagePollingOperationsPerMinutePerProject 1.200 Anfragen / Min. Global Nutzerprojekt Anfragen vom Typ „ListMessages“. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
AnswerRecordOperationsPerMinutePerProject 300 Anfragen / Min. Global Nutzerprojekt Anfragen vom Typ „AnswerRecord“