Kontingente

Eine genaue Kontingentschätzung basiert auf der Anzahl Ihrer Abfragen pro Sekunde (Queries per Second, QPS) für jede API. In den folgenden Abschnitten werden die Kontingente für APIs beschrieben, die mit den einzelnen Agent Assist-Funktionen verwendet werden.

Weitere Informationen zum Anfordern einer Kontingenterhöhung finden Sie auf der Seite zu den Kontingenten. Wenn Sie Ihren Antrag eingereicht haben, bittet Google Sie möglicherweise um weitere Informationen und teilt Ihnen mit, ob Ihr Antrag genehmigt oder abgelehnt wurde.

Projekttypen

In den folgenden Kontingenttabellen werden zwei Arten von Projekten aufgeführt: Nutzer- und Ressourcenprojekte. Definitionen dieser beiden Projekttypen finden Sie in der Dokumentation zur Verwendung mehrerer Projekte.

Sprachtranskription

Für diese Funktion wird entweder die Telefonie- oder die gRPC-Integration verwendet, die jeweils unterschiedliche API-Kontingente haben.

Telefonieintegration

Informationen zu den Kontingenten für die APIs, die für die Telefonieintegration verwendet werden, finden Sie unter Dialogflow-Kontingente.

gRPC-Integration

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
AnalyzeContentOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt AnalyzeContent-/StreamingAnalyzeContent-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist aufgeteilt.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 gleichzeitige Anfragen Regional (globaler Traffic wird in der Region us-central1 gezählt) Nutzerprojekt (Ressourcenprojekt für die SipRec-Integration für Telefonie) Gleichzeitige bidirektionale Streaming-Sitzungen pro Region

Sentimentanalyse

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
AnalyzeSentimentOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt Anfragen zur Sentimentanalyse über AnalyzeContent oder StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 Anfragen/Min. Global Nutzerprojekt AnalyzeSentiment- und StreamingAnalyzeSentiment-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist aufgeteilt.

Eigene Assistenten erstellen

Für diese Funktion werden die folgenden KI-Modelle verwendet:

  • text-bison@001 (Standardlimit 0)
  • (text-bison@002)
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
GeneratorSuggestionOperationsPerMinutePerModelType 10 Anfragen/Min. Global Nutzerprojekt Vorgänge für Generatorvorschläge nach Modelltyp
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 Anfragen/Min. Regional Nutzerprojekt Vorgänge für Generatorvorschläge nach Modelltyp und Region

Zusammenfassung

Für die KI-generierte Zusammenfassung werden die folgenden Modelle verwendet:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

In der folgenden Tabelle sehen Sie den Kontingenttyp und das Modell, das für die einzelnen Versionen der Zusammenfassung verwendet wird.


Version der Zusammenfassung

Kontingenttyp

Backend-Modell

Generator 5.0

Generatorbasiert

Vortrainiertes Gemini 2.5 Flash

Generator 4.0

Generatorbasiert

Vortrainiertes Gemini‑2.0-Flash-001

Generator 3.1

Generatorbasiert

Lora-tuned gemini-1.5-flash-001

Generator 3.0

Generatorbasiert

Lora-tuned gemini-1.0-pro-002

Generator 2.1

Generatorbasiert

Lora-tuned text-bison-32k@002

Generator 2.0

Generatorbasiert

Lora-tuned text-bison-32k@002

Generator 1.0

Generatorbasiert

Lora-tuned text-bison@001

Baseline v2

Baseline v2-Modell

text-bison

Baseline V1

Nicht auf Generator basierend

LongT5-Modell

Benutzerdefiniert 2.0

Nicht auf Generator basierend

LongT5-Modell

Die Kontingenttypen in der vorherigen Tabelle werden in der folgenden Kontingentliste für APIs, die für die Zusammenfassung verwendet werden, berücksichtigt.


Kontingenttyp

Name des Kontingentlimits

Standardwert

Region

Abrechnungsressource/Verbraucherprojekt

Beschreibung

Generatorbasiert

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 Anfragen/Min.

Regional

Nutzerprojekt

Vorgänge für Generatorvorschläge nach Modelltyp und Region

Generatorbasiert

GeneratorSuggestionOperationsPerMinutePerModelType

10 Anfragen/Min.

Global

Nutzerprojekt

Vorgänge für Generatorvorschläge nach Modelltyp

Generatorbasiert

SuggestConversationSummaryOperationsPerMinutePerProject

60 Anfragen/Min.

Global

Ressourcenprojekt

Vorgeschlagene Zusammenfassungen von Unterhaltungen

Nicht auf Generator basierend

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0–2 Anfragen/Min.

Regional

Ressourcenprojekt

Vorgänge zum Zusammenfassen von Unterhaltungen in jeder Region vorschlagen

Baseline v2-Modell

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 Anfragen/Min.

Global

Ressourcenprojekt

Baseline-Polling-Anfragen für Zusammenfassungsvorschläge für Unterhaltungen V2

Baseline v2-Modell

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 Anfragen/Min.

Regional

Ressourcenprojekt

V2-Baseline-Umfrageanfragen für die Zusammenfassung von Unterhaltungen in jeder Region

Automatische Bewertung der Zusammenfassung

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
ConcurrentSummarizationEvaluationsPerProject 1 Anfrage pro Projekt Nutzerprojekt Anfragen zur automatischen Bewertung

Wenn Sie zusätzliche Kontingente für gleichzeitige Vorgänge benötigen, stellen Sie einen Antrag über die Google Cloud Console. Diese Funktion kann bis zu vier gleichzeitige Kontingente pro Projekt unterstützen.

Generative Knowledge Assist

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
SearchKnowledgeRequestsPerMinutePerProject 60 Anfragen/Min. Global Nutzerprojekt SearchKnowledge-Anfragen
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 Anfragen/Min. Regional Nutzerprojekt SearchKnowledge-Anfragen pro Region

Proaktive generative Knowledge Assist-Funktion

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 Anfragen/Min. Global Ressourcenprojekt KnowledgeAssist-Anfragen über AnalyzeContent oder SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 Anfragen/Min. Regional Ressourcenprojekt KnowledgeAssist-Anfragen über „AnalyzeContent“ oder „SuggestKnowledgeAssist“ in jeder Region

KI-Coach (LLM)

Diese Funktion verwendet das KI-Modell „agent-coaching-2.5“.

Name des Kontingentlimits Standardwert Region Abrechnungsressource oder Nutzerprojekt Beschreibung
GeneratorSuggestionOperationsPerMinutePerModelType 60 Anfragen pro Minute Global Nutzerprojekt Vorgänge für Generatorvorschläge nach Modelltyp
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 Anfragen pro Minute Regional Nutzerprojekt Vorgänge für Generatorvorschläge nach Modelltyp und Region

Weitere API-Kontingente

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
ConversationOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt Andere Unterhaltungsanfragen als AnalyzeContent und StreamingAnalyzeContent, z. B. CreateConversation und CompleteConversation. Das Kontingent wird zwischen Dialogflow und Agent Assist aufgeteilt.
MessagePollingOperationsPerMinutePerProject 1.200 Anfragen / Min. Global Nutzerprojekt ListMessages-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist aufgeteilt.
AnswerRecordOperationsPerMinutePerProject 300 Anfragen / Min. Global Nutzerprojekt AnswerRecord-Anfragen