Quote

La stima accurata della quota si basa sul numero di query al secondo (QPS) per ogni API. Le sezioni seguenti descrivono le quote per le API utilizzate con ogni funzionalità di Agent Assist.

Per ulteriori informazioni su come richiedere un aumento della quota, consulta la pagina delle quote. Dopo aver inviato la richiesta, Google potrebbe contattarti per ulteriori informazioni e comunicarti quando la richiesta viene approvata o rifiutata.

Tipi di progetto

Le tabelle delle quote seguenti elencano due tipi di progetti: consumer e risorsa. Per le definizioni di questi due tipi di progetto, consulta la documentazione sull'utilizzo di più progetti.

Trascrizione vocale

Questa funzionalità utilizza l'integrazione di telefonia o gRPC, ognuna delle quali ha quote API diverse.

Integrazione della telefonia

Consulta le quote di Dialogflow per le API utilizzate con l'integrazione della telefonia.

Integrazione gRPC

Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
AnalyzeContentOperationsPerMinutePerProject 300 richieste/min Globale Progetto consumer Richieste AnalyzeContent/StreamingAnalyzeContent. La quota è condivisa tra Dialogflow e Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 richieste in parallelo Regionale (il traffico globale viene conteggiato nella regione us-central1) Progetto consumer (progetto di risorse per l'integrazione SipRec di telefonia) Sessioni di streaming bidirezionale simultanee per regione

Trascrizione con i modelli Chirp

Nome quota Valore predefinito Regione Progetto consumer o risorsa di addebito Descrizione
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 richieste al minuto Regionale (il traffico globale viene conteggiato nella regione us-central1). Progetto consumer (progetto di risorse per l'integrazione SipRec di telefonia) Numero di nuove richieste StreamingRecognize inviate a STT V2 per tipo di risorsa

Analisi del sentiment

Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion 300 richieste/min Stati Uniti (multi-regione) Progetto consumer Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent per versione per multiregione
AnalyzeSentimentOperationsPerMinutePerProject 300 richieste/min Globale Progetto consumer Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 richieste/min Regionale Progetto consumer Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.

Crea il tuo assist

Questa funzionalità utilizza i seguenti modelli di AI:

  • text-bison@001 (limite predefinito 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
GeneratorSuggestionOperationsPerMinutePerModelType 10 richieste/min Globale Progetto consumer Operazioni di suggerimento del generatore per tipo di modello
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 richieste/min Regionale Progetto consumer Operazioni di suggerimento del generatore per tipo di modello e regione

Risposta rapida

Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
SmartReplyBaselineModelOperationsPerMinutePerProject 120 richieste/min Globale Progetto consumer Ricevi richieste del modello di base di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 richieste/min Globale Progetto consumer Ricevi richieste del modello di base V2 di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 richieste/min Regionale Progetto consumer Ricevi richieste del modello di base V2 di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies

Risposta rapida generativa

Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
SmartReplyBaselineModelOperationsPerMinutePerProject 120 richieste/min Globale Progetto consumer Ricevi richieste del modello di base di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 richieste/min Globale Progetto consumer Ricevi richieste del modello di base V2 di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 richieste/min Regionale Progetto consumer Ricevi richieste del modello di base V2 di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies

Riassunto

Il riassunto generato con l'AI utilizza i seguenti modelli:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

La tabella seguente mostra il tipo e il modello di quota utilizzati per ogni versione del riepilogo.


Versione del riassunto

Tipo di quota

Modello di backend

Generatore 5.0

Basato sul generatore

Gemini-2.5-flash preaddestrato

Generatore 4.0

Basato sul generatore

Gemini-2.0-flash-001 preaddestrato

Generatore 3.1

Basato sul generatore

gemini-1.5-flash-001 ottimizzato per Lora

Generatore 3.0

Basato sul generatore

gemini-1.0-pro-002 ottimizzato con Lora

Generatore 2.1

Basato sul generatore

text-bison-32k@002 ottimizzato con Lora

Generatore 2.0

Basato sul generatore

text-bison-32k@002 ottimizzato con Lora

Generator 1.0

Basato sul generatore

Lora-tuned text-bison@001

Baseline v2

Modello di riferimento v2

text-bison

Baseline v1

Non basato sul generatore

Modello LongT5

Personalizzato 2.0

Non basato sul generatore

Modello LongT5

I tipi di quota nella tabella precedente sono riportati nel seguente elenco di quote per le API utilizzate con il riepilogo.


Tipo di quota

Nome limite di quota

Valore predefinito

Regione

Risorsa di addebito/Progetto consumer

Descrizione

Basato sul generatore

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 richieste/min

Regionale

Progetto consumer

Operazioni di suggerimento del generatore per tipo di modello e regione

Basato sul generatore

GeneratorSuggestionOperationsPerMinutePerModelType

10 richieste/min

Globale

Progetto consumer

Operazioni di suggerimento del generatore per tipo di modello

Basato sul generatore

SuggestConversationSummaryOperationsPerMinutePerProject

60 richieste/min

Globale

Progetto risorsa

Suggerisci operazioni di riepilogo della conversazione

Non basato sul generatore

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0-2 richieste/min

Regionale

Progetto risorsa

Suggerisci operazioni di riepilogo delle conversazioni in ogni regione

Modello di riferimento v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 richieste/min

Globale

Progetto risorsa

Richieste di polling di base per il suggerimento di riepilogo della conversazione V2

Modello di riferimento v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 richieste/min

Regionale

Progetto risorsa

Richieste di polling di base per il suggerimento di riepilogo della conversazione V2 in ogni regione

Valutazione automatica del riepilogo

Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
ConcurrentSummarizationEvaluationsPerProject 1 richiesta per progetto Progetto consumer Richieste di autovalutazione

Se hai bisogno di quote simultanee aggiuntive, invia una richiesta tramite la console Google Cloud . Questa funzionalità può supportare fino a quattro quote simultanee per progetto.

Assistenza knowledge base generativa

Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
SearchKnowledgeRequestsPerMinutePerProject 60 richieste/min Globale Progetto consumer Richieste SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 richieste/min Regionale Progetto consumer Richieste SearchKnowledge per regione
SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion 30 richieste/min Stati Uniti (multi-regione) Progetto consumer Richieste SearchKnowledge per ogni multi-regione

Assistenza proattiva con knowledge base generativa

Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 richieste/min Globale Progetto risorsa Richieste KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 richieste/min Regionale Progetto risorsa Richieste di KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist in ogni regione
SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion 30 richieste/min Stati Uniti (multi-regione) Progetto risorsa Richieste di KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist in ogni regione multiregionale

Coach AI (LLM)

Questa funzionalità utilizza il modello di AI agent-coaching-2.5.

Nome del limite di quota Valore predefinito Regione Progetto consumer o risorsa di addebito Descrizione
GeneratorSuggestionOperationsPerMinutePerModelType 60 richieste al minuto Globale Progetto consumer Operazioni di suggerimento del generatore per tipo di modello
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 richieste al minuto Regionale Progetto consumer Operazioni di suggerimento del generatore per tipo di modello e regione
GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion 60 richieste al minuto Stati Uniti (multi-regione) Progetto consumer Operazioni di suggerimento del generatore per tipo di modello e multiregione

Altre quote API

Nome del limite di quota Valore predefinito Regione Risorsa di addebito/Progetto consumer Descrizione
ConversationOperationsPerMinutePerProject 300 richieste/min Globale Progetto consumer Altre richieste di conversazione, ad eccezione di AnalyzeContent e StreamingAnalyzeContent, ad esempio CreateConversation, CompleteConversation. La quota è condivisa tra Dialogflow e Agent Assist.
MessagePollingOperationsPerMinutePerProject 1200 richieste al minuto Globale Progetto consumer Richieste ListMessages. La quota è condivisa tra Dialogflow e Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 richieste al minuto Globale Progetto consumer Richieste AnswerRecord