Quote

La stima accurata della quota si basa sul numero di query al secondo (QPS) per ogni API. Le sezioni seguenti descrivono le quote per le API utilizzate con ogni funzionalità di Agent Assist.

Per ulteriori informazioni su come richiedere un aumento della quota, consulta la pagina relativa alle quote. Dopo aver inviato la richiesta, Google potrebbe contattarti per ulteriori informazioni e comunicarti quando la richiesta viene approvata o rifiutata.

Tipi di progetto

Le tabelle delle quote seguenti elencano due tipi di progetti: consumer e risorsa. Per le definizioni di questi due tipi di progetto, consulta la documentazione sull'utilizzo di più progetti.

Trascrizione del parlato

Questa funzionalità utilizza l'integrazione di telefonia o gRPC, ognuna con quote API diverse.

Integrazione di telefonia

Consulta le quote di Dialogflow per le API utilizzate con l'integrazione di telefonia.

Integrazione di gRPC

Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
AnalyzeContentOperationsPerMinutePerProject 300 richieste/min Globale Progetto consumer Richieste AnalyzeContent/StreamingAnalyzeContent. La quota è condivisa tra Dialogflow e Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 richieste simultanee Regionale (il traffico globale viene conteggiato nella regione us-central1) Progetto consumer (progetto risorsa per l'integrazione SipRec di telefonia) Sessioni di streaming bidirezionale simultanee per regione

Trascrizione con i modelli Chirp

Nome quota Valore predefinito Regione Risorsa di addebito o progetto consumer Descrizione
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 richieste al minuto Regionale (il traffico globale viene conteggiato nella regione us-central1). Progetto consumer (progetto risorsa per l'integrazione SipRec di telefonia) Numero di nuove richieste StreamingRecognize inviate a STT V2 per tipo di risorsa

Analisi del sentiment

Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
AnalyzeSentimentOperationsPerVersion 300 richieste/min Globale Progetto consumer Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion 300 richieste/min Regionale Progetto consumer Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject 300 richieste/min Globale Progetto consumer Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 richieste/min Regionale Progetto consumer Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.

Crea la tua assistenza

Questa funzionalità utilizza i seguenti modelli di AI:

  • text-bison@001 (limite predefinito 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
GeneratorSuggestionOperationsPerMinutePerModelType 10 richieste/min Globale Progetto consumer Operazioni di suggerimento del generatore per tipo di modello
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 richieste/min Regionale Progetto consumer Operazioni di suggerimento del generatore per tipo di modello e regione

Risposta rapida

Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
SmartReplyBaselineModelOperationsPerMinutePerProject 120 richieste/min Globale Progetto consumer Richieste del modello di base di risposta rapida tramite AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 richieste/min Globale Progetto consumer Richieste del modello di base V2 di risposta rapida tramite AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 richieste/min Regionale Progetto consumer Richieste del modello di base V2 di risposta rapida tramite AnalyzeContent o SuggestSmartReplies

Risposta rapida generativa

Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
SmartReplyBaselineModelOperationsPerMinutePerProject 120 richieste/min Globale Progetto consumer Richieste del modello di base di risposta rapida tramite AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 richieste/min Globale Progetto consumer Richieste del modello di base V2 di risposta rapida tramite AnalyzeContent o SuggestSmartReplies
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 richieste/min Regionale Progetto consumer Richieste del modello di base V2 di risposta rapida tramite AnalyzeContent o SuggestSmartReplies

Riassunto

Il riassunto generato con l'AI utilizza i seguenti modelli:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

La tabella seguente mostra il tipo di quota e il modello utilizzato per ogni versione del riassunto.


Versione del riassunto

Tipo di quota

Modello di backend

Generatore 5.0

Basato sul generatore

Gemini-2.5-flash preaddestrato

Generatore 4.0

Basato sul generatore

Gemini-2.0-flash-001 preaddestrato

Generatore 3.1

Basato sul generatore

gemini-1.5-flash-001 con ottimizzazione Lora

Generatore 3.0

Basato sul generatore

gemini-1.0-pro-002 con ottimizzazione Lora

Generatore 2.1

Basato sul generatore

text-bison-32k@002 con ottimizzazione Lora

Generatore 2.0

Basato sul generatore

text-bison-32k@002 con ottimizzazione Lora

Generatore 1.0

Basato sul generatore

text-bison@001 con ottimizzazione Lora

Modello di base v2

Modello di base v2

text-bison

Modello di base v1

Non basato sul generatore

Modello LongT5

Personalizzato 2.0

Non basato sul generatore

Modello LongT5

I tipi di quota nella tabella precedente si riflettono nell'elenco delle quote seguente per le API utilizzate con il riassunto.


Tipo di quota

Nome limite di quota

Valore predefinito

Regione

Risorsa di addebito/progetto consumer

Descrizione

Basato sul generatore

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 richieste/min

Regionale

Progetto consumer

Operazioni di suggerimento del generatore per tipo di modello e regione

Basato sul generatore

GeneratorSuggestionOperationsPerMinutePerModelType

10 richieste/min

Globale

Progetto consumer

Operazioni di suggerimento del generatore per tipo di modello

Basato sul generatore

SuggestConversationSummaryOperationsPerMinutePerProject

60 richieste/min

Globale

Progetto risorsa

Operazioni di suggerimento del riassunto della conversazione

Non basato sul generatore

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0-2 richieste/min

Regionale

Progetto risorsa

Operazioni di suggerimento del riassunto della conversazione in ogni regione

Modello di base v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 richieste/min

Globale

Progetto risorsa

Richieste di polling del modello di base V2 per il suggerimento del riassunto della conversazione

Modello di base v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 richieste/min

Regionale

Progetto risorsa

Richieste di polling del modello di base V2 per il suggerimento del riassunto della conversazione in ogni regione

Valutazione automatica del riassunto

Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
ConcurrentSummarizationEvaluationsPerProject 1 richiesta per progetto Progetto consumer Richieste di valutazione automatica

Se hai bisogno di quote simultanee aggiuntive, invia una richiesta tramite la Google Cloud console. Questa funzionalità può supportare fino a quattro quote simultanee per progetto.

Assistenza knowledge base generativa

Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
SearchKnowledgeRequestsPerMinutePerProject 60 richieste/min Globale Progetto consumer Richieste SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 richieste/min Regionale Progetto consumer Richieste SearchKnowledge per regione

Assistenza knowledge base generativa proattiva

Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 richieste/min Globale Progetto risorsa Richieste KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 richieste/min Regionale Progetto risorsa Richieste KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist in ogni regione

AI Coach (LLM)

Questa funzionalità utilizza il modello di AI agent-coaching-2.5.

Nome limite di quota Valore predefinito Regione Risorsa di addebito o progetto consumer Descrizione
GeneratorSuggestionOperationsPerMinutePerModelType 60 richieste al minuto Globale Progetto consumer Operazioni di suggerimento del generatore per tipo di modello
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 richieste al minuto Regionale Progetto consumer Operazioni di suggerimento del generatore per tipo di modello e regione

Altre quote API

Nome limite di quota Valore predefinito Regione Risorsa di addebito/progetto consumer Descrizione
ConversationOperationsPerMinutePerProject 300 richieste/min Globale Progetto consumer Altre richieste di conversazione, ad eccezione di AnalyzeContent e StreamingAnalyzeContent, ad esempio CreateConversation, CompleteConversation. La quota è condivisa tra Dialogflow e Agent Assist.
MessagePollingOperationsPerMinutePerProject 1200 richieste / min Globale Progetto consumer Richieste ListMessages. La quota è condivisa tra Dialogflow e Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 richieste / min Globale Progetto consumer Richieste AnswerRecord