La stima accurata della quota si basa sul numero di query al secondo (QPS) per ogni API. Le sezioni seguenti descrivono le quote per le API utilizzate con ogni funzionalità di Agent Assist.
Per ulteriori informazioni su come richiedere un aumento della quota, consulta la pagina relativa alle quote. Dopo aver inviato la richiesta, Google potrebbe contattarti per ulteriori informazioni e comunicarti quando la richiesta viene approvata o rifiutata.
Tipi di progetto
Le tabelle delle quote seguenti elencano due tipi di progetti: consumer e risorsa. Per le definizioni di questi due tipi di progetto, consulta la documentazione sull'utilizzo di più progetti.
Trascrizione del parlato
Questa funzionalità utilizza l'integrazione di telefonia o gRPC, ognuna con quote API diverse.
Integrazione di telefonia
Consulta le quote di Dialogflow per le API utilizzate con l'integrazione di telefonia.
Integrazione di gRPC
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| AnalyzeContentOperationsPerMinutePerProject | 300 richieste/min | Globale | Progetto consumer | Richieste AnalyzeContent/StreamingAnalyzeContent. La quota è condivisa tra Dialogflow e Agent Assist. |
| ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 richieste simultanee | Regionale (il traffico globale viene conteggiato nella regione us-central1) |
Progetto consumer (progetto risorsa per l'integrazione SipRec di telefonia) | Sessioni di streaming bidirezionale simultanee per regione |
Trascrizione con i modelli Chirp
| Nome quota | Valore predefinito | Regione | Risorsa di addebito o progetto consumer | Descrizione |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 richieste al minuto | Regionale (il traffico globale viene conteggiato nella regione us-central1). |
Progetto consumer (progetto risorsa per l'integrazione SipRec di telefonia) | Numero di nuove richieste StreamingRecognize inviate a STT V2 per tipo di risorsa |
Analisi del sentiment
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| AnalyzeSentimentOperationsPerVersion | 300 richieste/min | Globale | Progetto consumer | Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerVersionPerRegion | 300 richieste/min | Regionale | Progetto consumer | Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProject | 300 richieste/min | Globale | Progetto consumer | Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent. |
| AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 richieste/min | Regionale | Progetto consumer | Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent. |
Crea la tua assistenza
Questa funzionalità utilizza i seguenti modelli di AI:
- text-bison@001 (limite predefinito 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| GeneratorSuggestionOperationsPerMinutePerModelType | 10 richieste/min | Globale | Progetto consumer | Operazioni di suggerimento del generatore per tipo di modello |
| GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 richieste/min | Regionale | Progetto consumer | Operazioni di suggerimento del generatore per tipo di modello e regione |
Risposta rapida
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 richieste/min | Globale | Progetto consumer | Richieste del modello di base di risposta rapida tramite AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 richieste/min | Globale | Progetto consumer | Richieste del modello di base V2 di risposta rapida tramite AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 richieste/min | Regionale | Progetto consumer | Richieste del modello di base V2 di risposta rapida tramite AnalyzeContent o SuggestSmartReplies |
Risposta rapida generativa
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| SmartReplyBaselineModelOperationsPerMinutePerProject | 120 richieste/min | Globale | Progetto consumer | Richieste del modello di base di risposta rapida tramite AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProject | 60 richieste/min | Globale | Progetto consumer | Richieste del modello di base V2 di risposta rapida tramite AnalyzeContent o SuggestSmartReplies |
| SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion | 60 richieste/min | Regionale | Progetto consumer | Richieste del modello di base V2 di risposta rapida tramite AnalyzeContent o SuggestSmartReplies |
Riassunto
Il riassunto generato con l'AI utilizza i seguenti modelli:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
La tabella seguente mostra il tipo di quota e il modello utilizzato per ogni versione del riassunto.
Versione del riassunto |
Tipo di quota |
Modello di backend |
|---|---|---|
Generatore 5.0 |
Basato sul generatore |
Gemini-2.5-flash preaddestrato |
Generatore 4.0 |
Basato sul generatore |
Gemini-2.0-flash-001 preaddestrato |
Generatore 3.1 |
Basato sul generatore |
gemini-1.5-flash-001 con ottimizzazione Lora |
Generatore 3.0 |
Basato sul generatore |
gemini-1.0-pro-002 con ottimizzazione Lora |
Generatore 2.1 |
Basato sul generatore |
text-bison-32k@002 con ottimizzazione Lora |
Generatore 2.0 |
Basato sul generatore |
text-bison-32k@002 con ottimizzazione Lora |
Generatore 1.0 |
Basato sul generatore |
text-bison@001 con ottimizzazione Lora |
Modello di base v2 |
Modello di base v2 |
text-bison |
Modello di base v1 |
Non basato sul generatore |
Modello LongT5 |
Personalizzato 2.0 |
Non basato sul generatore |
Modello LongT5 |
I tipi di quota nella tabella precedente si riflettono nell'elenco delle quote seguente per le API utilizzate con il riassunto.
Tipo di quota |
Nome limite di quota |
Valore predefinito |
Regione |
Risorsa di addebito/progetto consumer |
Descrizione |
|---|---|---|---|---|---|
Basato sul generatore |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 richieste/min |
Regionale |
Progetto consumer |
Operazioni di suggerimento del generatore per tipo di modello e regione |
Basato sul generatore |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 richieste/min |
Globale |
Progetto consumer |
Operazioni di suggerimento del generatore per tipo di modello |
Basato sul generatore |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 richieste/min |
Globale |
Progetto risorsa |
Operazioni di suggerimento del riassunto della conversazione |
Non basato sul generatore |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0-2 richieste/min |
Regionale |
Progetto risorsa |
Operazioni di suggerimento del riassunto della conversazione in ogni regione |
Modello di base v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 richieste/min |
Globale |
Progetto risorsa |
Richieste di polling del modello di base V2 per il suggerimento del riassunto della conversazione |
Modello di base v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 richieste/min |
Regionale |
Progetto risorsa |
Richieste di polling del modello di base V2 per il suggerimento del riassunto della conversazione in ogni regione |
Valutazione automatica del riassunto
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| ConcurrentSummarizationEvaluationsPerProject | 1 richiesta per progetto | Progetto consumer | Richieste di valutazione automatica |
Se hai bisogno di quote simultanee aggiuntive, invia una richiesta tramite la Google Cloud console. Questa funzionalità può supportare fino a quattro quote simultanee per progetto.
Assistenza knowledge base generativa
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| SearchKnowledgeRequestsPerMinutePerProject | 60 richieste/min | Globale | Progetto consumer | Richieste SearchKnowledge |
| SearchKnowledgeRequestsPerMinutePerProjectPerRegion | 30 richieste/min | Regionale | Progetto consumer | Richieste SearchKnowledge per regione |
Assistenza knowledge base generativa proattiva
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 richieste/min | Globale | Progetto risorsa | Richieste KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist |
| SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 richieste/min | Regionale | Progetto risorsa | Richieste KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist in ogni regione |
AI Coach (LLM)
Questa funzionalità utilizza il modello di AI agent-coaching-2.5.
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito o progetto consumer | Descrizione |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 richieste al minuto | Globale | Progetto consumer | Operazioni di suggerimento del generatore per tipo di modello |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 richieste al minuto | Regionale | Progetto consumer | Operazioni di suggerimento del generatore per tipo di modello e regione |
Altre quote API
| Nome limite di quota | Valore predefinito | Regione | Risorsa di addebito/progetto consumer | Descrizione |
|---|---|---|---|---|
| ConversationOperationsPerMinutePerProject | 300 richieste/min | Globale | Progetto consumer | Altre richieste di conversazione, ad eccezione di AnalyzeContent e StreamingAnalyzeContent, ad esempio CreateConversation, CompleteConversation. La quota è condivisa tra Dialogflow e Agent Assist. |
| MessagePollingOperationsPerMinutePerProject | 1200 richieste / min | Globale | Progetto consumer | Richieste ListMessages. La quota è condivisa tra Dialogflow e Agent Assist. |
| AnswerRecordOperationsPerMinutePerProject | 300 richieste / min | Globale | Progetto consumer | Richieste AnswerRecord |