Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Quote

La stima accurata della quota si basa sul numero di query al secondo (QPS) per ogni API. Le sezioni seguenti descrivono le quote per le API utilizzate con ogni funzionalità di Agent Assist.

Per ulteriori informazioni su come richiedere un aumento della quota, consulta la pagina delle quote. Dopo aver inviato la richiesta, Google potrebbe contattarti per ulteriori informazioni e comunicarti quando la richiesta viene approvata o rifiutata.

Se non riesci a specificare le dimensioni quando richiedi un aumento della quota per le quote multiregionali nella console Google Cloud , utilizza Google Cloud CLI o contatta l'assistenza clienti Google Cloud.

Tipi di progetto

Le tabelle delle quote seguenti elencano due tipi di progetti: consumer e risorsa. Per le definizioni di questi due tipi di progetto, consulta la documentazione sull'utilizzo di più progetti.

Trascrizione vocale

Questa funzionalità utilizza l'integrazione di telefonia o gRPC, ognuna delle quali ha quote API diverse.

Integrazione della telefonia

Consulta le quote di Dialogflow per le API utilizzate con l'integrazione della telefonia.

Integrazione gRPC

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
AnalyzeContentOperationsPerMinutePerProject	300 richieste/min	Globale	Progetto consumer	Richieste AnalyzeContent/StreamingAnalyzeContent. La quota è condivisa tra Dialogflow e Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 richieste simultanee	Regionale (il traffico globale e multiregionale degli Stati Uniti viene conteggiato nella regione `us-central1`).	Progetto consumer (progetto di risorse per l'integrazione di SipRec per la telefonia)	Sessioni di streaming bidirezionale simultanee per regione

Trascrizione con i modelli Chirp

La trascrizione vocale supporta i seguenti modelli di Chirp:

chirp_2
chirp_3

Nome quota	Valore predefinito	Regione	Progetto consumer o risorsa di addebito	Descrizione
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 richieste al minuto	Regionale (il traffico globale e multiregionale degli Stati Uniti viene conteggiato nella regione `us-central1`).	Progetto consumer (progetto di risorse per l'integrazione di SipRec per la telefonia)	Dimensioni della quota: `resource_type={stt_model_name}` (numero di nuove richieste `StreamingRecognize` inviate a STT V2 per tipo di risorsa)

Analisi del sentiment

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
AnalyzeSentimentOpsPerMinutePerProjectPerVersionPerMultiRegion	300 richieste/min	Stati Uniti (multi-regione)	Progetto consumer	Dimensioni quota: `multi-region=us,version=v3`. Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent per versione, per multiregione
AnalyzeSentimentOperationsPerMinutePerProject	300 richieste/min	Globale	Progetto consumer	Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 richieste/min	Regionale	Progetto consumer	Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.

Crea il tuo assist

Questa funzionalità utilizza i seguenti modelli di AI:

text-bison@001 (limite predefinito 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
GeneratorSuggestionOperationsPerMinutePerModelType	10 richieste/min	Globale	Progetto consumer	Operazioni di suggerimento del generatore per tipo di modello
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 richieste/min	Regionale	Progetto consumer	Dimensioni quota: `model_type={model_name}`. Operazioni di suggerimento del generatore per tipo di modello e regione

Risposta rapida

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
SmartReplyBaselineModelOperationsPerMinutePerProject	120 richieste/min	Globale	Progetto consumer	Ricevi richieste del modello di base di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 richieste/min	Globale	Progetto consumer	Ricevi richieste del modello di base V2 di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 richieste/min	Regionale	Progetto consumer	Ricevi richieste del modello di base V2 di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`

Risposta rapida generativa

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
SmartReplyBaselineModelOperationsPerMinutePerProject	120 richieste/min	Globale	Progetto consumer	Ricevi richieste del modello di base di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProject	60 richieste/min	Globale	Progetto consumer	Ricevi richieste del modello di base V2 di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion	60 richieste/min	Regionale	Progetto consumer	Ricevi richieste del modello di base V2 di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`

Riassunto

Il riassunto generato con l'AI utilizza i seguenti modelli:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0
summarization-6.0

La tabella seguente mostra il tipo e il modello di quota utilizzati per ogni versione del riepilogo.

Versione del riassunto	Tipo di quota	Modello di backend
Generator 6.0	Basato sul generatore	Pretrained Gemini-3.5-flash
Generatore 5.0	Basato sul generatore	Gemini-2.5-flash preaddestrato
Generatore 4.0	Basato sul generatore	Gemini-2.0-flash-001 preaddestrato
Generatore 3.1	Basato sul generatore	gemini-1.5-flash-001 ottimizzato con Lora
Generatore 3.0	Basato sul generatore	gemini-1.0-pro-002 ottimizzato con Lora
Generatore 2.1	Basato sul generatore	Lora-tuned text-bison-32k@002
Generatore 2.0	Basato sul generatore	Lora-tuned text-bison-32k@002
Generator 1.0	Basato sul generatore	text-bison@001 ottimizzato con Lora
Baseline v2	Modello di riferimento v2	text-bison
Baseline v1	Non basato sul generatore	Modello LongT5
Personalizzato 2.0	Non basato sul generatore	Modello LongT5

I tipi di quota nella tabella precedente sono riportati nel seguente elenco di quote per le API utilizzate con il riepilogo.

Tipo di quota	Nome limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
Basato sul generatore	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 richieste/min	Regionale	Progetto consumer	Dimensioni quota: `model_type=summarization-{version_num}`.Operazioni di suggerimento del generatore per tipo di modello e regione
Basato sul generatore	GeneratorSuggestionOperationsPerMinutePerModelType	10 richieste/min	Globale	Progetto consumer	Operazioni di suggerimento del generatore per tipo di modello
Basato sul generatore	GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion	10 richieste/min	Stati Uniti (multi-regione)	Progetto consumer	Dimensioni della quota: `multi-region=us, model_type=summarization-{version_num}`. Operazioni di suggerimento del generatore per tipo di modello e regione
Basato sul generatore	SuggestConversationSummaryOperationsPerMinutePerProject	60 richieste/min	Globale	Progetto risorsa	Suggerisci operazioni di riepilogo della conversazione
Non basato sul generatore	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0-2 richieste/min	Regionale	Progetto risorsa	Suggerisci operazioni di riepilogo delle conversazioni in ogni regione
Modello di riferimento v2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 richieste/min	Globale	Progetto risorsa	Richieste di polling di base per il suggerimento di riepilogo della conversazione V2
Modello di riferimento v2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 richieste/min	Regionale	Progetto risorsa	Richieste di polling di base per il suggerimento di riepilogo della conversazione V2 in ogni regione

Valutazione automatica del riepilogo

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
ConcurrentSummarizationEvaluationsPerProject	1 richiesta per progetto	Progetto consumer	Richieste di autovalutazione

Se hai bisogno di quote simultanee aggiuntive, invia una richiesta tramite la console Google Cloud . Questa funzionalità può supportare fino a quattro quote simultanee per progetto.

Assistenza knowledge base generativa

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
SearchKnowledgeRequestsPerMinutePerProject	60 richieste/min	Globale	Progetto consumer	Richieste SearchKnowledge
SearchKnowledgeRequestsPerMinutePerProjectPerRegion	30 richieste/min	Regionale	Progetto consumer	Richieste SearchKnowledge per regione
SearchKnowledgeRequestsPerMinutePerProjectPerMultiRegion	30 richieste/min	Stati Uniti (multi-regione)	Progetto consumer	Dimensioni quota: `multi-region=us`. Richieste SearchKnowledge per ogni multi-regione

Assistenza proattiva basata sulla conoscenza generativa

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 richieste/min	Globale	Progetto risorsa	Richieste KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 richieste/min	Regionale	Progetto risorsa	Richieste di KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist in ogni regione
SuggestKnowledgeAssistOpsPerMinutePerProjectPerMultiRegion	30 richieste/min	Stati Uniti (multi-regione)	Progetto risorsa	Dimensioni quota: `multi-region=us`. Richieste KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist in ogni multiregione

coach AI (LLM)

Questa funzionalità utilizza il modello di AI agent-coaching-2.5.

Nome del limite di quota	Valore predefinito	Regione	Progetto consumer o risorsa di addebito	Descrizione
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 richieste al minuto	Globale	Progetto consumer	Dimensioni quota: `model_type=agent-coaching-2.5`. Operazioni di suggerimento del generatore per tipo di modello
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 richieste al minuto	Regionale	Progetto consumer	Dimensioni quota: `model_type=agent-coaching-2.5`. Operazioni di suggerimento del generatore per tipo di modello e regione
`GeneratorSuggestionOperationsPerMinutePerModelTypePerMultiRegion`	10 richieste al minuto	Stati Uniti (multi-regione)	Progetto consumer	Dimensioni quota: `multi-region=us,model_type=agent-coaching-2.5`. Operazioni di suggerimento del generatore per tipo di modello e multiregione

Altre quote API

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
ConversationOperationsPerMinutePerProject	300 richieste/min	Globale	Progetto consumer	Altre richieste di conversazione, ad eccezione di AnalyzeContent e StreamingAnalyzeContent, ad esempio CreateConversation, CompleteConversation. La quota è condivisa tra Dialogflow e Agent Assist.
MessagePollingOperationsPerMinutePerProject	1200 richieste al minuto	Globale	Progetto consumer	Richieste ListMessages. La quota è condivisa tra Dialogflow e Agent Assist.
AnswerRecordOperationsPerMinutePerProject	300 richieste al minuto	Globale	Progetto consumer	Richieste AnswerRecord

Quote Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.