Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Quote e limiti

Questo documento contiene le restrizioni e i limiti di utilizzo attuali per l'API Cloud Speech-to-Text. La pagina verrà aggiornata per riflettere eventuali modifiche a tali restrizioni e limiti di utilizzo. Ci riserviamo il diritto di modificare questi limiti.

Se necessario, puoi richiedere un aumento della quota. Consulta la pagina delle quote di Google Cloud per ulteriori informazioni su come visualizzare e gestire la quota.

Dopo la presentazione della richiesta, Google potrebbe contattarti per ulteriori informazioni e per comunicarti se la richiesta è stata approvata o rifiutata.

Limiti per i contenuti

Richieste sincrone

Le richieste di riconoscimento sincrono (che utilizzano il metodo Recognize) accettano dati audio incorporati nel campo content della richiesta o come URI Cloud Storage nel campo uri della richiesta. L'audio inviato a una richiesta sincrona è limitato a 10 MB o 1 minuto di durata dell'audio (a seconda di quale limite viene raggiunto per primo). Per saperne di più sul riconoscimento sincrono, consulta la panoramica del riconoscimento sincrono.

Richieste di streaming

Le richieste di riconoscimento dello streaming (utilizzando il metodo StreamingRecognize) accettano solo l'audio incorporato nel campo audio della richiesta. Ogni richiesta nel flusso è limitata a 25 KB di audio. Uno stream può rimanere aperto per un massimo di 5 minuti e l'audio deve essere inviato con una velocità quanto più vicina al tempo reale. Se devi eseguire lo streaming di contenuti per più di 5 minuti, consulta il tutorial di streaming senza fine. Per ulteriori informazioni sul riconoscimento dello streaming, consulta la panoramica del riconoscimento dello streaming.

Richieste batch

Le richieste di riconoscimento batch (che utilizzano il metodo BatchRecognize) accettano solo l'audio come URI Cloud Storage nel campo uri della richiesta. Ogni BatchRecognizeRequest può contenere fino a 15 files da trascrivere. Ogni file può durare fino a 8 ore. Per saperne di più sul riconoscimento asincrono, consulta la panoramica del riconoscimento batch.

Riconoscimento di più lingue

Il riconoscimento di più lingue è disponibile solo negli endpoint Cloud Speech-to-Text globali, statunitensi ed europei.

Adattamento

In qualsiasi richiesta puoi anche fornire risorse PhraseSet e CustomClass. Ai seguenti limiti si applicano queste risorse:

Limite di adattamento vocale	Valore
Valore boost massimo consentito per le frasi	20
Frasi in un PhraseSet	1200
Frasi per richiesta	5000
Caratteri per frase	100
Caratteri totali per richiesta	100.000
Numero massimo di elementi in una CustomClass	500
Numero massimo di caratteri per elemento CustomClass	500
Numero massimo di PhraseSet per SpeechAdaptation	20
Numero massimo di CustomClass per SpeechAdaptation	20

Limiti delle risorse

Di seguito sono riportati i limiti attuali delle risorse API per Cloud Speech-to-Text (soggetti a modifica):

Tipo di limite	Limite di utilizzo
Numero di riconoscitori (per regione)	5000
Numero di classi personalizzate (per regione)	5000
Numero di set di frasi (per regione)	5000

Limiti per le richieste

Di seguito sono riportati i limiti di utilizzo attuali (soggetti a modifica) relativi all'API Cloud Speech-to-Text:

Tipo di limite	Limite di utilizzo
Richieste di risorse ogni 60 secondi (per regione)	100
Richieste di operazioni ogni 60 secondi (per regione)	150
Richieste di riconoscimento sincrono ogni 60 secondi (per regione)	300
Richieste di riconoscimento dello streaming ogni 60 secondi (per regione) *	1.000.000
Sessioni StreamingRecognize simultanee (per regione) *	300
Richieste di riconoscimento batch ogni 60 secondi (per regione)	150

* Il riconoscimento in streaming ha un limite di quota di 300 sessioni simultanee ogni 5 minuti e un limite di 3000 richieste al minuto, che si applica a tutte le sessioni simultanee insieme. La richiesta di configurazione iniziale per una sessione non viene conteggiata ai fini della quota di richieste.

Questi limiti vengono applicati a ogni progetto di sviluppatori di Cloud Speech-to-Text e sono condivisi tra tutte le applicazioni e gli indirizzi IP che utilizzano un determinato progetto di sviluppatori.