Questo documento elenca le quote e i limiti di sistema che si applicano a Document AI.
- Le quote hanno valori predefiniti, ma in genere puoi richiedere degli adeguamenti.
- I limiti di sistema sono valori fissi che non possono essere modificati.
Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.
Il sistema delle quote di Cloud esegue le seguenti operazioni:
- Monitora il tuo consumo di Google Cloud prodotti e servizi
- Limita il consumo di queste risorse
- Fornisce un modo per richiedere modifiche al valore della quota e automatizzare gli aggiustamenti della quota
Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.
In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud , le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.
Per saperne di più, consulta la Panoramica delle quote di Cloud.
Per aumentare la capacità disponibile per i tuoi progetti, leggi le informazioni sulle richieste di prenotazione della capacità.
Livelli di servizio online
Document AI supporta due livelli di servizio e le quote associate per le richieste di elaborazione online alle versioni del processore basate su AI generativa: livelli di provisioning e best effort.
La quota del livello di provisioning fornisce 120 pagine al minuto per le versioni del processore di base, come l'estrattore personalizzato v1.4 e v1.5, e 30 pagine al minuto per le versioni del processore di base come l'estrattore personalizzato v1.5 Pro.
La quota del livello best effort fornisce 120 per le versioni del processore di base come l'estrattore personalizzato v1.4 e v1.5, 60 per le versioni del processore Pro come l'estrattore personalizzato v1.5 Pro e viene utilizzata solo dopo che la quota di provisioning è stata esaurita. Questo si applica alle quote BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (metrica best_effort_online_process_document_pages_us) e BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (metrica best_effort_online_process_document_pages_eu) nella console.
| Note | Processori basati su Gemini 2.0 Flash | Processori basati su Gemini 2.5 Flash | Processori basati su Gemini 2.5 Pro |
|---|---|---|---|
| Processori come: | Estrattore personalizzato v1.4 | Estrattore personalizzato v1.5 | Tutte le versioni Pro come Estrattore personalizzato v1.5 Pro e v1.6 Pro |
| Provisioning effettuato | 120 | 120 | 30 |
| Best effort | 120 | 120 | 60 |
| Best effort con una richiesta di aumento della quota | 240 | 240 | 120 |
| Provisioning effettuato a livello di organizzazione | 240 | 240 | 60 |
| Capacità riservata, acquistata | Disponibile | Disponibile | Non disponibile |
Se hai bisogno di più di quanto indicato nelle quote best effort, puoi inviare una richiesta di aumento della quota (QIR) contattando il team di vendita.
Per garantire una maggiore capacità disponibile durante i periodi di traffico elevato, consulta la sezione su come inviare una richiesta di prenotazione della capacità.
Non è previsto alcun accordo sul livello del servizio per il livello best effort.
Elenco delle quote
Le seguenti quote si applicano a Document AI. Queste quote si applicano a ogni Google Cloud progetto della console e sono condivise tra tutte le applicazioni e gli indirizzi IP che utilizzano il progetto.
Se vuoi elaborare più richieste, invia una richiesta di quota di Document AI per il tuo progetto nella Google Cloud console.
Fornisci informazioni sulle tue esigenze specifiche e sul tuo caso d'uso nella richiesta.
| Richieste di base al minuto (RPM) | Valore predefinito | Note |
|---|---|---|
| Richieste al minuto | 1800 per utente1 | Visualizza la quota nella Google Cloud console |
| RPM generico di sincronizzazione con provisioning effettuato | ||
| Richieste di elaborazione online al minuto (Stati Uniti) | 120 per progetto per tipo di processore | Visualizza la quota nella Google Cloud console |
| Richieste di elaborazione online al minuto (UE) | 120 per progetto per tipo di processore | Visualizza la quota nella Google Cloud console |
| Richieste di elaborazione online al minuto (singola regione) | 6 per progetto per tipo di processore | Visualizza la quota nella Google Cloud console |
| PPM di sincronizzazione di AI generativa | ||
| Numero di pagine di documenti di elaborazione online (Stati Uniti) al minuto per tipo di processore e versione del modello (solo Estrattore personalizzato v1.4 con Gemini 2.0 Flash) | 120 pagine al minuto2 | Visualizza la quota nella Google Cloud console |
| Numero di pagine di documenti di elaborazione online (UE) al minuto per tipo di processore e versione del modello (solo Estrattore personalizzato v1.4 con Gemini 2.0 Flash) | 120 pagine al minuto2 | Visualizza la quota nella Google Cloud console |
| Numero di pagine di documenti di elaborazione online (Stati Uniti) al minuto per tipo di processore e versione del modello (solo Estrattore personalizzato v1.5 con Gemini 2.5 Flash) | 120 pagine al minuto2 | Visualizza la quota nella Google Cloud console |
| Numero di pagine di documenti di elaborazione online (UE) al minuto per tipo di processore e versione del modello (solo Estrattore personalizzato v1.5 con Gemini 2.5 Flash) | 120 pagine al minuto2 | Visualizza la quota nella Google Cloud console |
| PPM di sincronizzazione best effort | ||
| Numero di pagine di documenti di elaborazione online best effort (Stati Uniti) al minuto per tipo di processore e versione del modello | 120 pagine al minuto4 | Visualizza la quota nella Google Cloud console |
| Numero di pagine di documenti di elaborazione online best effort (UE) al minuto per tipo di processore e versione del modello | 120 pagine al minuto4 | Visualizza la quota nella Google Cloud console |
| Numero di pagine di documenti di elaborazione online best effort (singola regione) al minuto per tipo di processore e versione del modello | 120 pagine al minuto4 | Visualizza la quota nella Google Cloud console |
| Batch simultanei | ||
| Richieste di elaborazione batch simultanee per progetto e regione (Stati Uniti) | 5 per progetto | Visualizza la quota nella Google Cloud console |
| Richieste di elaborazione batch simultanee per progetto e regione (UE) | 5 per progetto | Visualizza la quota nella Google Cloud console |
| Richieste di elaborazione batch simultanee per processore (singola regione) | 5 per progetto | Visualizza la quota nella Google Cloud console |
| Addestramento simultaneo | ||
| Richieste di addestramento simultanee della versione del processore (Stati Uniti) | 1 per progetto | Visualizza la quota nella Google Cloud console |
| Richieste di addestramento simultanee della versione del processore (UE) | 1 per progetto | Visualizza la quota nella Google Cloud console |
| Richieste di addestramento simultanee della versione del processore (singola regione) | 1 per progetto3 | Visualizza la quota nella Google Cloud console |
| Processori di cui è stato eseguito il deployment | ||
| Versioni del processore personalizzato di cui è stato eseguito il deployment (Stati Uniti) | 5 per progetto | Visualizza la quota nella Google Cloud console |
| Versioni del processore personalizzato di cui è stato eseguito il deployment (UE) | 5 per progetto | Visualizza la quota nella Google Cloud console |
| Versioni del processore personalizzato di cui è stato eseguito il deployment (singola regione) | 5 per progetto | Visualizza la quota nella Google Cloud console |
| Processori di AI generativa di cui è stato eseguito il deployment | ||
| Versioni del processore generativo di cui è stato eseguito il deployment (Stati Uniti) | 100 per progetto per processore di estrazione personalizzato | Visualizza la quota nella Google Cloud console |
| Versioni del processore generativo di cui è stato eseguito il deployment (UE) | 100 per progetto per processore di estrazione personalizzato | Visualizza la quota nella Google Cloud console |
| Versioni del processore generativo di cui è stato eseguito il deployment (singola regione) | 100 per progetto per processore di estrazione personalizzato | Visualizza la quota nella Google Cloud console |
| Importazione simultanea | ||
| Richieste di importazione di documenti simultanee (Stati Uniti) | 3 per progetto | Visualizza la quota nella Google Cloud console |
| Richieste di importazione di documenti simultanee (UE) | 3 per progetto | Visualizza la quota nella Google Cloud console |
| Richieste di importazione di documenti simultanee (singola regione) | 3 per progetto | Visualizza la quota nella Google Cloud console |
| Esportazione simultanea | ||
| Richieste di esportazione di documenti simultanee (Stati Uniti) | 1 per progetto | Visualizza la quota nella Google Cloud console |
| Richieste di esportazione di documenti simultanee (UE) | 1 per progetto | Visualizza la quota nella Google Cloud console |
| Richieste di esportazione di documenti simultanee (singola regione) | 1 per progetto | Visualizza la quota nella Google Cloud console |
- Il batch di quote di richieste al minuto riguarda il numero di documenti richiesti al minuto, non il numero di pagine o le chiamate API `batchProcess`.
- Le richieste di aggiustamento delle quote non sono ancora supportate per questa versione.
- Supportato in
australia-southeast1con una richiesta di aggiustamento della quota. - Varia a seconda della versione di Gemini, consulta i livelli di servizio. Esamina come inviare una richiesta di prenotazione della capacità.
Se il tuo progetto richiede più capacità, leggi le informazioni sulla prenotazione della capacità.