Quote e limiti di sistema

Questo documento elenca le quote e i limiti di sistema che si applicano a Gemini Enterprise.

  • Le quote hanno valori predefiniti, ma in genere puoi richiedere modifiche.
  • I limiti di sistema sono valori fissi che non possono essere modificati.

Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un Google Cloud progetto, le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.

Esistono anche limiti di sistema per le risorse Gemini Enterprise. I limiti di sistema non possono essere modificati.

Per informazioni sui prezzi per l'utilizzo in eccesso di Gemini Enterprise, consulta la pagina Quote e utilizzo in eccesso.

quote di allocazione

La tabella seguente elenca le quote per l'API Discovery Engine. Queste quote non vengono reimpostate nel tempo. Vengono invece rilasciati quando rilasci la risorsa. Se la quota predefinita non è sufficiente, puoi richiedere un aumento della quota.

Quota Valore
Numero totale di datastore per progetto 100*
Numero totale di motori per progetto 150
Numero di operazioni di importazione a lunga esecuzione in sospeso per progetto 300
Numero di operazioni a lunga esecuzione di eliminazione di documenti in attesa per progetto 100
Numero di controlli di pubblicazione per progetto 1000
Numero di controlli di pubblicazione con boost per configurazione di pubblicazione 100
Numero di controlli di pubblicazione dei filtri per configurazione di pubblicazione 100
Numero di controlli di pubblicazione del reindirizzamento per configurazione di pubblicazione 100
Numero di controlli di pubblicazione dei sinonimi per configurazione di pubblicazione 100
Numero regionale di datastore per progetto per località (globale, Stati Uniti, UE) 100
Numero regionale di documenti per progetto per località (globale, Stati Uniti, UE) 10.000.000
Numero regionale di motori per progetto per località (globale, Stati Uniti, UE) 150
Numero regionale di eventi utente per progetto per località (globale, Stati Uniti, UE) 40.000.000.000

* A causa di una limitazione tecnica, la quota massima per i datastore è 500 per progetto. Se hai bisogno di altri datastore, utilizza nuovi progetti.

A causa di una limitazione tecnica, la quota massima per i motori è 500 per progetto. Se hai bisogno di più motori, utilizza nuovi progetti.

Quote di frequenza

Le seguenti quote si applicano alle richieste API Discovery Engine. Se la quota predefinita non è sufficiente, puoi richiedere un aumento della quota.

Quota Valore
Richieste di completamento delle query al minuto per progetto 300
Richieste di lettura della ricerca conversazionale al minuto per progetto 300
Richieste di scrittura della ricerca conversazionale al minuto per progetto 300
Richieste batch di documenti (ad esempio importazione e eliminazione in linea) al minuto per progetto 100
Richieste di importazione asincrona di documenti (Cloud Storage, BigQuery e così via) al minuto per progetto 5
Richieste di eliminazione dei documenti al minuto per progetto 100
Richieste di lettura di documenti al minuto per progetto 300
Richieste di scrittura di documenti al minuto per progetto 12.000
Richieste di creazione della valutazione al giorno per progetto 5
Richieste di lettura della valutazione al minuto per progetto 100
Richieste di scrittura di valutazione al minuto per progetto 100
Richieste di controllo della generazione basata al minuto per progetto 300
Richieste di query LLM (riepilogo della ricerca, ricerca in più passaggi) al minuto per progetto 60
Numero di scritture di streaming FHIR o BigQuery in attesa al minuto 6000
Numero di set di query di esempio per progetto 100
Richieste API Ranking al minuto per progetto 500
Richieste di raccomandazione al minuto per progetto 60.000
Richieste di lettura di query di esempio al minuto per progetto 200
Richieste di lettura del set di query di esempio al minuto per progetto 100
Richieste di scrittura di set di query di esempio al minuto per progetto 100
Esempio di richieste di scrittura di query al minuto per progetto 200
Richieste di lettura dello schema al minuto per progetto 100
Richieste di scrittura dello schema al minuto per progetto 100
Richieste di ricerca regionali al minuto per progetto per località (globale, Stati Uniti, UE) 300
Richieste batch di eventi utente (ad esempio importazione ed eliminazione) al minuto per progetto 100
Richieste di raccolta di eventi utente al minuto per progetto per utente 240
Richieste di scrittura di eventi utente al minuto per progetto 60.000

Richiedi un aumento della quota

Per modificare la maggior parte delle quote, utilizza la Google Cloud console. Per ulteriori informazioni, consulta Richiedi un aggiustamento delle quote.