Questo documento elenca le quote e i limiti di sistema che si applicano a Model Armor.
- Le quote hanno valori predefiniti, ma in genere puoi richiedere degli adeguamenti.
- I limiti di sistema sono valori fissi che non possono essere modificati.
Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.
Il sistema delle quote di Cloud esegue le seguenti operazioni:
- Monitora il tuo consumo di Google Cloud prodotti e servizi
- Limita il consumo di queste risorse
- Fornisce un modo per richiedere modifiche al valore della quota e automatizzare gli aggiustamenti della quota
Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.
In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud , le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.
Per saperne di più, consulta la Panoramica delle quote di Cloud.
Quote dell'API Model Armor
La tabella seguente specifica le quote per l'API Model Armor.
| Quota | Valore |
|---|---|
| Query API | 1200 query al minuto (QPM) per progetto |
| Richieste a ExternalProcessor | 600 QPM per progetto 1 |
Puoi applicare un valore compreso tra 0 e 1200 QPM per progetto. Per richiedere un aggiustamento, consulta Richiedi un aggiustamento delle quote. Se hai bisogno di una quota superiore a quella predefinita, contatta l'assistenza clienti Google Cloud.
Per informazioni sulle quote relative alle integrazioni di Model Armor con altri servizi, consulta Gestire le quote.
1 Rilevante se integri Model Armor con altri Google Cloud servizi.
Limite di sistema per le dimensioni dell'input
La tabella seguente specifica il limite di sistema per le dimensioni del file o del testo di input. Model Armor ignora i file o il testo che superano questo limite.
| Limite di sistema | Valore |
|---|---|
| Tutti i file supportati e il testo | 4 MB |
Limiti di sistema per i token
Model Armor ha limiti di sistema variabili per i token a seconda del filtro specifico.
| Filtro | Limite di sistema |
|---|---|
| Rilevamento di prompt injection e jailbreaking | 10.000 |
| AI responsabile | 10.000 |
| Materiale pedopornografico | 10.000 |
| Sensitive Data Protection | 130.000 |
Quando il prompt o la risposta supera il limite di token, il filtro Sensitive Data Protection restituisce EXECUTION_SKIPPED. Tutti gli altri filtri, se il prompt o la risposta supera il limite di token, restituiscono MATCH_FOUND se vengono trovati contenuti dannosi nei primi 10.000 token o EXECUTION_SKIPPED se non vengono trovati contenuti dannosi nei primi 10.000 token.
Recuperare i nomi delle metriche per le quote e i limiti di sistema
Le quote e i limiti di sistema hanno due tipi di nomi: nomi visualizzati e nomi delle metriche. I nomi visualizzati hanno spazi e maiuscole che li rendono più facili da leggere per gli utenti. I nomi delle metriche sono più spesso in minuscolo e delimitati da trattini bassi anziché da spazi; il formato esatto dipende dal servizio.
Le seguenti istruzioni mostrano come recuperare i nomi delle metriche per le quote e i limiti di sistema utilizzando la console o gcloud CLI. Google Cloud
Console
Nella Google Cloud console, vai alla pagina IAM e amministrazione > Quote e limiti di sistema:
Vai a Quote e Limiti di sistema
La tabella in questa pagina mostra le quote e i limiti di sistema che hanno un utilizzo o valori aggiustati e una voce di riferimento per le altre quote. La voce di riferimento contiene la parola "default" tra parentesi alla fine dell'elenco nella colonna Nome. Ad esempio,
SetIAMPolicy requests per minute per region (default)è la voce di riferimento per la quotaSetIamPolicyRequestsPerMinutePerProject.Se non vedi la colonna Metrica, segui questi passaggi.
- Fai clic su Opzioni di visualizzazione delle colonne.
- Seleziona Metrica.
- Fai clic su OK. La colonna Metrica viene visualizzata nella tabella.
La colonna Metrica mostra i nomi delle metriche. Per filtrare i risultati, inserisci il nome o il valore di una proprietà nel campo accanto a Filtro.
gcloud
Per recuperare i nomi delle metriche per un Google Cloud servizio utilizzando
gcloud CLI, esegui il quotas info list
comando. Per ignorare le righe che non elencano i nomi delle metriche, passa l'output a un
comando come grep con metric: come termine di ricerca oppure utilizza il
flag
--format di gcloud CLI:
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Sostituisci quanto segue:
PROJECT_ID_OR_NUMBER: l'ID progetto o il numero di progetto.SERVICE_NAME: il nome del servizio di cui vuoi visualizzare le metriche delle quote, ad esempio il nome del servizio per Compute Engine ècompute.googleapis.com. Includi la partegoogleapis.comdel nome del servizio.