Quote e limiti di sistema

Questo documento elenca le quote e i limiti di sistema che si applicano a Model Armor.

  • Le quote hanno valori predefiniti, ma in genere puoi richiedere degli adeguamenti.
  • I limiti di sistema sono valori fissi che non possono essere modificati.

Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud , le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.

Per saperne di più, consulta la Panoramica delle quote di Cloud.

Quote dell'API Model Armor

La tabella seguente specifica le quote per l'API Model Armor.

Quota Valore
Query API 1200 query al minuto (QPM) per progetto
Richieste a ExternalProcessor 600 QPM per progetto 1

Puoi applicare un valore compreso tra 0 e 1200 QPM per progetto. Per richiedere un aggiustamento, consulta Richiedi un aggiustamento delle quote. Se hai bisogno di una quota superiore a quella predefinita, contatta l'assistenza clienti Google Cloud.

Per informazioni sulle quote relative alle integrazioni di Model Armor con altri servizi, consulta Gestire le quote.

1 Rilevante se integri Model Armor con altri Google Cloud servizi.

Limite di sistema per le dimensioni dell'input

La tabella seguente specifica il limite di sistema per le dimensioni del file o del testo di input. Model Armor ignora i file o il testo che superano questo limite.

Limite di sistema Valore
Tutti i file supportati e il testo 4 MB

Limiti di sistema per i token

Model Armor ha limiti di sistema variabili per i token a seconda del filtro specifico.

Filtro Limite di sistema
Rilevamento di prompt injection e jailbreaking 10.000
AI responsabile 10.000
Materiale pedopornografico 10.000
Sensitive Data Protection 130.000

Quando il prompt o la risposta supera il limite di token, il filtro Sensitive Data Protection restituisce EXECUTION_SKIPPED. Tutti gli altri filtri, se il prompt o la risposta supera il limite di token, restituiscono MATCH_FOUND se vengono trovati contenuti dannosi nei primi 10.000 token o EXECUTION_SKIPPED se non vengono trovati contenuti dannosi nei primi 10.000 token.

Recuperare i nomi delle metriche per le quote e i limiti di sistema

Le quote e i limiti di sistema hanno due tipi di nomi: nomi visualizzati e nomi delle metriche. I nomi visualizzati hanno spazi e maiuscole che li rendono più facili da leggere per gli utenti. I nomi delle metriche sono più spesso in minuscolo e delimitati da trattini bassi anziché da spazi; il formato esatto dipende dal servizio.

Le seguenti istruzioni mostrano come recuperare i nomi delle metriche per le quote e i limiti di sistema utilizzando la console o gcloud CLI. Google Cloud

Console

  1. Nella Google Cloud console, vai alla pagina IAM e amministrazione > Quote e limiti di sistema:

    Vai a Quote e Limiti di sistema

    La tabella in questa pagina mostra le quote e i limiti di sistema che hanno un utilizzo o valori aggiustati e una voce di riferimento per le altre quote. La voce di riferimento contiene la parola "default" tra parentesi alla fine dell'elenco nella colonna Nome. Ad esempio, SetIAMPolicy requests per minute per region (default) è la voce di riferimento per la quota SetIamPolicyRequestsPerMinutePerProject.

  2. Se non vedi la colonna Metrica, segui questi passaggi.

    1. Fai clic su Opzioni di visualizzazione delle colonne.
    2. Seleziona Metrica.
    3. Fai clic su OK. La colonna Metrica viene visualizzata nella tabella.

La colonna Metrica mostra i nomi delle metriche. Per filtrare i risultati, inserisci il nome o il valore di una proprietà nel campo accanto a Filtro.

gcloud

Per recuperare i nomi delle metriche per un Google Cloud servizio utilizzando gcloud CLI, esegui il quotas info list comando. Per ignorare le righe che non elencano i nomi delle metriche, passa l'output a un comando come grep con metric: come termine di ricerca oppure utilizza il flag --format di gcloud CLI:

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

Sostituisci quanto segue:

  • PROJECT_ID_OR_NUMBER: l'ID progetto o il numero di progetto.
  • SERVICE_NAME: il nome del servizio di cui vuoi visualizzare le metriche delle quote, ad esempio il nome del servizio per Compute Engine è compute.googleapis.com. Includi la parte googleapis.com del nome del servizio.