Quote e limiti di Cloud Run

Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.

Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.

Non è previsto un limite diretto per quanto segue:

  • Le dimensioni delle immagini container di cui puoi eseguire il deployment.
  • Il numero di richieste simultanee gestite da un servizio Cloud Run.

Limiti di risorse per Cloud Run

Per superare i limiti che possono essere aumentati, richiedi un aumento della quota. Per superare i limiti per progetto che non possono essere aumentati, crea nuove risorse in un progetto o una regione Google Cloud diversi.

Risorsa Descrizione Limite Ambito Aumentabile
Servizio Numero massimo di servizi 1000 per progetto e regione No
Job Numero massimo di job 1000 per progetto e regione No
Pool di worker Numero massimo di pool di worker 1000 per progetto e regione No
Esecuzione del job Numero massimo di esecuzioni del job in corso 1000 per progetto e regione No
Revisione Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico 1000 per servizio No
Revisione Numero massimo di revisioni che gestiscono il traffico 4000 per progetto e regione No
Tag di revisione Numero massimo di tag di revisione. Quando il limite di tag di revisione viene superato, Cloud Run esegue la pulizia dei tag sul servizio. Per il servizio per cui viene creato un nuovo tag, i tag che non hanno una percentuale di traffico specificata vengono eliminati automaticamente in ordine cronologico. 2000 per progetto e regione No
Esecuzione del job Limite di conservazione per le esecuzioni dei job completate. Quando il numero di esecuzioni completate per un job raggiunge questo limite, le esecuzioni vengono eliminate automaticamente in ordine cronologico 1000 per lavoro No
Attività di esecuzione del job1 Numero massimo di attività in esecuzione in parallelo Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. Puoi visualizzare la tua quota nella pagina della console Quote e limiti di sistema. per esecuzione del job
Attività di esecuzione del job Valore di timeout massimo delle attività 168 ore (7 giorni) o 1 ora se utilizzi le GPU per esecuzione del job No
Attività di esecuzione del job Numero massimo di attività in un singolo job 10.000 per esecuzione del job No
Attività di esecuzione del job Numero massimo di nuovi tentativi per un'attività in un job 10 per esecuzione del job No
Variabili di ambiente Numero massimo di variabili di ambiente per ogni container 1000 per lavoro o per servizio No
Argomenti comando Numero massimo di argomenti del comando per ogni container 1000 per lavoro o per servizio No
Istanza di container3 Numero massimo di istanze di container che utilizzano l'uscita VPC diretta 100-200, a seconda delle configurazioni della regione selezionata. per revisione e regione
Istanza di container Timeout Startup, in minuti 4 per istanza di container No
Memoria Dimensioni massime della memoria, in GiB 32 per istanza di container No
CPU Numero massimo di vCPU 8 per istanza di container No
CPU1 CPU totale massima, in millivCPU, allocata in tutte le istanze in un periodo di 1 minuto. Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. per progetto e regione
Memoria1 Memoria totale massima, in byte, allocata in tutte le istanze in un periodo di 1 minuto. Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. Puoi visualizzare la tua quota nella pagina della console Quote e limiti di sistema. per progetto e regione
Istanza GPU senza garanzia di ridondanza a livello di zona1, 4 Numero massimo di istanze di container con GPU 04 per progetto per regione
Istanza GPU con garanzia di ridondanza a livello di zona1, 4 Numero massimo di istanze di container con GPU 04 per progetto per regione
Disco Dimensioni massime del filesystem in memoria scrivibile, limitate dalla memoria dell'istanza, in GiB 32 per istanza di container No
Variabile di ambiente Lunghezza variabile massima, in kB 32 per variabile No
Mappatura dei domini Numero massimo di certificati SSL 50 per dominio principale e per settimana No
Mappatura dei domini Numero massimo di certificati SSL duplicati 5 per dominio principale e per settimana No
Token di accesso Numero massimo di token di accesso univoci generati 50 per istanza di container al secondo No
Token di identità Numero massimo di token di identità univoci generati 50 per istanza di container al secondo No
File aperti Il numero massimo di file che possono essere aperti contemporaneamente. Corrisponde a
/proc/sys/fs/file-max.
25000 per istanza di container No

1Queste quote regionali vengono utilizzate in alcuni casi in cui ciascuna controlla:

  1. Il valore massimo che può essere scelto per l'attributo istanza massima di una revisione. Una volta concessa in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

  2. Il parallelismo massimo di un job. Una volta concessa in una determinata regione, tutti i job in quella regione possono raggiungere il limite concesso.

  3. Il numero totale di istanze container per l'esecuzione di job in una regione.

3Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere scelto per l'attributo istanza massima di una revisione che utilizza l'uscita VPC diretto. Una volta concessa in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

  2. Controlla il parallelismo massimo di un job che utilizza l'uscita VPC diretto. Una volta concessa in una determinata regione, tutti i job in quella regione possono raggiungere il limite concesso.

4 Ai nuovi progetti che creano un servizio con GPU L4 verranno concessi automaticamente 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Puoi anche richiedere la quota NvidiaL4GpuAllocPerProjectRegion o NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Se l'utilizzo di picco della GPU non si avvicina alla quota, Google potrebbe ridurla.

Limiti di networking per Cloud Run

Limiti delle richieste per Cloud Run

Descrizione Limite Note
Numero massimo di richieste in parallelo per istanza 1000
Numero massimo di flussi simultanei per connessione client HTTP/2 100
Tempo massimo prima del timeout per richiesta 60 minuti
Dimensione massima della richiesta HTTP/1 32 MiB se utilizzi il server HTTP/1. Nessun limite se utilizzi il server HTTP/2.
Dimensioni massime della risposta HTTP/1 32 MiB se non utilizzi Transfer-Encoding: chunked o meccanismi di streaming
Numero massimo di connessioni aperte per istanza per tipo di uscita (internet o VPC) 50000 Non si applica al traffico in uscita VPC diretto.
Connessioni in uscita al secondo per istanza 700 Non si applica al traffico in uscita VPC diretto inviato alla rete VPC, che non è limitato.
Connessioni in uscita al minuto per istanza 5000 Non si applica al traffico in uscita VPC diretto inviato alla rete VPC, che non è limitato.
Risoluzioni DNS in uscita al secondo per istanza 1000
Richieste in entrata al secondo a una porta container HTTP/1 per istanza 800 Non si applica alle porte dei container HTTP/2.

Limiti di larghezza di banda per Cloud Run

Alle istanze Cloud Run si applicano i seguenti limiti di larghezza di banda:

Descrizione Limite Note
Numero massimo di bit per istanza per l'uscita tramite VPC diretto 1 Gbps Traffico in uscita tramite VPC diretto in uscita verso destinazioni sulla rete VPC.
Numero massimo di bit per istanza, escluso l'uscita tramite VPC diretto 600 Mbps In base alla somma dei bit in entrata e in uscita, escluso il traffico in uscita tramite VPC diretto in uscita verso le destinazioni sulla rete VPC.
Quantità massima totale di pacchetti per istanza, escluso l'output su VPC diretto 64.000 pacchetti al secondo In base alla somma dei pacchetti in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretto verso le destinazioni sulla rete VPC.

Se viene raggiunto uno dei due limiti, l'istanza Cloud Run avrà una larghezza di banda limitata.

Limiti di frequenza dell'API Cloud Run Admin

I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.

Quota Descrizione Limite Aumentabile Ambito
Richieste di lettura all'API Cloud Run Admin Numero di letture dell'API per 60 secondi per regione. Non riguarda il numero di richieste di lettura ai servizi Cloud Run, per cui non sono previsti limiti. 3000 per 60 secondi per progetto e regione
Richieste di scrittura all'API Cloud Run Admin Numero di scritture dell'API per 60 secondi per regione. Non riguarda il numero di richieste di scrittura ai servizi Cloud Run, per cui non sono previsti limiti. 180 per 60 secondi per progetto e regione
Esecuzione del job Numero massimo di volte in cui un job può essere eseguito ogni 60 secondi per regione. 180 per 60 secondi per progetto e regione

Come aumentare la quota

Le richieste di adeguamento delle quote cloud sono soggette a revisione. Se la richiesta di adeguamento della quota richiede la revisione, riceverai un'email di conferma della ricezione della richiesta. Se hai bisogno di ulteriore assistenza, rispondi all'email. Dopo aver esaminato la richiesta, riceverai una notifica via email indicante se la richiesta è stata approvata. Puoi richiedere un aggiustamento della quota utilizzando la console Google Cloud , l'API Cloud Quotas o Google Cloud CLI. Le seguenti istruzioni mostrano come richiedere un nuovo valore di quota utilizzando la console Google Cloud o effettuando una richiesta REST all'API Cloud Quotas.

Console

Per richiedere una modifica della quota:

  1. Nella console Google Cloud , vai alla pagina IAM e amministrazione > Quote e limiti di sistema:

    Vai a Quote e Limiti di sistema

    Se ti viene chiesto di selezionare un progetto, seleziona quello che vuoi modificare.

  2. Trova la quota che vuoi modificare e apri la finestra di dialogo Modifiche alla quota:

    • Quote non presenti nella tabella:

      • Cerca la quota nella casella di ricerca Filtra. Non specificare la regione o la zona (se applicabile) perché le quote che non hanno valori di utilizzo o aggiustati non vengono visualizzate nella tabella.
      • Individua eventuali voci relative alla tua quota nella tabella. Può trattarsir della voce predefinita o di qualsiasi voce con cronologia, indipendentemente dalla regione o dalla zona.
      • Nella riga della voce, fai clic su Altre azioni > Configura regioni/zone aggiuntive.
      • Seleziona la regione o la zona che vuoi regolare. Fai clic su Modifica.
    • Tutte le altre quote:

      • Cerca la quota nella casella di ricerca Filtra.
      • Nella riga relativa alla voce, seleziona la casella di controllo per la quota.
      • Fai clic su Modifica.

    Viene visualizzata la finestra di dialogo Modifiche alla quota.

  3. Se sopra il campo Nuovo valore vedi un link a Richiedi una quota più alta e vuoi aumentare il valore della quota oltre il numero indicato sullo schermo, segui il link. Compila il modulo, invialo e salta i passaggi rimanenti. In caso contrario, continua a seguire questa guida.

  4. Nel campo Nuovo valore, inserisci il valore desiderato per la quota aumentato. Se viene visualizzato un campo Descrizione della richiesta, inserisci una descrizione. Fai clic su Fine.

    • Se vedi una casella di controllo con il testo "Sono consapevole che questa richiesta rimuoverà eventuali override", il valore della quota è impostato al di sotto del valore predefinito. Se il valore della quota viene impostato su un valore uguale o superiore a quello predefinito, l'override viene rimosso. Per continuare, seleziona la casella di controllo. Scopri di più sugli override della quota.

    Se viene visualizzato un pulsante Avanti, fai clic su Avanti e compila i dati di contatto nella schermata successiva.

  5. Fai clic su Invia richiesta.

Se non riesci a richiedere un adeguamento dalla console, richiedi l'aumento all'assistenza clienti Google Cloud.

Per scoprire di più su come funziona la procedura di aumento della quota, vedi Informazioni sugli aggiustamenti delle quote.

Creazione di batch di richieste per gli aggiustamenti delle quote

Puoi creare richieste batch per gli aggiustamenti delle quote selezionando la casella di controllo per ogni quota da includere. Tuttavia, la creazione di richieste batch può aumentare il tempo necessario a Google Cloud per esaminare la tua richiesta.

Per ridurre i tempi di revisione, raggruppa le richieste di adeguamento della quota per prodotto e area. Ad esempio, se vuoi richiedere adeguamenti alle quote di networking e di VM di Compute Engine, crea una richiesta per le quote di networking e un'altra per le quote di VM di Compute Engine.

REST

Per richiedere un aggiustamento della quota dall'API Cloud Quotas, utilizza il seguente esempio di codice. Compila i segnaposto modificabili con i tuoi valori. Per informazioni sui campi segnaposto, consulta le descrizioni che seguono l'esempio di codice.

POST projects/PROJECT_NUMBER/locations/global/quotaPreferences?quotaPreferenceId=QUOTA_PREFERENCE_ID {
    "service": "SERVICE_ID",
    "quotaId": "QUOTA_ID",
    "quotaConfig": { "preferredValue": "NEW_QUOTA_VALUE" },
    "dimensions": { "DIMENSION_1": "VALUE_1", "DIMENSION_2": "VALUE_2" },
    "justification": "JUSTIFICATION",
    "contactEmail": "EMAIL"
}

Sostituisci quanto segue:

  • PROJECT_NUMBER: il tuo numero di progetto Google Cloud . Puoi trovare il numero di progetto nella pagina Benvenuto della console Google Cloud o eseguendo il seguente comando gcloud CLI:

    PROJECT=$(gcloud info --format='value(config.project)')
    gcloud projects describe ${PROJECT} --format="value(projectNumber)"
  • QUOTA_PREFERENCE_ID: l'ID della preferenza di quota che stai aggiornando.

  • QUOTA_ID: l'ID della quota che stai aggiornando.

  • SERVICE_ID: l'ID di Google Cloud a cui appartiene la quota che stai modificando. Di solito ha il formato SERVICE_NAME.googleapis.com. Ad esempio, il nome del servizio Compute Engine è compute.googleapis.com.

  • DIMENSION_1: il tipo di dimensione che vuoi modificare, ad esempio region o zone. Puoi includere più dimensioni. Separa ogni dimensione seguendo il suo valore, ad esempio VALUE_1, con una virgola. Per modificare tutte le dimensioni della quota, ometti questa riga.

  • VALUE_1: Il valore della dimensione precedente. Ad esempio, se la dimensione precedente è region, inserisci una regione come us-central1.

  • JUSTIFICATION: Il motivo di questa richiesta.

  • EMAIL: un indirizzo email che può essere utilizzato come contatto, nel caso in cui Google Cloud abbia bisogno di ulteriori informazioni per prendere una decisione prima di poter concedere una quota aggiuntiva.

Esempio di richiesta

Di seguito è riportato un esempio di richiesta di aumento del valore della quota per la quota di Compute Engine PUS-PER-GPU-FAMILY-per-project-region. Richiede un valore di quota di 100 per le macchine della famiglia di GPU NVIDIA_H100 che si trovano nella regione us-central1.

POST projects/123/locations/global/quotaPreferences?quotaPreferenceId=my_quota_preference_ID {
    "service": "compute.googleapis.com",
    "quotaId": "GPUS-PER-GPU-FAMILY-per-project-region",
    "quotaConfig": { "preferredValue": 100 },
    "dimensions": { "region": "us-central1", "gpu_family": "NVIDIA_H100" },
    "justification": "My justification.",
    "contactEmail": "222larabrown@gmail.com"
}