Configurare i servizi Cloud Run

Questa pagina fornisce una panoramica delle opzioni di configurazione per i servizi Cloud Run. Queste configurazioni sono elencate nell'ordine in cui vengono visualizzate nella console Google Cloud quando esegui il deployment di un nuovo servizio.

Configura le impostazioni a livello di servizio

Configura le impostazioni a livello di servizio, ad esempio le impostazioni di fatturazione e scalabilità.

Fatturazione

Utilizza le impostazioni di fatturazione per controllare la modalità di addebito, ovvero per richiesta e solo quando l'istanza elabora una richiesta oppure per l'intero ciclo di vita dell'istanza.

Scalabilità del servizio

Puoi impostare il servizio sulla scalabilità automatica o manuale, a seconda del livello di controllo che ti serve sul comportamento di scalabilità.

Quando utilizzi la scalabilità automatica, ogni revisione di Cloud Run viene scalata automaticamente al numero di istanze necessarie per gestire tutte le richieste in entrata, gli eventi o l'utilizzo della CPU. Puoi controllare il numero di istanze create dal tuo servizio Cloud Run per gestire le richieste impostando numero massimo di istanze e numero minimo di istanze. Puoi evitare gli avvii a freddo della tua applicazione e ridurne la latenza impostando un numero minimo di istanze. L'impostazione di un numero massimo di istanze può contribuire a contenere i costi e a proteggerti da livelli anomali di richieste elevate.

La scalabilità manuale ti consente di impostare un conteggio delle istanze specifico, indipendentemente dal traffico o dall'utilizzo e senza richiedere il redeploy. Per impostazione predefinita, Cloud Run esegue automaticamente lo scale out fino a un numero massimo di istanze specificato o predefinito. Tuttavia, per alcuni casi d'uso, potresti voler impostare un numero specifico di istanze.

Container: impostazione

Personalizza il servizio configurando capacità, GPU, controlli di integrità, timeout e l'ambiente di esecuzione.

Capacità

Puoi controllare la quantità di memoria e CPU che un servizio può utilizzare.

GPU

Se devi ospitare carichi di lavoro di AI, come modelli di inferenza e addestramento di modelli, puoi configurare i servizi Cloud Run con o senza GPU.

Controlli di integrità

Cloud Run ti consente di configurare due tipi di probe di controllo di integrità. Uno dei probe determina quando i container sono pronti ad accettare il traffico, mentre l'altro determina se riavviare il container. Scopri di più sui controlli di integrità dei container.

Timeout

Puoi impostare un timeout della richiesta Cloud Run che specifica il tempo entro il quale deve essere restituita una risposta.

Concorrenza massima

Puoi configurare il numero massimo di richieste in parallelo per istanza. Puoi aumentare questo valore fino a un massimo di 1000.

Ambiente di esecuzione

Cloud Run ha due ambienti di esecuzione. Scopri le differenze tra i due ambienti di esecuzione.

Container: variabili e secret

Configura le variabili di ambiente e i secret per gestire in modo sicuro il tuo servizio.

Variabili di ambiente

Puoi creare coppie chiave-valore da utilizzare con il servizio Cloud Run. Per saperne di più, consulta Configurare le variabili di ambiente per i servizi.

Secret

Puoi utilizzare Secret Manager con Cloud Run per archiviare in modo sicuro chiavi API, password e altre informazioni sensibili. Per saperne di più, consulta Configurare i secret.

Container: montaggi volumi

I montaggi dei volumi di Cloud Run ti consentono di accedere ai dati condivisi archiviati in un file system locale, ad esempio i contenuti di un bucket di archiviazione o di un file server, dal tuo container. Puoi montare un bucket Cloud Storage, una condivisione NFS come un'istanza Filestore o un file system in memoria fornito da Cloud Run.

Networking: suddivisione del traffico

Ogni volta che esegui il deployment o il redeployment di un servizio, viene creata automaticamente una nuova revisione del servizio Cloud Run sottostante. Per ulteriori dettagli, consulta Affinità sessione e suddivisione del traffico.

Sicurezza: identità di servizio

L'identità del servizio Cloud Run è il account di servizio utilizzato come account autenticato per accedere alle APIGoogle Cloud dal container dell'istanza Cloud Run. Ti consigliamo di creare un account di servizio e di determinare l'insieme minimo di autorizzazioni di cui il account di servizio ha bisogno per accedere a risorse Google Cloudspecifiche.

Post-deployment

Una volta eseguito il deployment del servizio, puoi continuare a configurarlo in base alle tue esigenze.

Etichette

Le etichette Cloud Run sono coppie chiave/valore che puoi applicare a servizi, revisioni e funzioni Cloud Run. Le etichette ti aiutano a organizzare le risorse Cloud Run e a gestire i costi su larga scala con la granularità di cui hai bisogno.

Le etichette che hai impostato in precedenza per le tue funzioni Cloud Run utilizzando i comandi gcloud functions o l'API Cloud Functions v2 vengono propagate a Cloud Run quando esegui il deployment delle funzioni in Cloud Run.

Consigli

Consulta Ottimizzare con Recommender per scoprire le ottimizzazioni fornite da Recommender su Cloud Run.

Servizi di tagging

I tag sono coppie chiave-valore che puoi applicare alle risorse per un controllo dell'accesso granulare utilizzando la console Cloud Run.

Gli amministratori dei tag creano tag per le risorse in Google Cloud a livello di organizzazione o progetto. I tag forniscono un modo per consentire o negare in modo condizionale i criteri a seconda che una risorsa abbia un tag specifico. Per saperne di più, consulta Servizi di tagging.