Best practice per i servizi Cloud Run ottimizzati per i costi

Questa pagina spiega alcuni aspetti da considerare durante la configurazione dei servizi Cloud Run. Non esiste una soluzione universale per l'ottimizzazione dei costi. È importante monitorare le tue esigenze, il budget e le risorse per determinare la soluzione migliore per te.

Le best practice descritte in questo documento sono specifiche per Cloud Run. Questi non includono altri Google Cloud prodotti.

Configurazioni delle risorse

L'ottimizzazione dei servizi in termini di costi richiede la valutazione di molte configurazioni diverse. Personalizza queste configurazioni in base alle tue esigenze per creare servizi affidabili ed efficienti in termini di costi.

Seleziona la regione appropriata

La località di deployment del servizio influisce sul costo totale. Cloud Run utilizza un modello di prezzi regionale a due livelli. Le regioni di livello 1 offrono un costo inferiore per vCPU e memoria rispetto alle regioni di livello 2, quindi valuta la possibilità di eseguire il deployment in una regione di livello 1.

Richiedi autenticazione

Quando configuri un servizio Cloud Run, puoi scegliere una delle due opzioni di autenticazione:

  • Consenti accesso pubblico: non sono necessari controlli di autenticazione.
  • Autenticazione necessaria: solo gli utenti autenticati possono accedere al tuo servizio Cloud Run.

Ti consigliamo di richiedere l'autenticazione, a meno che tu non abbia la necessità specifica di consentire l'accesso pubblico. In questo modo, si evitano richieste indesiderate che potrebbero comportare costi.

Se gestisci gli utenti con Identity-Aware Proxy (IAP), IAP potrebbe avere costi associati.

Confrontare la fatturazione basata su istanze e quella basata su richieste

I servizi Cloud Run hanno due impostazioni di fatturazione:

  • Fatturazione basata sulle richieste (impostazione predefinita): ti viene addebitato un costo per richiesta, oltre a una tariffa al secondo più elevata per vCPU e memoria utilizzate durante l'elaborazione delle richieste.
  • Fatturazione basata sulle istanze: ti vengono addebitati i costi per l'intera durata di un'istanza. Non è previsto alcun costo per richiesta e le tariffe al secondo per vCPU e memoria sono inferiori.

Per i servizi con traffico costante e a variazione lenta, valuta la possibilità di utilizzare la fatturazione basata sulle istanze. Il risparmio derivante da tariffe di calcolo più basse e dall'assenza di commissioni per richiesta supera il costo del pagamento del tempo di inattività tra le richieste. Per i servizi con traffico sporadico, a raffica o a picchi, valuta la possibilità di utilizzare la fatturazione basata sulle richieste. Se non sai ancora quale impostazione di fatturazione utilizzare, consulta la sezione Motore per suggerimenti. Recommender esamina il traffico ricevuto dal tuo servizio Cloud Run nell'ultimo mese e fornisce consigli per passare dalla fatturazione basata sulle richieste a quella basata sulle istanze, se è più conveniente.

Configura lo scaling del servizio a livello di servizio

Per stabilire una base di riferimento per la sicurezza dei costi, configura il numero massimo di istanze per il tuo servizio. L'impostazione di un numero massimo più elevato dà la priorità alla disponibilità, ma introduce potenziali rischi di fatturazione dovuti a picchi di traffico imprevisti o configurazioni errate. Devi configurare questa impostazione a livello di servizio quando esegui il deployment iniziale del servizio per stabilire una base di riferimento dei costi. Per altri strumenti di controllo dei costi, consulta quote di allocazione delle risorse o budget e avvisi di fatturazione.

Ottimizzare l'utilizzo di CPU e memoria

Il costo del tuo servizio Cloud Run è influenzato dalla configurazione di CPU/memoria e dalla durata di attività del servizio, tra gli altri fattori. Il provisioning eccessivo delle risorse può aumentare i costi. Per determinare quale configurazione potrebbe essere la migliore per il tuo servizio:

  1. Stabilisci una configurazione di base.
  2. Monitora le metriche durante il test delle metriche di utilizzo di CPU e memoria in Cloud Monitoring.
  3. Modifica la configurazione in base alle esigenze.

Se l'utilizzo della CPU è costantemente basso in condizioni di carico di lavoro di picco, valuta la possibilità di ridurre l'allocazione delle vCPU. Se la latenza è elevata, valuta la possibilità di aumentare l'allocazione di vCPU.

Se l'utilizzo della memoria è costantemente basso, valuta la possibilità di ridurre la memoria allocata. Se la latenza è elevata e l'utilizzo della memoria è vicino al 100%, valuta la possibilità di aumentare la memoria allocata. Se si verificano errori di esaurimento della memoria (OOM), devi aumentare la memoria allocata o modificare l'applicazione per evitare perdite di memoria o utilizzare meno memoria. Consulta la dashboard di Cloud Monitoring per comprendere meglio l'utilizzo della memoria.

Configura la GPU

Tutti i servizi Cloud Run che utilizzano GPU devono avere configurata la fatturazione basata sulle istanze. Ciò significa che le istanze Cloud Run vengono addebitate per l'intero ciclo di vita delle istanze, anche quando non ci sono richieste in entrata. Le configurazioni minime di CPU e memoria richieste per le GPU influiscono anche sul costo del servizio Cloud Run. Per impostazione predefinita, la ridondanza zonale della GPU è attiva. La disattivazione della ridondanza a livello di zona della GPU comporta un costo inferiore per secondo-GPU, ma non garantisce la capacità riservata per gli scenari di failover.

Ottimizzare i costi di networking

Quando configuri le opzioni di rete per il tuo servizio, considera quanto segue:

  • Colloca le risorse: prova a eseguire il deployment dei servizi Cloud Run nella stessa regione dei database di backend (come Cloud SQL o Firestore) e dei bucket Cloud Storage. Il trasferimento di dati tra Google Cloud risorse all'interno della stessa regione è senza costi.
  • Passa all'uscita VPC diretto: se indirizzi in modo sicuro il traffico alle risorse di rete VPC interne, valuta la possibilità di passare all'uscita VPC diretto dai connettori di accesso VPC serverless. Il traffico di rete in uscita VPC diretto viene scalato a zero, eliminando l'overhead di calcolo di base e i costi di inattività associati alle istanze del connettore.
  • Utilizza Cloud CDN: esegui l'offload degli asset statici e dei contenuti altamente memorizzabili nella cache inserendo Cloud CDN davanti ai tuoi servizi Cloud Run. La pubblicazione dei dati dall'edge è molto più economica rispetto al pagamento del traffico internet in uscita standard direttamente da Cloud Run.
  • Monitora il traffico internet in uscita: il traffico in entrata (ingresso) è sempre senza costi e ricevi 1 GiB di trasferimento di dati internet in uscita senza costi al mese in Nord America. Concentra i tuoi sforzi di monitoraggio sul traffico in uscita che supera i confini della regione o supera il livello senza costi.

Configura le impostazioni di concorrenza

Quando più istanze elaborano le richieste, Cloud Run alloca più CPU e memoria a costi più elevati. Un'impostazione di concorrenza più elevata consente a un numero inferiore di istanze di gestire lo stesso volume di richieste, il che può ridurre i costi. Tuttavia, il codice dell'applicazione deve essere in grado di gestire le richieste parallele in modo efficiente. Per saperne di più, consulta Ottimizzazione della concorrenza per la scalabilità automatica e l'utilizzo delle risorse.

Sconti per impegno di utilizzo

Gli sconti per impegno di utilizzo (CUD) offrono prezzi scontati in cambio dell'impegno a utilizzare continuamente Cloud Run per un periodo di tempo specificato. I CUD vengono applicati a livello di account di fatturazione Cloud. Puoi acquistare sconti per impegno di utilizzo (CUD) flessibili di Compute per le risorse Cloud Run. Gli sconti per utilizzo flessibile di Compute non si applicano a GPU o networking. Per saperne di più, consulta la pagina relativa allo sconto per impegno di utilizzo flessibile di Compute.

Strumenti utili

Puoi utilizzare i seguenti strumenti per comprendere meglio i costi e per evitare superamenti del budget.

Panoramica di Cloud Run: pannello di fatturazione

La pagina Panoramica di Cloud Run mostra i costi per nome risorsa nel pannello Fatturazione. I numeri riflettono i costi lordi per gli intervalli di tempo selezionati per risorsa. Questo strumento ti aiuta a comprendere meglio il costo delle tue risorse.

Avvisi relativi al budget

Crea avvisi di budget in fatturazione Cloud per monitorare i costi effettivi rispetto a quelli pianificati. Un budget è un meccanismo di avviso che attiva le notifiche quando vengono superate le soglie di spesa, non un limite di spesa rigido. Si verifica un ritardo nei dati di fatturazione che potrebbe influire sul momento in cui ricevi gli avvisi.

Cloud Billing

La fatturazione Cloud è una raccolta di strumenti che ti aiutano a monitorare e comprendere la tua spesa per Google Cloud . Questi strumenti ti aiutano a monitorare i costi di utilizzo, prevedere le spese e identificare le opportunità per risparmiare sui costi.

Esplora costi

Cost Explorer ti consente di comprendere il costo e l'utilizzo delle tue risorse. Utilizza Esplora costi per:

  • Filtra le risorse in base al costo per vedere quali sono le più costose.
  • Comprendere la percentuale dei costi determinata da configurazioni come vCPU, GPU, rete e altro ancora.
  • Monitora l'impatto delle modifiche alla configurazione delle risorse sulla fattura mensile.

Google Cloud calcolatore prezzi

La Google Cloud panoramica dei prezzi contiene informazioni per comprendere meglio il modello di prezzi di Google Cloud . È qui che puoi trovare anche il Listino prezzi dettagliato. Puoi stimare i costi aggiungendo e configurando i prodotti utilizzando il Calcolatore prezzi.

Motore per suggerimenti

Recommender è uno strumento che fornisce suggerimenti e approfondimenti sull'utilizzo dei prodotti Cloud.

Recommender esamina automaticamente il traffico ricevuto dal tuo servizio Cloud Run nell'ultimo mese e consiglia di passare dalla fatturazione basata sulle richieste a quella basata sulle istanze, se questa è più economica.

Ottimizzazione di Cloud Hub

Puoi visualizzare i dati di riepilogo sui costi, i dati di utilizzo e i suggerimenti per l'ottimizzazione dei costi per i servizi Google Cloud nella pagina Ottimizzazione di Cloud Hub.