Cette page explique certains aspects à prendre en compte lors de la configuration de vos services Cloud Run. Il n'existe pas de solution unique pour optimiser les coûts. Il est important de surveiller vos besoins, votre budget et vos ressources pour déterminer ce qui vous convient le mieux.
Les bonnes pratiques décrites dans ce document sont spécifiques à Cloud Run. Ces frais n'incluent pas les autres produits Google Cloud .
Configuration de ressources
L'optimisation des coûts de vos services implique de prendre en compte de nombreuses configurations différentes. Adaptez ces configurations à vos besoins pour créer des services fiables et rentables.
Sélectionner la région appropriée
L'emplacement de déploiement de votre service a un impact sur votre coût total. Cloud Run utilise un modèle de tarification régional à deux niveaux. Les régions de niveau 1 offrent un coût par processeur virtuel et par mémoire inférieur à celui des régions de niveau 2. Pensez donc à déployer votre application dans une région de niveau 1.
Exiger l'authentification
Lorsque vous configurez un service Cloud Run, vous pouvez choisir l'une des deux options d'authentification suivantes :
- Autoriser l'accès public : les vérifications d'authentification ne sont pas requises.
- Exiger une authentification : seuls les utilisateurs authentifiés peuvent accéder à votre service Cloud Run.
Nous vous recommandons d'exiger l'authentification, sauf si vous avez un besoin spécifique d'autoriser l'accès public. Cela permet d'éviter les demandes indésirables qui pourraient entraîner des coûts.
Si vous gérez les utilisateurs avec Identity-Aware Proxy (IAP), des coûts peuvent être associés à IAP.
Comparer la facturation basée sur les instances et celle basée sur les requêtes
Les services Cloud Run comportent deux paramètres de facturation :
- Facturation basée sur les requêtes (par défaut) : vous êtes facturé par requête, en plus d'un tarif par seconde plus élevé pour les processeurs virtuels et la mémoire consommés lors du traitement des requêtes.
- Facturation basée sur les instances : vous êtes facturé pour toute la durée de vie d'une instance. Aucuns frais par requête ne sont appliqués, et les tarifs à la seconde pour les vCPU et la mémoire sont plus bas.
Pour les services dont le trafic est stable et varie lentement, envisagez d'utiliser la facturation basée sur les instances. Les économies réalisées grâce à des tarifs de calcul plus bas et à l'absence de frais par requête compensent le coût du temps d'inactivité entre les requêtes. Pour les services dont le trafic est sporadique, par pics ou par rafales, envisagez d'utiliser la facturation basée sur les requêtes. Si vous ne savez toujours pas quel paramètre de facturation utiliser, consultez la section Outil de recommandation. L'outil de recommandation examine le trafic reçu par votre service Cloud Run au cours du mois passé et fournit des recommandations pour passer de la facturation basée sur les requêtes à la facturation basée sur les instances, si cela est moins cher.
Configurer le scaling de service au niveau du service
Pour établir une référence de sécurité des coûts, configurez le nombre maximal d'instances pour votre service. Définir un nombre maximal plus élevé donne la priorité à la disponibilité, mais présente des risques potentiels de facturation en cas de pics de trafic inattendus ou de configurations incorrectes. Vous devez configurer ce paramètre au niveau du service lorsque vous déployez initialement votre service pour établir une référence de coût. Pour découvrir d'autres outils de contrôle des coûts, consultez les quotas d'allocation des ressources ou les budgets et alertes de facturation.
Optimiser l'utilisation du processeur et de la mémoire
Le coût de votre service Cloud Run dépend, entre autres, de sa configuration de processeur/mémoire et de la durée pendant laquelle il est actif. Le surprovisionnement de vos ressources peut augmenter vos coûts. Pour déterminer la configuration la mieux adaptée à votre service :
- Établissez une configuration de référence.
- Surveillez vos métriques tout en testant les métriques d'utilisation du processeur et de la mémoire dans Cloud Monitoring.
- Ajustez votre configuration si nécessaire.
Si l'utilisation du processeur est toujours faible en cas de charge maximale, envisagez de réduire l'allocation de processeurs virtuels. Si la latence est élevée, envisagez d'augmenter l'allocation de processeurs virtuels.
Si l'utilisation de la mémoire est toujours faible, envisagez de réduire la mémoire allouée. Si la latence est élevée et que l'utilisation de la mémoire est proche de 100 %, envisagez d'augmenter la mémoire allouée. Si vous rencontrez des erreurs de mémoire insuffisante (OOM, Out Of Memory), vous devez augmenter la mémoire allouée ou modifier votre application pour éviter les fuites de mémoire ou utiliser moins de mémoire. Consultez le tableau de bord Cloud Monitoring pour mieux comprendre votre utilisation de la mémoire.
Configurer un GPU
Tous les services Cloud Run qui utilisent des GPU doivent être configurés avec la facturation basée sur les instances. Cela signifie que les instances Cloud Run sont facturées pendant tout leur cycle de vie, même lorsqu'il n'y a aucune requête entrante. Les configurations minimales de processeur et de mémoire requises pour les GPU ont également une incidence sur le coût de votre service Cloud Run. Par défaut, la redondance zonale des GPU est activée. Si vous désactivez la redondance zonale des GPU, le coût par seconde et par GPU sera moins élevé, mais la capacité réservée pour les scénarios de basculement ne sera pas garantie.
Optimiser les coûts de mise en réseau
Lorsque vous configurez les options de mise en réseau de votre service, tenez compte des points suivants :
- Colocalisez vos ressources : essayez de déployer vos services Cloud Run dans la même région que vos bases de données de backend (comme Cloud SQL ou Firestore) et vos buckets Cloud Storage. Le transfert de données entre les ressources Google Cloud d'une même région est sans frais.
- Passer à la sortie VPC directe : si vous acheminez le trafic de manière sécurisée vers des ressources de réseau VPC internes, envisagez de passer des connecteurs d'accès au VPC sans serveur à la sortie VPC directe. La sortie VPC directe passe à zéro, ce qui élimine les frais généraux de calcul de base et les coûts d'inactivité associés aux instances de connecteur.
- Utiliser Cloud CDN : décharger les éléments statiques et le contenu hautement cachable en plaçant Cloud CDN devant vos services Cloud Run. La diffusion de données depuis le périphérie est beaucoup moins chère que le paiement de la sortie Internet standard directement depuis Cloud Run.
- Surveiller la sortie Internet : le trafic entrant (entrée) est toujours sans frais, et vous bénéficiez de 1 Gio de transfert de données Internet sortant sans frais par mois en Amérique du Nord. Concentrez vos efforts de surveillance sur le trafic sortant qui dépasse les limites régionales ou le niveau sans frais.
Configurer les paramètres de simultanéité
Plus il y a d'instances qui traitent des requêtes, plus Cloud Run alloue de ressources processeur et de mémoire, ce qui entraîne des coûts plus élevés. Un paramètre de simultanéité plus élevé permet à un nombre réduit d'instances de gérer le même volume de requêtes, ce qui peut réduire les coûts. Toutefois, le code de l'application doit être en mesure de gérer efficacement les requêtes parallèles. Pour en savoir plus, consultez Régler la simultanéité pour l'autoscaling et l'utilisation des ressources.
Remises sur engagement d'utilisation
Les remises sur engagement d'utilisation vous permettent de bénéficier de prix réduits en échange de votre engagement à utiliser Cloud Run de manière continue pendant une période spécifiée. Les CUD s'appliquent au niveau du compte de facturation Cloud. Vous pouvez souscrire des remises sur engagement d'utilisation flexibles Compute pour les ressources Cloud Run. Les remises flexibles sur l'utilisation calculée ne s'appliquent pas aux GPU ni à la mise en réseau. Pour en savoir plus, consultez Remise flexible sur engagement d'utilisation Compute.
Outils utiles
Vous pouvez utiliser les outils suivants pour mieux comprendre vos coûts et éviter les dépassements.
Présentation de Cloud Run : panneau "Facturation"
La page de présentation de Cloud Run affiche les coûts par nom de ressource dans le panneau "Facturation". Les chiffres reflètent les coûts bruts pour les périodes sélectionnées par ressource. Cet outil vous aide à mieux comprendre le coût de vos ressources.
Alertes budgétaires
Créez des alertes de budget dans Cloud Billing pour suivre vos coûts réels par rapport à vos coûts planifiés. Un budget est un mécanisme d'alerte qui déclenche des notifications lorsque des seuils de dépenses sont dépassés. Il ne s'agit pas d'un plafond de dépenses strict. Il existe un délai de traitement des données de facturation qui peut avoir un impact sur le moment où vous recevez les alertes.
Cloud Billing
Cloud Billing est un ensemble d'outils qui vous aident à suivre et à comprendre vos dépenses Google Cloud . Ces outils vous aident à surveiller vos coûts d'utilisation, à prévoir vos dépenses et à identifier les opportunités de réduction des coûts.
Explorateur de coûts
L'explorateur de coûts vous permet de comprendre le coût et l'utilisation de vos ressources. L'explorateur de coûts vous permet de :
- Filtrez vos ressources par coût pour identifier celles qui sont les plus coûteuses.
- Comprenez la part des coûts générés par les configurations telles que les vCPU, les GPU, la mise en réseau, etc.
- Suivez l'impact des modifications apportées à la configuration de vos ressources sur votre facture mensuelle.
Google Cloud simulateur de coût
La Google Cloud présentation des tarifs vous aidera à mieux comprendre le modèle de tarification de Google Cloud . C'est également là que vous trouverez la liste détaillée des prix. Vous pouvez estimer vos coûts en ajoutant et en configurant des produits à l'aide du simulateur de coût.
Outil de recommandation
L'outil de recommandation fournit des recommandations d'utilisation et des insights pour les produits Cloud.
L'outil de recommandation examine automatiquement le trafic reçu par votre service Cloud Run au cours du mois passé et recommande de passer de la facturation basée sur les requêtes à la facturation basée sur les instances, si cela est moins cher.Optimisation de Cloud Hub
Vous pouvez consulter des données récapitulatives sur les coûts et l'utilisation, ainsi que des recommandations d'optimisation des coûts pour les services Google Cloud sur la page Optimisation de Cloud Hub.