Modèles de provisionnement des instances Compute Engine

Ce document décrit les modèles de provisionnement pour les instances Compute Engine. Pour en savoir plus sur les options de déploiement, consultez Choisir une stratégie de déploiement Compute Engine pour votre charge de travail.

Les modèles de provisionnement déterminent la disponibilité, la durée de vie et le tarif de vos instances. Si vous comprenez bien ces modèles, vous pourrez choisir la meilleure option pour votre charge de travail.

Modèles de provisionnement disponibles

Lorsque vous créez une instance de calcul, vous pouvez spécifier l'un des modèles de provisionnement suivants. Si vous ne spécifiez pas de modèle de provisionnement, Compute Engine utilise le modèle de provisionnement standard par défaut.

  • Standard

  • Spot

  • Démarrage flexible

  • Lié à la réservation

Le tableau suivant vous aide à comparer les cas d'utilisation et les tarifs de chaque modèle de provisionnement :

Standard Spot Démarrage flexible Lié à la réservation
Résumé
  • En fonction de la disponibilité des ressources, vous pouvez immédiatement créer des instances.
  • Vous pouvez contrôler quand arrêter ou supprimer des instances.
  • En fonction de la disponibilité des ressources, vous pouvez immédiatement créer des instances.
  • Vous pouvez contrôler quand arrêter ou supprimer des instances. Toutefois, vous autorisez également Compute Engine à arrêter ou supprimer des instances à tout moment pour récupérer de la capacité.
  • Une fois que vous avez créé un groupe d'instances géré (MIG) zonal, vous demandez à Compute Engine d'ajouter des instances avec des GPU associés au MIG. Compute Engine planifie le provisionnement des instances en fonction de la disponibilité des ressources.
  • Vous pouvez choisir quand supprimer les instances. Toutefois, vous ne pouvez pas les arrêter, les suspendre ni les recréer. Les instances s'exécutent pendant sept jours maximum. Compute Engine les supprime ensuite.
  • Vous pouvez demander à réserver de la capacité à une date ultérieure pour créer des instances avec des GPU associés. Si Google Cloud approuve votre demande, Compute Engine crée une réservation. Au début de la période de réservation, vous pouvez utiliser la réservation en créant des instances de GPU qui correspondent à la réservation.
  • Pendant la période de réservation approuvée, vous pouvez arrêter, redémarrer, supprimer et recréer des instances pour utiliser la réservation selon vos besoins. À la fin de la période de réservation, Compute Engine supprime la réservation, et arrête ou supprime toutes les instances qui l'utilisent.
Cas d'utilisation

Idéal pour les charges de travail qui nécessitent de la stabilité et un fonctionnement continu, telles que les suivantes :

  • Serveurs Web
  • Bases de données
  • Applications d'entreprise
  • Développement et tests

Idéal pour les charges de travail qui peuvent tolérer des interruptions, telles que les suivantes :

  • Traitement par lot
  • Calcul hautes performances (HPC)
  • Intégration continue et déploiement continu (CI/CD)
  • Analyse de données
  • Encodage multimédia
  • Inférence en ligne

Charges de travail nécessitant de la stabilité et devant s'exécuter pendant sept jours maximum, telles que les suivantes :

  • Pré-entraînement de petits modèles
  • Affinage de modèles
  • Simulation HPC
  • Inférence par lot

Idéal pour les charges de travail qui nécessitent de la stabilité et une durée d'exécution spécifique, telles que les suivantes :

  • Pour les charges de travail qui durent jusqu'à 90 jours :

    • Jobs de pré-entraînement de modèles
    • Jobs d'affinage de modèles
    • Charges de travail de simulation HPC
    • Augmentations attendues à court terme des charges de travail d'inférence
  • Pour les charges de travail de plus de 90 jours :

    • Charges de travail d'entraînement
    • Charges de travail d'inférence
Tarification
  • Les instances vous sont facturées au tarif standard. Consultez la page Tarifs des instances de VM.
  • Les frais sont facturés en fonction de la méthode que vous utilisez pour créer des instances :

    • Si vous créez immédiatement des instances, vous payez à l'usage.
    • Si vous créez des instances à l'aide d'une réservation à la demande ou d'une réservation créée automatiquement pour une réservation future, vous êtes facturé(e) tant que la réservation existe. Pour en savoir plus, consultez Facturation des réservations.
  • Vous bénéficiez de remises allant jusqu'à 91 % sur de nombreux types de machines, GPU, TPU et disques SSD locaux. Pour en savoir plus, consultez Tarifs des VM Spot.
  • Vous payez à l'usage.
  • En fonction de la série de machines utilisée par vos instances, vous bénéficiez de la remise suivante :

    • Pour les séries de machines A4, A3 et A2, vous bénéficiez d'une remise de 53 % sur les processeurs virtuels (vCPU), la mémoire et les GPU.
    • Pour la série de machines H4D, vous bénéficiez d'une remise de 25 % sur les vCPU et la mémoire.
    Les autres séries de machines compatibles ne font pas l'objet d'une remise. Pour en savoir plus, consultez Tarifs du programmeur de charge de travail dynamique.
  • Vous payez à l'usage.
Quota Lorsque vous créez une instance, le quota standard s'applique. Lorsque vous créez une instance, le quota préemptif s'applique. Si votre projet ne dispose pas de quota préemptif, le quota standard s'applique. Les crédits du quota sans fraisGoogle Cloud ne s'appliquent pas aux VM Spot. Lorsque le MIG ajoute des instances au groupe, le quota préemptif s'applique. Si votre projet ne dispose pas de quota préemptif, le quota standard s'applique. Le quota ne s'applique pas au modèle de provisionnement lié à une réservation.

Disponibilité et durée de vie des instances

Le tableau suivant indique la disponibilité et la durée de vie des instances de calcul pour chaque modèle de provisionnement :

Standard Spot Démarrage flexible Lié à la réservation
Conditions préalables à la création Aucun prérequis de création. Aucun prérequis de création. Aucun prérequis de création.

Pour créer des instances, vous devez d'abord réserver de la capacité en utilisant l'une des méthodes suivantes :

Compute Engine provisionne la capacité demandée à la date et à l'heure de livraison de votre choix. Vous pouvez ensuite utiliser la capacité en créant des instances.

Séries de machines compatibles Vous pouvez utiliser n'importe quelle série de machines, à l'exception des séries A4X, A4 et A3 Ultra. Vous pouvez utiliser n'importe quelle série de machines, à l'exception des instances A4X, X4 et Bare Metal.

Vous ne pouvez utiliser que les séries de machines suivantes :

Selon la façon dont vous réservez de la capacité pour créer des VM, vous ne pouvez utiliser que les séries de machines suivantes :

Disponibilité des instances Vous pouvez créer des instances à tout moment, à condition que les ressources que vous demandez soient disponibles. Vous pouvez créer des instances à tout moment, à condition que les ressources que vous demandez soient disponibles.

Vous pouvez créer des instances comme suit :

Compute Engine utilise le programmeur de charge de travail dynamique pour planifier le provisionnement de la capacité demandée en fonction de la disponibilité des ressources. Le programmeur de charge de travail dynamique vous aide à obtenir des ressources très demandées, comme des GPU.

Vous ne pouvez créer des instances qu'après avoir réservé de la capacité pour une date ultérieure. À la date demandée, Compute Engine fournit la capacité demandée, que vous pouvez ensuite utiliser pour créer des instances. Si vous réservez des ressources à l'aide de réservations futures en mode Agenda, Compute Engine utilise le programmeur de charge de travail dynamique pour provisionner la capacité demandée. Le programmeur de charge de travail dynamique vous aide à obtenir des ressources très demandées, comme des GPU.
Garantie de capacité En fonction de la méthode de création La garantie de capacité varie en fonction de la méthode que vous utilisez pour créer des instances :
  • Si vous créez immédiatement des instances, Compute Engine s'efforce de provisionner la capacité demandée.
  • Si vous créez des instances à l'aide d'une réservation à la demande ou d'une réservation créée automatiquement pour une réservation future, vous avez la quasi-certitude que Compute Engine provisionnera la capacité demandée, à condition que la réservation dispose de capacité réservée disponible.
Limitée. Lorsque vous créez des VM Spot, Compute Engine s'efforce de provisionner la capacité demandée. Limitée. Lorsque vous créez une demande de redimensionnement de MIG, Compute Engine s'efforce de planifier le provisionnement de la capacité demandée. Très élevée. Si Google Cloud approuve votre demande de réservation, vous avez la quasi-certitude que Compute Engine provisionnera votre capacité réservée à la date et à l'heure de votre choix. Vous bénéficiez d'un accès exclusif à la capacité réservée pendant toute la période de réservation.
Durée de vie de l'instance Vous pouvez choisir quand arrêter ou supprimer une instance. Toutefois, si le type de machine utilisé par l'instance ne prend pas en charge la migration à chaud, Compute Engine arrête l'instance lors des événements de maintenance de l'hôte.

Vous pouvez décider quand arrêter ou supprimer une instance, sauf dans les cas suivants :

  • Compute Engine arrête ou supprime l'instance pour récupérer de la capacité. Ce processus est appelé préemption.
  • Si le type de machine utilisé par l'instance ne prend pas en charge la migration à chaud, Compute Engine arrête l'instance lors des événements de maintenance de l'hôte.

Avant qu'une instance n'atteigne la fin de sa durée d'exécution, vous pouvez effectuer les actions suivantes :

  • Arrêter l'instance : vous pouvez arrêter l'instance à tout moment uniquement si elle a été créée en tant qu'instance autonome.
  • Supprimer l'instance : vous pouvez supprimer l'instance à tout moment.

Lorsqu'une instance atteint la fin de sa durée d'exécution, Compute Engine la supprime.

Vous pouvez décider quand arrêter ou supprimer une instance, sauf dans les cas suivants :

  • Compute Engine arrête l'instance lors des événements de maintenance de l'hôte.
  • La réservation créée automatiquement pour provisionner la capacité demandée atteint le terme de la période de réservation d'engagement. À ce moment-là, Compute Engine supprime la réservation, et arrête ou supprime toutes les instances qui l'utilisent en fonction de l'action d'arrêt spécifiée dans leur configuration.

Étapes suivantes