Ce document décrit les instances Compute Engine qui utilisent le modèle de provisionnement lié à la réservation, y compris leurs avantages et les exigences propres à leur création.
Lorsque vous créez une instance, vous devez également spécifier le modèle de provisionnement sous-jacent, qui définit la disponibilité, le prix et la durée de vie de vos instances. Le modèle de provisionnement lié à la réservation vous permet de créer des instances A4X Max, A4X, A4 ou A3 Ultra (instances de machine virtuelle ou bare metal) en utilisant la capacité réservée d'une réservation future en mode Agenda ou d'une réservation future dans AI Hypercomputer.
Le modèle de provisionnement lié à la réservation offre les avantages suivants :
Contrôle des coûts : vous n'encourez aucun frais supplémentaire lorsque vous créez des instances en utilisant votre capacité réservée. Vous ne payez que les ressources qui ne font pas partie de votre réservation, comme les disques ou les adresses IP.
Gestion du cycle de vie : en fonction de l'action d'arrêt que vous spécifiez lors de la création des instances, Compute Engine arrête ou supprime l'instance à la fin de la période de réservation.
Comprendre les instances qui utilisent le modèle de provisionnement lié à la réservation
Les sections suivantes décrivent les exigences qui s'appliquent lorsque vous créez des instances de calcul à l'aide du modèle de provisionnement lié à la réservation.
Conditions préalables à la création d'instances
Pour utiliser le modèle de provisionnement lié à la réservation afin de créer des instances de calcul, vous devez d'abord réserver des ressources. Vous pouvez réserver des ressources comme suit :
Pour réserver jusqu'à 80 instances A4 ou A3 Ultra pendant 90 jours maximum, utilisez les demandes de réservations futures en mode Agenda.
Pour réserver plus de 80 instances A4X Max, A4X, A4 ou A3 Ultra pour une durée supérieure à 90 jours, utilisez les demandes de réservation future dans AI Hypercomputer.
Si Google Cloud approuve votre demande de réservation future, Compute Engine crée automatiquement (auto-crée) une réservation au début de votre période de réservation. Vous pouvez ensuite utiliser la réservation pour créer des instances.
Exigences relatives à la création d'instances
Pour créer une instance de calcul à l'aide du modèle de provisionnement lié à la réservation, vous devez spécifier les configurations suivantes :
L'instance et la réservation doivent avoir des propriétés correspondantes. Vous ne pouvez utiliser votre capacité réservée pour créer des instances que si les propriétés de l'instance et de la réservation créée automatiquement correspondent exactement. Pour en savoir plus, consultez les exigences relatives à l'utilisation des réservations.
L'instance doit cibler spécifiquement la réservation à utiliser. Lorsque vous créez une instance, vous devez spécifier le nom de la réservation créée automatiquement à cibler en vue d'être utilisée, ainsi que définir le champ
reservationAffinitysurSPECIFIC_RESERVATION. Pour en savoir plus, consultez Utiliser une réservation spécifiquement ciblée.L'instance doit utiliser le modèle de provisionnement lié à une réservation. Lorsque vous créez une instance, vous devez spécifier le modèle de provisionnement lié à la réservation comme suit :
Dans la console Google Cloud , dans la liste Modèle de provisionnement, sélectionnez Lié à la réservation.
Dans la Google Cloud CLI, incluez le flag
--provisioning-model=RESERVATION_BOUNDdans la commande.Dans l'API Compute Engine, incluez le champ
"provisioningModel": "RESERVATION_BOUND"dans le corps de la requête.
L'instance doit être arrêtée ou supprimée à l'heure de fin de la réservation. Lorsque vous créez une instance, vous devez spécifier à l'aide du champ
instanceTerminationActionsi vous souhaitez l'arrêter ou la supprimer à l'heure de fin de la réservation. Pour en savoir plus, consultez Limiter la durée d'exécution d'une instance.
Une fois l'instance créée, elle s'exécute jusqu'à ce que vous l'arrêtiez ou la supprimiez, ou jusqu'à ce que Compute Engine l'arrête ou la supprime à l'heure de fin de la réservation.
Quota
Lorsque vous créez une instance de calcul à l'aide du modèle de provisionnement lié à la réservation, vous n'avez pas besoin de quota pour les ressources réservées que vous utilisez pour créer l'instance. Vous n'avez besoin d'un quota que pour les ressources qui ne font pas partie de votre réservation, comme les disques et les adresses IP. Pour en savoir plus sur les différents types de quotas, consultez Quotas d'allocation.
Tarifs
Lorsque vous créez une instance de calcul à l'aide du modèle de provisionnement lié à la réservation, les frais suivants s'appliquent :
La facturation commence lorsque vous créez l'instance. Toutefois, vous n'encourez pas de frais supplémentaires pour les ressources réservées que vous utilisez pour créer votre instance. Vous ne payez que les ressources qui ne font pas partie de la réservation, comme les disques ou les adresses IP. Pour en savoir plus, consultez Facturation des réservations.
Les frais cessent d'être facturés lorsque la réservation que vous avez utilisée pour créer l'instance arrive à son heure de fin. À ce moment-là, Compute Engine supprime la réservation et arrête ou supprime votre instance en fonction de l'action d'arrêt spécifiée dans l'instance.
Limites
Les instances de calcul que vous créez à l'aide du modèle de provisionnement lié à la réservation ne peuvent utiliser que les séries de machines suivantes :
A4X Max
A4X
A4
A3 Ultra
Pour en savoir plus sur l'utilisation d'autres séries de machines optimisées pour les accélérateurs avec le modèle de provisionnement lié à la réservation, contactez l'équipe chargée de votre compte ou l'équipe commerciale.
Étapes suivantes
Faites l'essai
Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de Compute Engine en conditions réelles. Les nouveaux clients bénéficient également de 300 $de crédits sans frais pour exécuter, tester et déployer des charges de travail.
Profiter d'un essai sans frais de Compute Engine