Ce document décrit les instances Compute Engine qui utilisent le modèle de provisionnement lié à la réservation, y compris leurs avantages et les exigences propres à leur création.
Lorsque vous créez une instance de calcul, vous devez spécifier le modèle de provisionnement sous-jacent, qui définit la disponibilité, le prix et la durée de vie des ressources utilisées par votre instance de calcul. Le modèle de provisionnement lié à la réservation vous permet de créer des instances A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High avec huit GPU, A3 Edge et H4D en utilisant la capacité réservée d'une réservation future en mode Agenda ou d'une réservation future dans AI Hypercomputer.
Le modèle de provisionnement lié à la réservation offre les avantages suivants :
Contrôle des coûts : vous n'encourez aucun frais supplémentaire lorsque vous créez des instances de calcul en utilisant la capacité réservée. Vous ne payez que les ressources qui ne font pas partie de votre réservation, comme les disques ou les adresses IP.
Gestion du cycle de vie : en fonction de l'action d'arrêt que vous spécifiez lorsque vous créez des instances de calcul, Compute Engine arrête ou supprime les instances de calcul à la fin de la période de réservation.
Comprendre les instances qui utilisent le modèle de provisionnement lié à une réservation
Les sections suivantes décrivent les exigences qui s'appliquent lorsque vous créez des instances de calcul à l'aide du modèle de provisionnement lié à la réservation.
Conditions préalables à la création d'une instance de calcul
Pour utiliser le modèle de provisionnement lié à une réservation afin de créer des instances de calcul, vous devez d'abord réserver des ressources. Vous pouvez réserver des ressources comme suit :
Pour réserver jusqu'à 80 instances A4, A3 Ultra, A3 Mega, A3 High avec huit GPU ou H4D pendant 90 jours maximum, utilisez les demandes de réservations futures en mode Agenda.
Pour réserver plus de 80 instances A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High avec huit GPU, A3 Edge ou H4D pour une durée supérieure à 90 jours, utilisez les demandes de réservation future dans AI Hypercomputer.
Si Google Cloud approuve votre demande de réservation future, Compute Engine crée automatiquement (auto-crée) une réservation au début de votre période de réservation. Vous pouvez ensuite utiliser la réservation pour créer des instances de calcul.
Exigences relatives à la création d'instances de calcul
Pour créer une instance de calcul à l'aide du modèle de provisionnement lié à la réservation, vous devez spécifier les configurations suivantes :
L'instance de calcul et la réservation doivent avoir des propriétés correspondantes. Vous ne pouvez utiliser votre capacité réservée pour créer des instances que si les propriétés de l'instance et de la réservation créée automatiquement correspondent exactement. Pour en savoir plus, consultez les exigences relatives à l'utilisation des réservations.
L'instance de calcul doit cibler spécifiquement la réservation à utiliser. Lorsque vous créez une instance de calcul, vous devez spécifier le nom de la réservation créée automatiquement à cibler en vue d'être utilisée, ainsi que définir le champ
reservationAffinitysurSPECIFIC_RESERVATION. Pour en savoir plus, consultez Utiliser une réservation spécifiquement ciblée.L'instance de calcul doit utiliser le modèle de provisionnement lié à la réservation. Lorsque vous créez une instance de calcul, vous devez spécifier le modèle de provisionnement lié à la réservation comme suit :
Si vous utilisez la console Google Cloud , sélectionnez Lié à la réservation dans la liste Modèle de provisionnement.
Si vous utilisez Google Cloud CLI, incluez le flag
--provisioning-model=RESERVATION_BOUNDdans la commande.Si vous utilisez l'API Compute Engine, incluez le champ
"provisioningModel": "RESERVATION_BOUND"dans le corps de la requête.
L'instance de calcul doit être arrêtée ou supprimée à l'heure de fin de la réservation. Lorsque vous créez une instance de calcul, vous devez spécifier à l'aide du champ
instanceTerminationActionsi vous souhaitez l'arrêter ou la supprimer à l'heure de fin de la réservation. Pour en savoir plus, consultez Limiter la durée d'exécution d'une instance de calcul.
Une fois que vous avez créé une instance de calcul à l'aide du modèle de provisionnement lié à une réservation, elle s'exécute jusqu'à ce que vous l'arrêtiez ou la supprimiez, ou jusqu'à ce que Compute Engine l'arrête ou la supprime à l'heure de fin de la réservation.
Quota
Lorsque vous créez une instance de calcul à l'aide du modèle de provisionnement lié à la réservation, vous n'avez pas besoin de quota pour les ressources réservées que vous utilisez pour créer l'instance de calcul. Vous n'avez besoin d'un quota que pour les ressources qui ne font pas partie de votre capacité réservée, comme les disques et les adresses IP. Pour en savoir plus sur les différents types de quotas, consultez Quotas d'allocation.
Tarifs
Lorsque vous créez une instance de calcul à l'aide du modèle de provisionnement lié à une réservation, les frais suivants s'appliquent :
La facturation commence lorsque vous créez l'instance de calcul. Vous n'encourez pas de frais supplémentaires pour les ressources réservées que vous utilisez pour créer votre instance de calcul. Vous ne payez que les ressources qui ne font pas partie de la réservation, comme les disques ou les adresses IP. Pour en savoir plus, consultez la section Facturation des réservations.
Les frais cessent d'être facturés à l'heure de fin de la réservation. À ce moment-là, Compute Engine supprime la réservation et arrête ou supprime votre instance de calcul en fonction de l'action d'arrêt spécifiée dans l'instance de calcul.
Limites
Pour créer des instances de calcul à l'aide du modèle de provisionnement lié à la réservation, vous devez utiliser l'une des séries de machines suivantes :
A4X Max
A4X
A4
A3 Ultra
A3 Mega
A3 High avec 8 GPU
H4D
Pour en savoir plus sur l'utilisation d'autres séries de machines optimisées pour les accélérateurs avec le modèle de provisionnement lié à la réservation, contactez l'équipe chargée de votre compte ou l'équipe commerciale.
Étapes suivantes
Faites l'essai
Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de Compute Engine en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits sans frais pour exécuter, tester et déployer des charges de travail.
Essayer Compute Engine sans frais