Ce document présente les demandes de réservations futures en mode Agenda.
Utilisez les demandes de réservations futures en mode Agenda pour obtenir des ressources très demandées, par exemple pour créer des instances de machines virtuelles (VM) auxquelles sont associés des GPU ou des TPU. Lorsque Google Cloud approuve une demande de réservation, Compute Engine provisionne les ressources réservées à la date et à l'heure spécifiées, et pour une durée maximale de 90 jours. Vous pouvez ensuite utiliser les ressources réservées pour créer des VM avec GPU, des VM H4D ou des VM TPU afin d'exécuter les charges de travail suivantes :
Jobs de pré-entraînement de modèles
Jobs d'affinage de modèles
Charges de travail de simulation de calcul hautes performances (HPC)
Augmentations attendues à court terme des charges de travail d'inférence
Pour en savoir plus sur les autres façons de réserver des ressources dans Compute Engine, consultez Choisir un type de réservation.
Créer une demande en mode Agenda
Les sections suivantes expliquent comment afficher la disponibilité des ressources, ainsi que les détails à spécifier lorsque vous créez une demande de réservation future en mode Agenda.
Afficher la disponibilité future des ressources
Avant de créer une demande de réservation future en mode Agenda, vous pouvez afficher la disponibilité future dans une région des ressources suivantes :
Pour les VM avec GPU ou H4D, jusqu'à 60 jours à l'avance
Pour les TPU, jusqu'à 120 jours à l'avance
Compute Engine utilise le planificateur de charges de travail dynamique (DWS) pour afficher la disponibilité des ressources demandées. Lorsque vous créez une demande, spécifiez le nombre, le type et la période de réservation des ressources dont vous avez confirmé la disponibilité. Google Cloud est plus susceptible d'approuver votre demande si vous fournissez ces informations.
Définir les propriétés de la demande
Lorsque vous créez une demande de réservation future en mode Agenda, vous devez spécifier les propriétés suivantes :
Suppression automatique. Cette propriété détermine si Compute Engine supprime la réservation créée automatiquement (créée automatiquement) pour votre demande à l'heure de fin, même si la réservation n'est pas entièrement utilisée. Pour créer une demande en mode Agenda, vous devez activer l'option de suppression automatique.
Type de consommation. Cette propriété définit la façon dont les VM consomment la réservation créée automatiquement. Lorsque vous créez une demande en mode Agenda, vous devez spécifier que vous souhaitez créer des réservations spécifiquement ciblées. Ce paramètre signifie que seules les VM qui ciblent la réservation peuvent l'utiliser.
Type de déploiement. Cette propriété définit la colocation de vos ressources réservées. Compute Engine réserve des ressources en fonction du type de ressource :
Pour les VM avec GPU ou H4D, vous devez spécifier le type de déploiement dense (
DENSE) lorsque vous créez une demande. Cette configuration spécifie de réserver des ressources de manière dense pour une latence réseau minimale.Pour les TPU, Compute Engine utilise le type de déploiement flexible (
FLEXIBLE) par défaut. Cette configuration spécifie de réserver des ressources au plus près, dans la mesure du possible.
Nom. Nom de votre demande, qui doit être unique dans votre projet.
Nombre de ressources. Nombre de VM avec GPU, de VM H4D ou de TPU à réserver à l'heure de début demandée.
État de planification. Cette propriété définit si vous envoyez immédiatement votre demande à Google Cloud pour examen, ou si vous l'enregistrez en tant que brouillon et l'envoyez ultérieurement. Lorsque vous créez une demande en mode Agenda, vous devez spécifier d'envoyer immédiatement la demande pour examen.
Mode de réservation. Cette propriété définit la méthode de réservation des ressources, que vous devez définir sur
CALENDARpour une demande en mode Agenda.Nom de la réservation. Nom de la réservation que Compute Engine crée automatiquement si Google Cloud l'approuve votre demande.
Type de partage. Cette propriété définit si d'autres projets de votre organisation peuvent utiliser la réservation créée automatiquement pour votre demande approuvée. Vous pouvez spécifier l'une des options suivantes :
Projet unique. Seul votre projet peut utiliser la capacité réservée.
Partagé. Vous pouvez partager la capacité réservée avec un maximum de 100 autres projets de votre organisation. Si vous spécifiez cette option, vous devez spécifier les projets avec lesquels partager la réservation créée automatiquement. Pour en savoir plus, consultez les bonnes pratiques concernant les réservations partagées.
Période de réservation. Date et heure auxquelles Compute Engine provisionne la capacité demandée et que vous pouvez utiliser. La période de réservation comprend les éléments suivants :
Heure de début. Heure à laquelle vous souhaitez commencer à utiliser votre capacité réservée. En fonction des ressources que vous réservez, l'heure de début doit être au moins l'une des valeurs suivantes à partir du moment où vous créez et envoyez une demande :
Pour les VM avec GPU et H4D, 87 heures (trois jours et 15 heures)
Pour les TPU, six heures
Heure de fin. Heure à laquelle votre capacité demandée n'est plus réservée. À ce moment-là, Compute Engine supprime la réservation créée automatiquement et arrête ou supprime toutes les VM qui l'utilisent en fonction de l'action d'arrêt que vous avez spécifiée pour les VM.
Propriétés des ressources. Exigences matérielles des VM avec GPU, des VM H4D ou des TPU que vous souhaitez réserver. Les VM ne peuvent utiliser une réservation que si leurs propriétés correspondent à celles de la réservation. Pour en savoir plus, consultez les exigences pour utiliser les réservations.
Zone. Zone dans laquelle vous souhaitez réserver de la capacité.
Processus d'examen des demandes
Pour réserver de la capacité à l'aide d'une demande de réservation future en mode Agenda, vous devez créer et envoyer la demande à Google Cloud pour examen. Une fois que vous avez créé et envoyé une demande, Google Cloud l'examine en une minute, et puis l'une des situations suivantes se produit :
Google Cloud approuve votre demande : Compute Engine réserve les ressources demandées et, dans la minute qui suit l'approbation, crée automatiquement une réservation vide. À l'heure de début de la demande, Compute Engine provisionne la capacité demandée en augmentant le nombre de VM avec GPU, de VM H4D ou de TPU dans la réservation.
Une erreur se produit. La demande échoue, car la zone de la demande ne dispose pas de suffisamment de ressources. Nous vous recommandons d'afficher à nouveau la disponibilité future des ressources, puis de créer et d'envoyer une nouvelle demande pour examen.
Cycle de vie des demandes
Le schéma suivant montre les différents états que Compute Engine peut définir pour une demande de réservation future en mode Agenda :

Les états et le flux d'événements présentés dans le schéma précédent sont les suivants :
PENDING_APPROVAL: vous avez créé et envoyé une demande pour examen. Dans la minute qui suit, Google Cloud approuve la demande.APPROVED: Google Cloud a approuvé votre demande. Ensuite, dans la minute qui suit, Compute Engine crée automatiquement une réservation vide et remplace l'état de la demande parPROCURING.PROCURING: Compute Engine planifie le provisionnement de vos ressources réservées. Avant l'heure de début de la demande, l'état de la demande passe àPROVISIONING.PROVISIONING: Compute Engine provisionne vos ressources réservées en augmentant le nombre de VM avec GPU, de VM H4D ou de TPU réservés dans la réservation créée automatiquement. À l'heure de début de la demande, l'état de la demande passe àFULFILLED.FULFILLED: Compute Engine a provisionné vos ressources réservées, et vous êtes facturé pour celles-ci. Vous pouvez utiliser la réservation créée automatiquement en créant des VM jusqu'à l'heure de fin de la demande.
À l'heure de fin de la demande, Compute Engine supprime la demande et la réservation créée automatiquement. Il arrête ou supprime également toutes les VM qui utilisent la réservation en fonction de l' action d'arrêt que vous avez spécifiée pour les VM.
Utiliser la capacité provisionnée
Une fois que Google Cloud a approuvé une demande de réservation future en mode Agenda, Compute Engine crée automatiquement une réservation présentant les caractéristiques suivantes :
La réservation créée automatiquement ne comporte aucune VM avec GPU, VM H4D ni TPU réservés. Vous ne pouvez pas encore l'utiliser.
La réservation créée automatiquement hérite des propriétés de VM ou de TPU spécifiées dans votre demande.
À l'heure de début de la demande, Compute Engine provisionne la capacité demandée en augmentant le nombre de VM avec GPU, de VM H4D ou de TPU dans la réservation créée automatiquement. Vous pouvez ensuite utiliser la réservation en créant des VM avec GPU, des VM H4D ou des VM TPU qui répondent à toutes les conditions suivantes :
Les VM et la réservation ont des propriétés correspondantes.
Les VM utilisent le modèle de provisionnement lié à la réservation.
Les VM doivent être arrêtées ou supprimées à l'heure de fin de la réservation.
Vous pouvez créer des VM jusqu'à ce que la réservation soit entièrement utilisée ou jusqu'à l'heure de fin de la demande. À l'heure de fin de la demande, Compute Engine supprime la réservation créée automatiquement et arrête ou supprime toutes les VM qui l'utilisent.
Quota
Les exigences de quota pour les demandes de réservations futures en mode Agenda dépendent du type de machine, comme suit :
Types de machines avec GPU et TPU : aucun quota n'est requis pour réserver de la capacité.
Types de machines H4D : le quota de processeurs est utilisé.
Lorsque vous créez des VM en utilisant la capacité réservée, vous devez disposer d'un quota suffisant pour toutes les ressources qui ne font pas partie de votre réservation, comme les disques ou les adresses IP. Sinon, la création de VM échoue.
Tarifs
Lorsque vous créez et envoyez une demande de réservation future en mode Agenda, et que Google Cloud l'approuve, vous n'êtes pas facturé immédiatement. Vous êtes facturé lorsque les événements suivants se produisent :
Compute Engine provisionne la capacité demandée. Lorsque votre demande atteint l'état
FULFILLEDà l'heure de début de la demande, vous êtes facturé pour les ressources provisionnées en fonction des tarifs du planificateur de charges de travail dynamique. Ce modèle de tarification propose des processeurs virtuels, de la mémoire, des GPU et des TPU à un prix réduit par rapport à la tarification standard.Vous utilisez des ressources en dehors de la réservation. Lorsque vous créez des VM qui utilisent une réservation créée automatiquement, vous n'êtes pas facturé de frais supplémentaires pour les ressources utilisées. Vous ne payez que les ressources qui ne font pas partie de la réservation, comme les disques ou les adresses IP.
Vous n'êtes plus facturé pour les ressources réservées à l'heure de fin de la demande. À ce moment-là, Compute Engine supprime la réservation créée automatiquement et arrête ou supprime toutes les VM qui l'utilisent en fonction de leur action d'arrêt.
Limites
Les sections suivantes expliquent les limites applicables aux demandes de réservations futures en mode Agenda.
Limites pour toutes les demandes
Toutes les demandes de réservations futures en mode Agenda sont soumises aux limites suivantes :
Vous pouvez réserver des ressources pour une période comprise entre 1 et 90 jours.
Une fois que vous avez créé et envoyé une demande, vous ne pouvez pas l'annuler, la supprimer ni la modifier.
Limites pour les demandes de VM avec GPU ou H4D
Vous ne pouvez réserver des VM avec GPU ou des VM H4D que comme suit :
Vous pouvez réserver le nombre de VM suivant par demande :
Pour les VM avec GPU, entre 1 et 80 VM
Pour les VM H4D, entre 1 et 256 VM
Vous pouvez réserver les séries de machines suivantes :
Vous ne pouvez réserver des VM avec GPU ou H4D que dans des zones spécifiques. Pour en savoir plus, consultez les ressources suivantes :
Pour les VM avec GPU, consultez la section Emplacements des GPU.
Pour les VM H4D, consultez la section Régions et zones disponibles.
Vous ne pouvez pas utiliser de modèle d'instance pour créer des demandes de VM avec GPU ou H4D.
Limites pour les demandes de VM TPU
Vous ne pouvez réserver des VM TPU que comme suit :
Vous pouvez réserver 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1 024 puces TPU par demande.
Vous pouvez réserver les versions de TPU suivantes :
Vous ne pouvez réserver des TPU que dans les zones suivantes :
TPU7x:
us-central1-c
TPU v6e:
asia-northeast1-beurope-west4-aus-east5-aus-east5-bus-south1-ai1b
TPU v5p:
us-east5-a
Limites pour toutes les réservations créées automatiquement
Une réservation créée automatiquement pour une demande est soumise aux limites suivantes :
Vous ne pouvez modifier la réservation que comme suit :
Pour autoriser ou interdire son utilisation par les jobs Vertex AI.
Après l'heure de début de la réservation.
Vous ne pouvez pas appliquer de remises sur engagement d'utilisation ni de remises automatiques proportionnelles à une utilisation soutenue à la réservation.
Vous ne pouvez pas supprimer la réservation. Compute Engine la supprime à l'heure de fin de la réservation.