Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Sélectionner une option de consommation

Ce document explique les différentes manières, appelées options de consommation, d'obtenir et d'utiliser des ressources de calcul sur AI Hypercomputer. Choisissez l'option qui correspond le mieux à votre charge de travail, à sa durée et à vos besoins en termes de coûts.

Chaque option de consommation spécifie les éléments suivants :

Comment accéder à la capacité pour créer des VM ou des clusters.
Le modèle de provisionnement sous-jacent, qui détermine la disponibilité, la durée de vie et le prix de vos VM.

Comparaison des options de consommation

Le tableau suivant récapitule les principales différences entre les options de consommation :

Option d'utilisation	Réservations futures dans AI Hypercomputer	Réservations futures jusqu'à 90 jours (en mode Agenda)	Démarrage flexible	Spot
Machines compatibles	A4X Max, A4X, A4, A3 Ultra, A3 Mega ou A3 High	A4, A3 Ultra, A3 Mega ou A3 High avec 8 GPU	Toute machine GPU sauf A4X Max et A4X	Toute machine GPU sauf A4X Max et A4X
Durée de vie	Illimité	Jusqu'à 90 jours	Jusqu'à 7 jours	Illimité (mais soumis à la préemption)
Préemptif
Garantie de capacité	Très élevée. Si Google Cloud approuve votre demande de réservation, vous avez la quasi-certitude que Compute Engine provisionnera la capacité demandée.	Très élevée. Si Google Cloud approuve votre demande de réservation, vous avez la quasi-certitude que Compute Engine provisionnera la capacité demandée.	Limitée. Compute Engine s'efforce de planifier le provisionnement de la capacité demandée.	Limitée. Compute Engine s'efforce de provisionner la capacité demandée.
Quota	Google Cloud augmente automatiquement le quota avant que la capacité ne soit fournie.	Aucun quota n'est consommé.	Utilise le quota préemptif.	Utilise le quota préemptif.
Tarifs	Prix réduit (jusqu'à 53%). Consultez les tarifs des VM optimisées pour les accélérateurs. Si vous réservez des ressources pendant au moins un an, vous devez souscrire un engagement basé sur les ressources et l'associer à vos ressources réservées. La période de réservation vous est facturée. Consultez la section Facturation des réservations.	Prix réduit (jusqu'à 53%). Consultez les tarifs du programmeur de charge de travail dynamique. La période de réservation vous est facturée. Consultez la section Facturation des réservations.	Prix réduit (jusqu'à 53%). Consultez les tarifs du planificateur de charges de travail dynamique. Vous payez à l'usage.	Profitez de remises importantes (jusqu'à 91%). Consultez les tarifs des VM Spot et les tarifs des VM optimisées pour les accélérateurs. Vous payez à l'usage.
Allocation des ressources	Dense	Dense	Dense de la manière la plus optimale possible ( stratégies compactes ou stratégies de charge de travail facultatives)	Standard (stratégie compacte facultative)
Modèle de provisionnement	Lié à la réservation	Lié à la réservation	Démarrage flexible	Spot
Méthode de création	Pour créer des VM, vous devez procéder comme suit : Réservez de la capacité en contactant l'équipe chargée de votre compte. À la date et à l'heure choisies, vous pouvez utiliser la capacité réservée pour créer des VM et des clusters à l'aide de l'une des méthodes décrites dans Présentation des options de déploiement.	Pour créer des VM, vous devez procéder comme suit : Créer une réservation future en mode Agenda À la date et à l'heure de votre choix, vous pouvez utiliser la capacité réservée pour créer des VM et des clusters à l'aide de l'une des méthodes décrites dans Présentation des options de déploiement.	Lorsque vous demandez à créer des VM à démarrage flexible, Compute Engine planifie leur création en fonction de la disponibilité. Lorsque de la capacité devient disponible, Compute Engine provisionne les VM à démarrage flexible. Pour créer des VM à démarrage flexible, utilisez l'une des méthodes décrites dans la section Présentation des options de déploiement.	Vous pouvez créer des VM immédiatement à l'aide de l'une des méthodes décrites dans la présentation des options de déploiement.

Sélectionner une option de consommation

Utilisez l'organigramme suivant pour choisir l'option de consommation qui correspond le mieux à votre charge de travail :

Organigramme des options de consommation pour AI Hypercomputer.

Les questions du diagramme précédent sont les suivantes :

Avez-vous besoin de capacité pendant plus de 90 jours ?
- Oui : consultez Utiliser des réservations futures dans AI Hypercomputer.
- Non : passez à la question 2.
Souhaitez-vous utiliser la capacité réservée ?
- Oui : consultez Utiliser des réservations futures en mode Agenda.
- Non : passez à la question 3.
Votre charge de travail est-elle tolérante aux pannes ?
- Non : consultez Utiliser le démarrage flexible.
- Oui : consultez Utiliser Spot.

Utiliser les réservations futures dans AI Hypercomputer

Pour exécuter des charges de travail distribuées de longue durée et à grande échelle qui nécessitent des ressources à allocation dense, vous pouvez demander des ressources de calcul pour une période spécifique à venir. Vous bénéficiez d'un accès exclusif aux ressources réservées pendant cette période. Vous pouvez les utiliser pour créer des VM ou des clusters. À la fin de la période de réservation, Compute Engine effectue les opérations suivantes :

Compute Engine supprime la réservation.
En fonction de l'action d'arrêt que vous spécifiez pour les VM, Compute Engine arrête ou supprime toutes les VM qui utilisent la réservation.

Charges de travail idéales pour les réservations futures dans AI Hypercomputer

Les réservations futures sont idéales pour les charges de travail suivantes :

Pré-entraînement des modèles de fondation
Inférence de modèle de fondation multihôte

Caractéristiques clés des réservations futures dans AI Hypercomputer

Les réservations futures présentent les caractéristiques suivantes :

Vous pouvez réserver des types de machines A4X Max, A4X, A4, A3 Ultra, A3 Mega ou A3 High (8 GPU). Les machines sont allouées de manière dense pour minimiser la latence du réseau.
Vous pouvez réserver autant de VM que vous le souhaitez pour n'importe quelle durée à partir d'une date ultérieure. Utilisez les ressources réservées pour créer et exécuter des VM jusqu'à la fin de la période de réservation. Si vous réservez des ressources pendant au moins un an, vous devez souscrire un engagement basé sur les ressources et l'associer à vos ressources réservées.
Une fois la période de réservation commencée, vous pouvez modifier les réservations créées automatiquement comme suit :
- Activer ou désactiver les notifications de maintenance d'urgence du matériel
- Activer ou désactiver l'utilisation des jobs Vertex AI
Vous utilisez le modèle de provisionnement lié à la réservation, qui présente les avantages suivants :
- Vous avez plus de chances d'obtenir des GPU.
- En plus de l'engagement associé à vos VM, vous bénéficiez d'une remise allant jusqu'à 53% sur les vCPU et les GPU.

Utiliser les réservations futures dans AI Hypercomputer

Pour utiliser des réservations futures afin de créer des VM ou des clusters, vous devez procéder comme suit :

Demandez à réserver de la capacité. Vous contactez l'équipe responsable de votre compte et spécifiez les ressources à réserver. En fonction de la disponibilité, Google crée une demande de réservation provisoire pour vous. Si tout vous semble correct, vous pouvez l'envoyer. Google Cloud approuve immédiatement la demande de réservation.

Pour obtenir des instructions, consultez Réserver de la capacité.
Consommer des ressources réservées Au début de la période de réservation choisie, vous pouvez utiliser la réservation pour créer des VM ou des clusters.

Pour connaître les différentes méthodes de création de VM ou de clusters, consultez Présentation des options de déploiement.

Utiliser les réservations futures en mode Agenda

Pour exécuter des charges de travail distribuées de courte durée qui nécessitent des ressources à allocation dense, vous pouvez demander des ressources de calcul pour une durée maximale de 90 jours. Vous bénéficiez d'un accès exclusif aux ressources réservées pendant cette période. Vous pouvez les utiliser pour créer des VM ou des clusters. À la fin de la période de réservation, Compute Engine effectue les opérations suivantes :

Compute Engine supprime la réservation.
En fonction de l'action d'arrêt que vous spécifiez pour les VM, Compute Engine arrête ou supprime toutes les VM qui utilisent la réservation.

Charges de travail idéales pour les réservations futures en mode Agenda

Les réservations futures en mode Agenda sont idéales pour les charges de travail suivantes :

Pré-entraînement du modèle
Affinage de modèles
Simulations
Inférence

Principales caractéristiques des réservations futures en mode Agenda

Les réservations futures en mode Agenda présentent les caractéristiques suivantes :

Vous pouvez réserver des types de machines A4, A3 Ultra, A3 Mega ou A3 High (8 GPU). Ces machines sont allouées de manière dense pour minimiser la latence réseau.
Vous pouvez consulter la disponibilité future et réserver jusqu'à 80 VM pour une durée maximale de 90 jours. Vous pouvez ensuite utiliser les ressources réservées pour créer des VM jusqu'à la fin de la période de réservation.
Une fois la période de réservation commencée, vous pouvez modifier les réservations créées automatiquement comme suit :
- Activer ou désactiver les notifications de maintenance d'urgence du matériel
- Activer ou désactiver l'utilisation des jobs Vertex AI
Vous utilisez le modèle de provisionnement lié à la réservation, qui présente les avantages suivants :
- Vous avez plus de chances d'obtenir des GPU.
- Vous bénéficiez d'une remise allant jusqu'à 53% sur les vCPU et les GPU.

Utiliser les réservations futures en mode Agenda

Pour utiliser les réservations futures en mode Agenda afin de créer des VM ou des clusters, vous devez suivre les étapes suivantes :

Afficher la disponibilité des ressources Vous pouvez consulter la disponibilité future des ressources que vous souhaitez réserver. Lorsque vous créez une demande de réservation, vous pouvez spécifier le nombre, le type et la durée de réservation des ressources dont vous avez vérifié la disponibilité. Cette action augmente les chances que Google Cloud approuve votre demande.

Pour obtenir des instructions, consultez Afficher la disponibilité future des ressources.
Capacité de réservation : Vous créez une demande de réservation pour une date et une heure ultérieures. Google Cloud approuve la demande de réservation dans les deux minutes. Si elle est approuvée, Compute Engine réserve la capacité. À la date de livraison choisie, vous pouvez utiliser les ressources réservées pour créer des VM ou des clusters.

Pour obtenir des instructions, consultez Créer une demande de réservation pour des VM avec GPU ou des TPU.
Consommer des ressources réservées Au début de la période de réservation choisie, vous pouvez utiliser la réservation pour créer des VM ou des clusters.

Pour découvrir les différentes méthodes de création de VM ou de clusters, consultez les pages suivantes :
- Pour créer des VM A4, A3 Ultra, A3 Mega ou A3 High (8 GPU), consultez Présentation des options de déploiement.
- Pour créer des VM A3 Mega ou A3 High (8 GPU) avec GPUDirect-TCPX activé, consultez Créer une VM A3 avec GPUDirect-TCPX activé.

Utiliser le démarrage flexible

Pour exécuter des charges de travail de courte durée nécessitant des ressources allouées de manière dense, vous pouvez demander des ressources de calcul pendant sept jours maximum à l'aide du démarrage flexible. Chaque fois que des ressources sont disponibles, Compute Engine crée le nombre de VM que vous avez demandé. Vous pouvez arrêter les VM à démarrage flexible autonomes, mais pas celles qu'un groupe d'instances gérées (MIG) crée par le biais de demandes de redimensionnement. Les VM à démarrage flexible existent jusqu'à ce que vous les supprimiez ou jusqu'à ce que Compute Engine les supprime à la fin de leur durée d'exécution.

Charges de travail idéales pour le démarrage flexible

Le démarrage flexible est idéal pour les charges de travail qui peuvent démarrer à tout moment, comme les suivantes :

Pré-entraînement de petits modèles
Affinage de modèles
Simulations
Inférence par lot

Principales caractéristiques du démarrage flexible

Le démarrage flexible présente les caractéristiques suivantes :

Vous pouvez demander n'importe quel type de machine GPU, à l'exception des types A4X Max et A4X. Compute Engine s'efforce d'allouer les machines de manière dense, ce qui peut entraîner une grande distance entre les VM à démarrage flexible d'une même zone. Pour contrôler l'emplacement de vos VM et minimiser la latence du réseau, vous pouvez procéder comme suit :
- Pour les VM à démarrage flexible autonomes, appliquez une stratégie d'emplacement compact aux VM.
- Pour les MIG avec une taille cible, appliquez une stratégie de charge de travail.
Vous utilisez le modèle de provisionnement de démarrage flexible, qui présente les avantages suivants :
- Vous avez plus de chances d'obtenir des GPU.
- Vous bénéficiez d'une remise allant jusqu'à 53% sur les vCPU, la mémoire et les GPU.

Utiliser le démarrage flexible

Pour utiliser le démarrage flexible afin de créer des VM ou des clusters, vous devez procéder comme suit :

Facultatif : créez une stratégie d'emplacement compact ou une règle de charge de travail. Vous pouvez créer une stratégie d'emplacement compact (pour les VM autonomes ou les VM groupées) ou une stratégie de charge de travail (pour les MIG) afin de spécifier la proximité des VM. La configuration que vous choisissez affecte les types de machines et le nombre de VM compatibles avec la règle.
Créez des VM à démarrage flexible. Une fois que vous avez demandé à créer des VM, Compute Engine planifie leur création en fonction de la disponibilité. Lorsque de la capacité devient disponible, Compute Engine provisionne les VM à démarrage flexible. Les VM s'exécutent jusqu'à ce que vous les arrêtiez ou les supprimiez, ou jusqu'à ce qu'elles atteignent la fin de leur durée d'exécution.

Pour obtenir des instructions, consultez Présentation des options de déploiement.

Utiliser Spot

Pour exécuter des charges de travail tolérantes aux pannes, vous pouvez obtenir des ressources de calcul immédiatement en fonction de leur disponibilité. Vous obtenez des ressources au prix le plus bas possible. Toutefois, Compute Engine peut préempter des VM à tout moment pour récupérer de la capacité.

Charges de travail idéales pour les instances Spot

Spot est idéal pour les charges de travail où les interruptions sont acceptables, comme les suivantes :

Traitement par lot
Calcul hautes performances (HPC)
Intégration continue et déploiement continu (CI/CD)
Analyse de données
Encodage multimédia
Inférence en ligne

Principales caractéristiques de Spot

Spot présente les caractéristiques suivantes :

Vous pouvez créer n'importe quel type de machine GPU, à l'exception des types A4X Max et A4X. L'allocation dense dépend de la disponibilité des ressources. Pour vous assurer d'une allocation plus proche, vous pouvez appliquer une stratégie d'emplacement compact aux VM.
Vous pouvez créer des VM immédiatement. Les VM s'exécutent jusqu'à ce que vous les arrêtiez ou supprimiez, ou jusqu'à ce que Compute Engine les préempte pour récupérer de la capacité.
Vous utilisez le modèle de provisionnement Spot, qui présente les avantages suivants :
- Vous avez plus de chances d'obtenir des GPU.
- Vous bénéficiez d'une remise allant jusqu'à 91% sur de nombreux types de machines, GPU, TPU et disques SSD locaux.

Utiliser Spot

Pour utiliser Spot afin de créer des VM ou des clusters, vous devez procéder comme suit :

Afficher la disponibilité des ressources Vous pouvez consulter la disponibilité des ressources dans la région ou la zone où vous souhaitez créer des VM Spot. Cette action permet de réduire le risque d'erreurs de disponibilité des ressources.

Pour obtenir des instructions, consultez Afficher la disponibilité des VM Spot.
Facultatif : Affichez le taux de préemption et le prix. Vous pouvez consulter le taux de préemption et les tarifs historiques et actuels pour différents types de machines et zones. Ces informations vous aident à choisir le type de machine et l'emplacement qui correspondent le mieux à votre charge de travail et à votre budget.

Pour obtenir des instructions, consultez Afficher le taux de préemption et les tarifs des VM Spot.
Facultatif : créez une stratégie d'emplacement compact ou une règle de charge de travail. Vous pouvez créer une stratégie d'emplacement compact (pour les VM autonomes ou les VM groupées) ou une stratégie de charge de travail (pour les MIG) afin de spécifier la proximité des VM. La configuration que vous choisissez affecte les types de machines et le nombre de VM compatibles avec la règle.

Pour obtenir des instructions, consultez Réduire la latence à l'aide de stratégies d'emplacement compact ou Créer des stratégies de charge de travail pour les MIG.
Créez des VM Spot. Vous pouvez créer autant de VM que vous le souhaitez, en fonction de la disponibilité. Les VM s'exécutent jusqu'à ce que vous les arrêtiez ou supprimiez, ou jusqu'à ce que Compute Engine les préempte pour récupérer de la capacité.

Pour obtenir des instructions, consultez Présentation des options de déploiement.

Sélectionner une option de consommation Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Comparaison des options de consommation

Sélectionner une option de consommation

Utiliser les réservations futures dans AI Hypercomputer

Charges de travail idéales pour les réservations futures dans AI Hypercomputer

Caractéristiques clés des réservations futures dans AI Hypercomputer

Utiliser les réservations futures dans AI Hypercomputer

Utiliser les réservations futures en mode Agenda

Charges de travail idéales pour les réservations futures en mode Agenda

Principales caractéristiques des réservations futures en mode Agenda

Utiliser les réservations futures en mode Agenda

Utiliser le démarrage flexible

Charges de travail idéales pour le démarrage flexible

Principales caractéristiques du démarrage flexible

Utiliser le démarrage flexible

Utiliser Spot

Charges de travail idéales pour les instances Spot

Principales caractéristiques de Spot

Utiliser Spot

Sélectionner une option de consommation