Choisir une option de consommation

Ce document explique les différentes manières, appelées options de consommation, d'obtenir et d'utiliser des ressources de calcul sur AI Hypercomputer. Choisissez l'option qui correspond le mieux à votre charge de travail, à sa durée et à vos besoins en termes de coûts.

Chaque option de consommation spécifie les éléments suivants :

  • Comment accéder à la capacité pour créer des VM ou des clusters.

  • Le modèle de provisionnement sous-jacent, qui détermine la disponibilité, la durée de vie et le prix de vos VM.

Comparaison des options de consommation

Le tableau suivant récapitule les principales différences entre les options de consommation :

Option d'utilisation Réservations futures dans AI Hypercomputer Réservations futures jusqu'à 90 jours (en mode Agenda) Démarrage flexible Spot
Machines compatibles A4X Max, A4X, A4, A3 Ultra, A3 Mega ou A3 High A4, A3 Ultra, A3 Mega ou A3 High avec 8 GPU Toute machine GPU sauf A4X Max et A4X Toute machine GPU sauf A4X Max et A4X
Durée de vie Illimité Jusqu'à 90 jours Jusqu'à 7 jours Illimité (mais soumis à préemption)
Préemptif
Garantie de capacité Très élevée. Si Google Cloud approuve votre demande de réservation, vous avez la quasi-certitude que Compute Engine provisionnera la capacité demandée. Très élevée. Si Google Cloud approuve votre demande de réservation, vous avez la quasi-certitude que Compute Engine provisionnera la capacité demandée. Limitée. Compute Engine s'efforce de planifier le provisionnement de la capacité demandée. Limitée. Compute Engine s'efforce de provisionner la capacité demandée.
Quota Google Cloud augmente automatiquement le quota avant que la capacité ne soit fournie. Aucun quota n'est consommé. Consomme le quota préemptif. Consomme le quota préemptif.
Tarifs
Allocation des ressources Dense Dense Dense de la manière la plus optimale possible ( stratégies compactes ou stratégies de charge de travail facultatives) Standard (stratégie compacte facultative)
Modèle de provisionnement Lié à la réservation Lié à la réservation Démarrage flexible Spot
Méthode de création

Pour créer des VM, vous devez procéder comme suit :

  1. Réservez de la capacité en contactant l'équipe chargée de votre compte.
  2. À la date et à l'heure de votre choix, vous pouvez utiliser la capacité réservée pour créer des VM et des clusters à l'aide de l'une des méthodes décrites dans Présentation des options de déploiement.

Pour créer des VM, vous devez procéder comme suit :

  1. Créer une réservation future en mode Agenda
  2. À la date et à l'heure de votre choix, vous pouvez utiliser la capacité réservée pour créer des VM et des clusters à l'aide de l'une des méthodes décrites dans Présentation des options de déploiement.

Lorsque vous demandez à créer des VM à démarrage flexible, Compute Engine planifie leur création en fonction de la disponibilité. Lorsque de la capacité devient disponible, Compute Engine provisionne les VM à démarrage flexible. Pour créer des VM à démarrage flexible, utilisez l'une des méthodes décrites dans Présentation des options de déploiement.

Vous pouvez créer des VM immédiatement à l'aide de l'une des méthodes décrites dans la présentation des options de déploiement.

Sélectionner une option de consommation

Utilisez l'organigramme suivant pour choisir l'option de consommation qui correspond le mieux à votre charge de travail :

Organigramme présentant les options de consommation pour AI Hypercomputer.

Les questions du schéma précédent sont les suivantes :

  1. Avez-vous besoin de capacité pendant plus de 90 jours ?

  2. Souhaitez-vous utiliser la capacité réservée ?

  3. Votre charge de travail est-elle tolérante aux pannes ?

Utiliser les réservations futures dans AI Hypercomputer

Pour exécuter des charges de travail distribuées de longue durée et à grande échelle qui nécessitent des ressources à allocation dense, vous pouvez demander des ressources de calcul pour une période spécifique à venir. Vous bénéficiez d'un accès exclusif aux ressources réservées pendant cette période. Vous pouvez les utiliser pour créer des VM ou des clusters. À la fin de la période de réservation, Compute Engine effectue les opérations suivantes :

  • Compute Engine supprime la réservation.
  • En fonction de l'action d'arrêt que vous spécifiez pour les VM, Compute Engine arrête ou supprime toutes les VM qui utilisent la réservation.

Charges de travail idéales pour les réservations futures dans AI Hypercomputer

Les réservations futures sont idéales pour les charges de travail suivantes :

  • Pré-entraînement des modèles de fondation

  • Inférence de modèle de fondation multihôte

Caractéristiques clés des réservations futures dans AI Hypercomputer

Les réservations futures présentent les caractéristiques suivantes :

  • Vous pouvez réserver des types de machines A4X Max, A4X, A4, A3 Ultra, A3 Mega ou A3 High (8 GPU). Les machines sont allouées de manière dense pour minimiser la latence du réseau.

  • Vous pouvez réserver n'importe quel nombre de VM pour n'importe quelle durée à partir d'une date ultérieure. Utilisez les ressources réservées pour créer et exécuter des VM jusqu'à la fin de la période de réservation. Si vous réservez des ressources pendant au moins un an, vous devez souscrire un engagement basé sur les ressources et l'associer à vos ressources réservées.

  • Une fois la période de réservation commencée, vous pouvez modifier les réservations créées automatiquement comme suit :

  • Vous utilisez le modèle de provisionnement lié à la réservation, qui présente les avantages suivants :

    • Vous avez plus de chances d'obtenir des GPU.

    • En plus de l'engagement associé à vos VM, vous bénéficiez d'une remise allant jusqu'à 53 % sur les vCPU et les GPU.

Utiliser les réservations futures dans AI Hypercomputer

Pour utiliser des réservations futures afin de créer des VM ou des clusters, vous devez procéder comme suit :

  1. Demandez à réserver de la capacité. Vous contactez l'équipe responsable de votre compte et spécifiez les ressources à réserver. En fonction de la disponibilité, Google crée une demande de réservation provisoire pour vous. Si tout semble correct, vous pouvez l'envoyer. Google Cloud approuve immédiatement la demande de réservation.

    Pour obtenir des instructions, consultez Réserver de la capacité.

  2. Consommer des ressources réservées Au début de la période de réservation choisie, vous pouvez utiliser la réservation pour créer des VM ou des clusters.

    Pour connaître les différentes méthodes de création de VM ou de clusters, consultez Présentation des options de déploiement.

Utiliser les réservations futures en mode Agenda

Pour exécuter des charges de travail distribuées de courte durée qui nécessitent des ressources à allocation dense, vous pouvez demander des ressources de calcul pour une durée maximale de 90 jours. Vous bénéficiez d'un accès exclusif aux ressources réservées pendant cette période. Vous pouvez les utiliser pour créer des VM ou des clusters. À la fin de la période de réservation, Compute Engine effectue les opérations suivantes :

  • Compute Engine supprime la réservation.
  • En fonction de l'action d'arrêt que vous spécifiez pour les VM, Compute Engine arrête ou supprime toutes les VM qui utilisent la réservation.

Charges de travail idéales pour les réservations futures en mode Agenda

Les réservations futures en mode Agenda sont idéales pour les charges de travail suivantes :

  • Pré-entraînement du modèle

  • Affinage de modèles

  • Simulations

  • Inférence

Principales caractéristiques des réservations futures en mode Agenda

Les réservations futures en mode Agenda présentent les caractéristiques suivantes :

  • Vous pouvez réserver des types de machines A4, A3 Ultra, A3 Mega ou A3 High (8 GPU). Ces machines sont allouées de manière dense pour minimiser la latence du réseau.

  • Vous pouvez consulter la disponibilité future et réserver jusqu'à 80 VM pour une durée maximale de 90 jours. Vous pouvez ensuite utiliser les ressources réservées pour créer des VM jusqu'à la fin de la période de réservation.

  • Une fois la période de réservation commencée, vous pouvez modifier les réservations créées automatiquement comme suit :

  • Vous utilisez le modèle de provisionnement lié à la réservation, qui présente les avantages suivants :

    • Vous avez plus de chances d'obtenir des GPU.

    • Vous bénéficiez d'une remise allant jusqu'à 53 % sur les vCPU et les GPU.

Utiliser les réservations futures en mode Agenda

Pour utiliser les réservations futures en mode Agenda afin de créer des VM ou des clusters, vous devez effectuer les étapes suivantes :

  1. Consultez la disponibilité des ressources. Vous pouvez consulter la disponibilité future des ressources que vous souhaitez réserver. Lorsque vous créez une demande de réservation, vous pouvez spécifier le nombre, le type et la durée de réservation des ressources dont vous avez vérifié la disponibilité. Cette action augmente les chances que Google Cloud approuve votre demande.

    Pour obtenir des instructions, consultez Afficher la disponibilité future des ressources.

  2. Capacité de réservation : Vous créez une demande de réservation pour une date et une heure ultérieures. Google Cloud approuve la demande de réservation dans les deux minutes. Si elle est approuvée, Compute Engine réserve la capacité. À la date de livraison choisie, vous pouvez utiliser les ressources réservées pour créer des VM ou des clusters.

    Pour obtenir des instructions, consultez Créer une demande de réservation pour des VM avec GPU ou des TPU.

  3. Consommer des ressources réservées Au début de la période de réservation choisie, vous pouvez utiliser la réservation pour créer des VM ou des clusters.

    Pour découvrir les différentes méthodes de création de VM ou de clusters, consultez les pages suivantes :

Utiliser le démarrage flexible

Pour exécuter des charges de travail de courte durée nécessitant des ressources allouées de manière dense, vous pouvez demander des ressources de calcul pendant sept jours maximum à l'aide du démarrage flexible. Chaque fois que des ressources sont disponibles, Compute Engine crée le nombre de VM que vous avez demandé. Vous pouvez arrêter les VM à démarrage flexible autonomes, mais pas celles qu'un groupe d'instances gérées (MIG) crée par le biais de demandes de redimensionnement. Les VM à démarrage flexible existent jusqu'à ce que vous les supprimiez ou jusqu'à ce que Compute Engine les supprime à la fin de leur durée d'exécution.

Charges de travail idéales pour le démarrage flexible

Le démarrage flexible est idéal pour les charges de travail qui peuvent démarrer à tout moment, comme les suivantes :

  • Pré-entraînement de petits modèles

  • Affinage de modèles

  • Simulations

  • Inférence par lot

Principales caractéristiques du démarrage flexible

Le démarrage flexible présente les caractéristiques suivantes :

  • Vous pouvez demander n'importe quel type de machine GPU, à l'exception des types A4X Max et A4X. Compute Engine s'efforce d'allouer les machines de manière dense, ce qui peut entraîner une grande distance entre les VM Flex-start d'une même zone. Pour contrôler l'emplacement de vos VM et minimiser la latence du réseau, vous pouvez effectuer les opérations suivantes :

  • Vous utilisez le modèle de provisionnement "Démarrage flexible", qui présente les avantages suivants :

    • Vous avez plus de chances d'obtenir des GPU.

    • Vous bénéficiez d'une remise allant jusqu'à 53 % sur les vCPU, la mémoire et les GPU.

Utiliser le démarrage flexible

Pour utiliser le démarrage flexible afin de créer des VM ou des clusters, vous devez procéder comme suit :

  1. Facultatif : créez une stratégie d'emplacement compact ou une règle de charge de travail. Vous pouvez créer une stratégie de concentration (pour les VM autonomes ou les VM groupées) ou une stratégie de charge de travail (pour les MIG) afin de spécifier la proximité des VM. La configuration que vous choisissez affecte les types de machines et le nombre de VM compatibles avec la règle.

  2. Créez des VM à démarrage flexible. Une fois que vous avez demandé à créer des VM, Compute Engine planifie leur création en fonction de la disponibilité. Lorsque de la capacité devient disponible, Compute Engine provisionne les VM à démarrage flexible. Les VM s'exécutent jusqu'à ce que vous les arrêtiez ou les supprimiez, ou jusqu'à ce qu'elles atteignent la fin de leur durée d'exécution.

Pour obtenir des instructions, consultez Présentation des options de déploiement.

Utiliser Spot

Pour exécuter des charges de travail tolérantes aux pannes, vous pouvez obtenir des ressources de calcul immédiatement en fonction de la disponibilité. Vous obtenez des ressources au prix le plus bas possible. Toutefois, Compute Engine peut préempter des VM à tout moment pour récupérer de la capacité.

Charges de travail idéales pour les instances Spot

Spot est idéal pour les charges de travail où les interruptions sont acceptables, comme les suivantes :

  • Traitement par lot

  • Calcul hautes performances (HPC)

  • Intégration continue et déploiement continu (CI/CD)

  • Analyse de données

  • Encodage multimédia

  • Inférence en ligne

Principales caractéristiques de Spot

Spot présente les caractéristiques suivantes :

  • Vous pouvez créer n'importe quel type de machine GPU, à l'exception des types A4X Max et A4X. L'allocation dense dépend de la disponibilité des ressources. Pour vous assurer d'une allocation plus proche, vous pouvez appliquer une stratégie d'emplacement compact aux VM.

  • Vous pouvez créer des VM immédiatement. Les VM s'exécutent jusqu'à ce que vous les arrêtiez ou supprimiez, ou jusqu'à ce que Compute Engine les préempte pour récupérer de la capacité.

  • Vous utilisez le modèle de provisionnement Spot, qui présente les avantages suivants :

    • Vous avez plus de chances d'obtenir des GPU.

    • Vous bénéficiez d'une remise allant jusqu'à 91 % sur de nombreux types de machines, GPU, TPU et disques SSD locaux.

Utiliser Spot

Pour utiliser Spot afin de créer des VM ou des clusters, vous devez effectuer les étapes suivantes :

  1. Facultatif : créez une stratégie d'emplacement compact ou une règle de charge de travail. Vous pouvez créer une stratégie de concentration (pour les VM autonomes ou les VM groupées) ou une stratégie de charge de travail (pour les MIG) afin de spécifier la proximité des VM. La configuration que vous choisissez affecte les types de machines et le nombre de VM compatibles avec la règle.

  2. Créez des VM Spot. Vous pouvez créer autant de VM que vous le souhaitez, en fonction de la disponibilité. Les VM s'exécutent jusqu'à ce que vous les arrêtiez ou supprimiez, ou jusqu'à ce que Compute Engine les préempte pour récupérer de la capacité.

Pour obtenir des instructions, consultez Présentation des options de déploiement.