Options d'utilisation de Cloud TPU

Ce document décrit les options d'utilisation compatibles avec Cloud TPU. Les options d'utilisation sont les méthodes utilisées pour demander de la capacité. Lorsque vous choisissez une option d'utilisation, considérez les facteurs suivants :

  • Dans quels délais avez-vous besoin de la capacité ?
  • Pendant combien de temps avez-vous besoin de la capacité ?
  • Avez-vous besoin de la capacité pour une durée fixe ou flexible ?
  • Votre capacité peut-elle être préemptée ?
  • Tarification

Si vous utilisez les API Cloud TPU, vous avez besoin, pour chaque méthode d'utilisation, d'un quota à la demande ou préemptif pour le nombre de cœurs Cloud TPU que vous souhaitez utiliser. Il existe différents quotas par défaut pour les TPU à la demande et préemptifs, selon la version de TPU. Pour en savoir plus, consultez Quotas Cloud TPU.

Si vous utilisez des TPU avec Google Kubernetes Engine (GKE), vous utilisez le quota de l'API Compute Engine, qui est un quota différent. Pour en savoir plus sur les quotas que vous utilisez pour les TPU dans GKE, consultez Vérifier que vous disposez d'un quota de TPU.

Option d'utilisation Fonctionnement Utilisation optimale Versions de TPU et zones compatibles Type de quota pour l'API Cloud TPU
Réservations futures pour un an ou plus

Vous demandez des ressources TPU à l'avance pour un an ou plus. Ces ressources vous sont réservées exclusivement pendant cette période.

Les réservations offrent le plus haut niveau d'assurance pour l'obtention de la capacité et sont rentables, avec un prix inférieur à celui des ressources à la demande.

Les réservations futures de TPU sont associées à une remise sur engagement d'utilisation. Les remises sur engagement d'utilisation vous permettent de bénéficier de prix réduits en échange de la souscription d'un contrat d'engagement d'utilisation. Pour en savoir plus, consultez Demander une réservation future pour un an ou plus.

Les réservations futures pour un an ou plus sont idéales pour les tâches d'entraînement de longue durée et les charges de travail d'inférence. Toutes les versions de TPU : consultez Régions et zones de TPU. Quota à la demande
Réservations futures jusqu'à 90 jours (en mode Agenda) (Preview)

Vous demandez des ressources TPU selon une heure de début et pour une durée spécifiques, comprises entre 1 et 90 jours. Ces ressources vous sont réservées exclusivement pendant cette période.

Les réservations offrent le plus haut niveau d'assurance pour l'obtention de la capacité et sont rentables, avec un prix inférieur à celui des ressources à la demande.

Pour en savoir plus, consultez Demander une réservation future pour une durée de 90 jours maximum en mode Agenda.

Les réservations futures en mode Agenda sont adaptées aux charges de travail d'entraînement et d'expérimentation qui nécessitent de débuter à une heure précise et ont une durée définie.

v6e (Trillium) pour l'entraînement et la mise en service : asia-northeast1-b, us-east5-a

v5p pour l'entraînement et la mise en service : us-east5-a

v5e pour l'entraînement : us-west4-a

v5e pour la mise en service : us-central1-a

Aucun quota requis
À la demande

Vous demandez des ressources TPU à utiliser dès que possible et aussi longtemps que vous le souhaitez.

L'option à la demande offre la plus grande flexibilité. Les ressources à la demande ne seront pas préemptées, mais il n'est pas garanti qu'il y aura suffisamment de ressources TPU disponibles pour répondre à votre demande. L'option à la demande est définie par défaut lorsque vous créez des ressources TPU. Pour en savoir plus sur la création et l'utilisation de TPU à la demande, consultez Gérer les ressources TPU.

L'option à la demande est adaptée aux tâches urgentes et aux charges de travail qui nécessitent une heure de fin flexible. Toutes les versions de TPU : consultez Régions et zones de TPU. Quota à la demande
Démarrage flexible (Preview)

Vous demandez des ressources TPU pour une durée spécifique (jusqu'à sept jours) sans avoir à réserver de capacité à l'avance.

Les VM TPU à démarrage flexible sont fournies à partir d'un pool de capacité dédié. La disponibilité de ces ressources est donc plus élevée que celle des ressources à la demande. Pour en savoir plus sur l'utilisation des VM TPU à démarrage flexible, consultez Demander des VM TPU à démarrage flexible.

Pour en savoir plus sur l'utilisation des VM TPU à démarrage flexible avec Google Kubernetes Engine (GKE), consultez À propos du provisionnement de GPU et de TPU avec le mode de provisionnement à démarrage flexible.

Le démarrage flexible est idéal pour les expérimentations, les tests à petite échelle, le provisionnement dynamique de TPU pour les charges de travail d'inférence, l'affinage de modèles et les exécutions de charges de travail qui durent moins de sept jours.

v6e (Trillium) : asia-northeast1-b, us-east5-a

v5p : us-east5-a

v5e : us-west4-a

Quota préemptif
Spot

Vous demandez des ressources TPU qui peuvent être préemptées.

Les VM Spot sont disponibles à un prix beaucoup plus bas que les ressources à la demande. Les VM Spot peuvent s'avérer plus faciles à obtenir que les ressources à la demande, mais elles peuvent être préemptées (arrêtées) à tout moment. La durée d'exécution n'est pas limitée. Pour en savoir plus sur les VM Spot TPU, consultez Gérer des VM Spot TPU.

Spot est une bonne solution pour planifier des charges de travail de priorité inférieure, comme le pré-entraînement et l'affinage de modèles, ainsi que les tâches de simulation tolérantes aux interruptions de disponibilité. Toutes les versions de TPU : consultez Régions et zones de TPU. Quota préemptif

Étapes suivantes

Découvrez comment utiliser les TPU à l'aide de :