Opciones de consumo de Cloud TPU

En este documento, se proporciona una descripción de las opciones de consumo compatibles con Cloud TPU. Las opciones de consumo son los métodos que se usan para solicitar capacidad. Cuando elijas una opción de consumo, ten en cuenta los siguientes factores:

  • La rapidez con la que necesitas la capacidad
  • Cuánto tiempo necesitas la capacidad
  • Si necesitas capacidad para un período fijo o flexible
  • Si tu capacidad se puede interrumpir
  • Precios

Si usas las APIs de Cloud TPU, cada método de consumo requiere una cuota, ya sea según demanda o interrumpible, que corresponde a la cantidad de núcleos de Cloud TPU que desees usar. Existen diferentes cuotas predeterminadas interrumpibles y según demanda para cada versión de TPU. Para obtener más información, consultaCuotas de Cloud TPU.

Si usas TPU con Google Kubernetes Engine (GKE), usas la cuota de la API de Compute Engine, que es una cuota diferente. Para obtener más información sobre las cuotas que usas para las TPU en GKE, consulta Asegúrate de tener cuota de TPU.

Opción de consumo Cómo funciona Se recomienda su uso para Versiones y zonas de TPU compatibles Tipo de cuota para la API de Cloud TPU
Reservas futuras de un año o más

Solicitas recursos TPU con anticipación por un año o más. Estos recursos se reservan para tu uso exclusivo durante ese período.

Las reservas proporcionan el nivel más alto de garantía de capacidad y son rentables, con un precio más bajo que los recursos según demanda.

Las reservas futuras de TPU tienen un descuento por compromiso de uso (CUD) adjunto. Los CUD proporcionan precios con descuento a cambio de la compra de un contrato por compromiso de uso. Para obtener más información, consulta Cómo solicitar una reserva futura por un año o más.

Las reservas futuras de un año o más son ideales para los trabajos de entrenamiento de larga duración y las cargas de trabajo de inferencia. Todas las versiones de TPU: Consulta Regiones y zonas de TPU Cuota según demanda
Reservas futuras de hasta 90 días (en modo de calendario) (Vista previa)

Solicitas recursos TPU para una hora de inicio y una duración específicas, entre 1 y 90 días. Estos recursos se reservan para tu uso exclusivo durante ese período.

Las reservas proporcionan el nivel más alto de garantía de capacidad y son rentables, con un precio más bajo que los recursos según demanda.

Para obtener más información, consulta Cómo solicitar una reserva futura con hasta 90 días de anticipación en el modo de calendario.

Las reservas futuras en el modo de calendario son adecuadas para las cargas de trabajo de entrenamiento y experimentación que requieren horas de inicio precisas y tienen una duración definida.

v6e (Trillium) para entrenamiento y entrega: asia-northeast1-b, us-east5-a

v5p para entrenamiento y entrega: us-east5-a

v5e para entrenamiento: us-west4-a

v5e para entrega: us-central1-a

No se requiere cuota
Según demanda

Solicitas que se usen los recursos TPU lo antes posible y durante el tiempo que quieras.

La opción según demanda ofrece la mayor flexibilidad. Los recursos según demanda no se interrumpirán, pero no hay garantía de que haya suficientes recursos TPU disponibles para satisfacer tu solicitud. Esta opción es la predeterminada cuando creas recursos TPU. Para obtener más información sobre cómo crear y usar TPU según demanda, consulta Administra recursos TPU.

Es una buena opción para trabajos urgentes y cargas de trabajo que requieren una hora de finalización flexible. Todas las versiones de TPU: Consulta Regiones y zonas de TPU Cuota según demanda
Inicio flexible (vista previa)

Solicitas recursos TPU por un período específico, de hasta 7 días, sin necesidad de reservar capacidad con anticipación.

Las VMs de TPU de inicio flexible se entregan desde un grupo de capacidad exclusivo, por lo que la disponibilidad de estos recursos es mayor que la de los recursos según demanda. Para obtener más información sobre el uso de las VMs de inicio flexible de TPU, consulta Cómo solicitar VMs de inicio flexible de TPU.

Para obtener más información sobre el uso de VMs de TPU de inicio flexible con Google Kubernetes Engine (GKE), consulta Acerca del aprovisionamiento de GPU y TPU con el modo de aprovisionamiento de inicio flexible.

El inicio flexible es ideal para la experimentación, las pruebas a pequeña escala, el aprovisionamiento dinámico de TPU para cargas de trabajo de inferencia, el ajuste de modelos y las ejecuciones de cargas de trabajo que tardan menos de 7 días.

v6e (Trillium): asia-northeast1-b, us-east5-a

v5p: us-east5-a

v5e: us-west4-a

Cuota interrumpible
Spot

Solicitas recursos TPU que podrían interrumpirse.

Las VMs Spot están disponibles a un precio mucho más bajo que los recursos según demanda. También pueden ser más fáciles de obtener que estos recursos, pero se pueden interrumpir (apagar) en cualquier momento. No hay límite en la duración del entorno de ejecución. Para obtener más información sobre las VMs Spot de TPU, consulta Administra VMs Spot de TPU.

Spot es una buena opción para programar cargas de trabajo de menor prioridad, como entrenamiento previo, ajuste y trabajos de simulación de modelos que toleran las interrupciones de disponibilidad. Todas las versiones de TPU: Consulta Regiones y zonas de TPU Cuota interrumpible

¿Qué sigue?

Comienza a usar las TPU con las siguientes opciones: