Solicitar capacidad de TPU en el modo Toda la capacidad

Ponte en contacto con el equipo de tu cuenta de Google Cloud para solicitar una reserva en el modo de capacidad total.

Solicitar capacidad de TPU en el modo Toda la capacidad con la opción de compartir el proyecto

Ponte en contacto con el equipo de tu cuenta y facilítale la información necesaria. Tu equipo de cuenta creará una reserva futura en estado de borrador para que la revises en la consola de Google Cloud .

Puedes solicitar una reserva que se pueda compartir entre otros Google Cloud proyectos de tu organización. También puedes solicitar una reserva que se pueda compartir con otro servicio, como Vertex AI. Google Cloud Indica tu preferencia de cuota de reserva como parte de la información que proporciones a tu equipo de cuenta:

Propiedad Descripción
Número de proyecto El número (no el ID) del proyecto en el que tu equipo de cuentas crea la solicitud y Compute Engine proporciona la capacidad.
Generación de TPU Trillium o Ironwood
Zona La zona en la que quieres reservar capacidad.
Número de chips Número total de chips de TPU que se van a reservar.
Hora de inicio Hora de inicio del periodo de reserva
Hora de finalización Hora de finalización del periodo de reserva.
Nombre de la reserva Nombre de la reserva que crea Compute Engine para ofrecerte la capacidad reservada.
Eliminación automática de reservas Indica si quieres que Compute Engine elimine automáticamente la reserva creada automáticamente al final del periodo de reserva. Si quieres eliminar la reserva manualmente, debes ponerte en contacto con tu equipo de asistencia para que la elimine.
Tipo de uso compartido Si solo tu proyecto puede usar la reserva creada automáticamente (LOCAL) o si otros proyectos pueden usarla (SPECIFIC_PROJECTS). No puedes cambiar este ajuste después de enviar la solicitud. Para compartir la capacidad reservada con otros proyectos de tu organización, haz lo siguiente:
  1. Si aún no lo has hecho, verifica que el proyecto en el que Google crea la solicitud pueda crear reservas compartidas.
  2. Proporciona los IDs de los proyectos con los que quieres compartir la capacidad reservada. Puedes especificar hasta 100 proyectos en tu organización.
Nombre del compromiso Si el periodo de reserva es de un año o más, debes comprar y adjuntar un compromiso basado en los recursos a los recursos reservados. Puedes comprar un compromiso con un plan de 1 o 3 años. Si compartes la capacidad reservada con otros proyectos, estos solo obtendrán descuentos si usan la misma cuenta de facturación de Cloud que el proyecto en el que reservas la capacidad. Para obtener más información, consulta Habilitar el uso compartido de CUDs en compromisos basados en recursos.

Las siguientes propiedades están predefinidas para tu reserva en el modo Toda la capacidad:

Propiedad Descripción
Tipo de programación de mantenimiento Cómo programa Compute Engine el mantenimiento del host de las VMs de tu clúster. TPU Cluster Director solo admite la opción GROUPED, lo que significa que el mantenimiento se sincroniza en todas las VMs de TPU de un subbloque de tu reserva.
Modo de funcionamiento de la reserva Cómo Google Cloud gestiona el proceso de recuperación de la VM después de un error del host o de un informe de host defectuoso. TPU Cluster Director solo admite la opción `ALL_CAPACITY`, lo que significa que debes gestionar tú mismo el proceso de mantenimiento y recuperación de una VM. Sin embargo, tienes acceso completo a todas las máquinas de tu reserva, así como un control más granular sobre la topología y el mantenimiento de tus VMs.
Tipo de implementación Tipo de implementación de capacidad. TPU Cluster Director solo admite `DENSE`.

Confirmar el borrador de tu reserva de capacidad

Debes confirmar la reserva de borrador que cree tu equipo de cuenta para recibir la capacidad de TPU Cluster Director en tu proyecto de Google Cloud . Siga las instrucciones de la sección Revisar y enviar una solicitud de reserva borrador para confirmar la reserva.

Consultar el estado de una solicitud de capacidad

Puedes determinar el estado de tu solicitud de capacidad de Cluster Director de TPU. Si se aprueba la solicitud, la capacidad se asigna a la hora de inicio solicitada durante el periodo solicitado. La facturación comienza a la hora de inicio de la reserva.

Para obtener más información, consulta Ver reservas futuras.

Para ver los detalles de una solicitud de reserva futura, ejecuta el siguiente comando con la CLI de Google Cloud:

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

Haz los cambios siguientes:

  • RESERVATION_NAME: el nombre de tu solicitud de reserva.
  • ZONE: la zona en la que Google creó la solicitud.

El resultado debería ser similar al siguiente:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Ampliar una solicitud de capacidad

Puedes recibir capacidad adicional a través de una reserva. Cuando se añade capacidad adicional, hereda todas las propiedades de la reserva, como las políticas de uso compartido de reservas. Puedes solicitar un CUD con la capacidad adicional. El nuevo CUD apuntará a la misma reserva. El equipo de tu cuenta completará el proceso de ampliación de la reserva.

Ver los detalles de una reserva desde la consola de Google Cloud

Una vez que se haya completado la reserva, podrás encontrarla en la página Reserva de la consola Google Cloud y ver sus detalles. Una reserva de TPU con el tipo de implementación Dense indica que se trata de una reserva de Cluster Director de TPU.