Solicita capacidad de TPU en el modo All Capacity

Comunícate con tu equipo de cuentas de Google Cloud para solicitar una reserva en el modo All Capacity.

Solicita capacidad de TPU en el modo All Capacity con uso compartido opcional del proyecto

Comunícate con tu equipo de cuentas y proporciona la información de admisión requerida. Tu equipo de cuentas creará una reserva futura en estado de borrador para que la revises en la consola de Google Cloud .

Puedes solicitar una reserva que se pueda compartir con otros proyectos de Google Clouden tu organización. También puedes solicitar una reserva que se pueda compartir con otro servicio de Google Cloud , como Vertex AI. Indica tu preferencia de uso compartido en la reserva como parte de la información de admisión que le proporcionas a tu equipo de cuentas:

Propiedad Descripción
Número del proyecto El número (no el ID) del proyecto en el que tu equipo de cuentas crea la solicitud y Compute Engine aprovisiona la capacidad
Generación de TPU Trillium o Ironwood
Zona Es la zona en la que deseas reservar la capacidad
Cantidad de chips Es la cantidad total de chips TPU que se reservarán
Hora de inicio Hora de inicio del período de reserva
Hora de finalización La hora de finalización del período de reserva
Nombre de la reserva Es el nombre de la reserva que crea Compute Engine para entregar la capacidad reservada
Eliminación automática de reservas Indica si deseas que Compute Engine borre de forma automática la reserva creada automáticamente al final del período de reserva. Si deseas hacerlo forma manual, debes comunicarte con tu equipo de cuentas para que la borre
Tipo de uso compartido Indica si solo tu proyecto puede usar la reserva creada de forma automática (LOCAL) o si otros proyectos pueden usarla (SPECIFIC_PROJECTS). No puedes cambiar este parámetro de configuración después de enviar la solicitud. Para compartir la capacidad reservada con otros proyectos de tu organización, haz lo siguiente:
  1. Si aún no lo hiciste, verifica que el proyecto en el que Google crea la solicitud esté autorizado para crear reservas compartidas.
  2. Proporciona los IDs de los proyectos con los que se compartirá la capacidad reservada. Puedes especificar hasta 100 proyectos en tu organización.
Nombre del compromiso Si el período de reserva es de un año o más, debes comprar y adjuntar un compromiso basado en recursos a los recursos reservados. Puedes comprar un compromiso con un plan de 1 o 3 años. Si compartes la capacidad reservada con otros proyectos, estos obtendrán descuentos solo si usan la misma cuenta de Facturación de Cloud que el proyecto en el que reservaste la capacidad. Para obtener más información, consulta Habilita el uso compartido del CUD para los compromisos basados en recursos

Las siguientes propiedades están preestablecidas para tu reserva en el modo All Capacity:

Propiedad Descripción
Tipo de programación del mantenimiento Cómo Compute Engine programa el mantenimiento del host para las VMs de tu clúster. Cluster Director de TPU solo admite la opción GROUPED, lo que significa que el mantenimiento se sincroniza en todas las VMs de TPU de un subbloque de tu reserva.
Modo operativo de la reserva Cómo Google Cloud administra el proceso de recuperación de la VM después de un error de host o un informe de host defectuoso. Cluster Director de TPU solo admite la opción "ALL_CAPACITY", lo que significa que debes autoadministrar el proceso de mantenimiento y recuperación de una VM. Sin embargo, tienes acceso completo a todas las máquinas de tu reserva, así como un control más detallado sobre la topología y el mantenimiento de tus VM.
Tipo de implementación Es el tipo de implementación de capacidad. Cluster Director de TPU solo admite "DENSE".

Confirma el borrador de tu reserva de capacidad

Debes confirmar el borrador de la reserva que crea tu equipo de cuentas para recibir la capacidad del Cluster Director de TPU en tu proyecto de Google Cloud . Sigue las instrucciones de Revisa y envía un borrador de solicitud de reserva para confirmar la reserva.

Verifica el estado de una solicitud de capacidad

Puedes determinar el estado de tu solicitud de capacidad del Cluster Director de TPU. Si se aprueba la solicitud, la capacidad se asigna en la hora de inicio solicitada durante el período solicitado. La facturación comienza a la hora de inicio de la reserva.

Para obtener más detalles, consulta Visualiza las reservas futuras.

Para ver los detalles de una solicitud de reserva futura (una reserva llamada "exfr1"), ejecuta el siguiente comando en Google Cloud CLI:

gcloud compute future-reservations describe exfr1 \
    --zone=us-central1-a

El resultado es similar a lo siguiente:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'exfr1'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Expande una solicitud de capacidad existente

Puedes recibir capacidad adicional a través de una reserva existente. Cuando se agrega una capacidad adicional, esta hereda todas las propiedades de la reserva, como las políticas de uso compartido de la reserva. Puedes solicitar un CUD con la capacidad adicional. El nuevo CUD apuntará a la misma reserva. Tu equipo de cuentas completará el proceso de expansión de la reserva por ti.

Visualiza los detalles de la reserva desde la consola de Google Cloud

Una vez que se complete tu reserva futura, podrás encontrarla en la consola de Google Cloud en la página de reserva y ver sus detalles. Una reserva de TPU con un tipo de implementación Dense indica que es una reserva del Cluster Director de TPU.