Peça capacidade de TPU no modo de toda a capacidade

Contacte a Google Cloud equipa da conta para pedir uma reserva no modo de capacidade total.

Peça capacidade de TPUs no modo de capacidade total com partilha de projetos opcional

Contacte a equipa da conta com as informações de registo necessárias. A equipa da sua conta vai criar uma reserva futura no estado de rascunho para que a possa rever através da consola Google Cloud .

Pode pedir uma reserva que pode ser partilhada com outros Google Cloud projetos na sua organização. Também pode pedir uma reserva que possa ser partilhada com outro serviço, como o Vertex AI. Google Cloud Indique a sua preferência de partilha de reservas como parte das informações de registo que dá à sua equipa de conta:

Propriedade Descrição
Número do projeto O número (não o ID) do projeto onde a sua equipa da conta cria o pedido e o Compute Engine aprova a capacidade.
Geração de TPUs Trillium ou Ironwood
Zona A zona onde quer reservar capacidade.
Número de chips O número total de chips de TPU a reservar.
Hora de início A hora de início do período de reserva
Hora de fim A hora de fim do período de reserva
Nome da reserva O nome da reserva que o Compute Engine cria para fornecer a sua capacidade reservada
Eliminação automática de reservas Se quer que o Compute Engine elimine automaticamente a reserva criada automaticamente no final do período de reserva. Se quiser eliminar manualmente a reserva, tem de contactar a equipa da sua conta para a eliminar.
Tipo de partilha Se apenas o seu projeto pode usar a reserva criada automaticamente (LOCAL) ou se outros projetos podem usar a reserva (SPECIFIC_PROJECTS). Não pode alterar esta definição depois de enviar o pedido. Para partilhar capacidade reservada com outros projetos na sua organização, faça o seguinte:
  1. Se ainda não o fez, verifique se o projeto onde o Google cria o pedido tem autorização para criar reservas partilhadas.
  2. Indique os IDs dos projetos com os quais quer partilhar a capacidade reservada. Pode especificar até 100 projetos na sua organização.
Nome do compromisso Se o período de reserva for de um ano ou mais, tem de comprar e anexar um compromisso baseado em recursos aos recursos reservados. Pode comprar um compromisso com um plano de 1 ano ou 3 anos. Se partilhar a capacidade reservada com outros projetos, esses projetos só recebem descontos se usarem a mesma conta do Cloud Billing que o projeto onde reserva capacidade. Para ver detalhes, consulte o artigo Ative a partilha de CUDs para compromissos baseados em recursos.

As seguintes propriedades estão predefinidas para a sua reserva no modo de capacidade total:

Propriedade Descrição
Tipo de agendamento de manutenção Como o Compute Engine agenda a manutenção do anfitrião para as VMs no seu cluster. O TPU Cluster Director só suporta a opção GROUPED, o que significa que a manutenção é sincronizada em todas as VMs de TPU num sub-bloco da sua reserva.
Modo de funcionamento da reserva Como Google Cloud gerir o processo de recuperação da VM após um erro do anfitrião ou um relatório de anfitrião com falhas. O TPU Cluster Director só suporta a opção `ALL_CAPACITY`, o que significa que tem de autogerir o processo de manutenção e recuperação de uma VM. No entanto, tem acesso total a todas as máquinas na sua reserva, bem como um controlo mais detalhado sobre a topologia e a manutenção da VM.
Tipo de implementação Tipo de implementação de capacidade. O Cluster Director de TPU só suporta `DENSE`.

Confirme o rascunho da reserva de capacidade

Tem de confirmar a reserva de rascunho que a equipa da sua conta cria para si para receber a capacidade do TPU Cluster Director no seu Google Cloud projeto. Siga as instruções em Reveja e envie um pedido de reserva de rascunho para confirmar a reserva.

Verifique o estado de um pedido de capacidade

Pode determinar o estado do seu pedido de capacidade do diretor do cluster de TPUs. Se o pedido for aprovado, a capacidade é atribuída na hora de início pedida durante o período pedido. A faturação começa à hora de início da reserva.

Para mais detalhes, consulte o artigo Veja reservas futuras.

Para ver os detalhes de um pedido de reserva futuro, execute o seguinte comando através da CLI do Google Cloud:

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

Substitua o seguinte:

  • RESERVATION_NAME: o nome do seu pedido de reserva.
  • ZONE: a zona onde a Google criou o pedido.

O resultado é semelhante ao seguinte:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Expanda um pedido de capacidade existente

Pode receber capacidade adicional através de uma reserva existente. Quando é adicionada capacidade adicional, esta herda todas as propriedades de reserva, como as políticas de partilha de reservas. Pode pedir um CUD com a capacidade adicional. O novo CUD vai apontar para a mesma reserva. A equipa da conta conclui o processo de expansão da reserva por si.

Veja os detalhes da reserva na consola Google Cloud

Assim que a sua reserva futura for concretizada, pode encontrá-la na página de reservas da Google Cloud consola e ver os respetivos detalhes. Uma reserva de TPU com um tipo de implementação Dense indica que se trata de uma reserva do diretor do cluster de TPU.