Solicitar capacidade de TPU no modo "Toda a capacidade"

Entre em contato com sua equipe de conta do Google Cloud para solicitar uma reserva no modo "Toda a capacidade".

Solicitar capacidade de TPU no modo "Toda a capacidade" com compartilhamento de projeto opcional

Entre em contato com a equipe da sua conta e informe os dados necessários. Sua equipe de conta vai criar uma reserva adiantada em estado de rascunho para você analisar no console Google Cloud .

É possível solicitar uma reserva que pode ser compartilhada entre outros projetos do Google Cloud na sua organização. Você também pode solicitar uma reserva que pode ser compartilhada com outro serviço do Google Cloud , como a Vertex AI. Indique sua preferência de compartilhamento de reserva como parte das informações de recebimento que você envia à equipe da sua conta:

Propriedade Descrição
Número do projeto O número (não o ID) do projeto em que a equipe da sua conta cria a solicitação e o Compute Engine provisiona a capacidade.
Geração de TPU Trillium ou Ironwood
Zona A zona em que você quer reservar capacidade.
Número de chips O número total de chips de TPU a serem reservados.
Horário de início O horário de início do período de reserva
Horário de término O horário de término do período de reserva
Nome da reserva O nome da reserva que o Compute Engine cria para entregar sua capacidade reservada.
Exclusão automática de reservas Se você quer que o Compute Engine exclua automaticamente a reserva criada automaticamente no final do período de reserva. Se você quiser excluir a reserva manualmente, entre em contato com sua equipe de conta.
Tipo de compartilhamento Se apenas seu projeto pode usar a reserva criada automaticamente (LOCAL) ou se outros projetos podem usar a reserva (SPECIFIC_PROJECTS). Não é possível mudar essa configuração depois de enviar a solicitação. Para compartilhar a capacidade reservada com outros projetos na sua organização, faça o seguinte:
  1. Se ainda não tiver feito isso, verifique se o projeto em que o Google cria a solicitação tem permissão para criar reservas compartilhadas.
  2. Informe os IDs dos projetos com que você quer compartilhar a capacidade reservada. É possível especificar até 100 projetos na sua organização.
Nome do compromisso Se o período da reserva for de um ano ou mais, compre e anexe um compromisso baseado em recursos aos recursos reservados. É possível comprar um compromisso com um plano de um ou três anos. Se você compartilhar a capacidade reservada com outros projetos, eles só vão receber descontos se usarem a mesma conta do Cloud Billing que o projeto em que você reserva a capacidade. Para mais detalhes, consulte Ativar o compartilhamento de CUDs para compromissos baseados em recursos.

As seguintes propriedades são predefinidas para sua reserva no modo "Toda a capacidade":

Propriedade Descrição
Tipo de programação de manutenção Como o Compute Engine programa a manutenção do host para as VMs no seu cluster. O TPU Cluster Director só é compatível com a opção GROUPED, o que significa que a manutenção é sincronizada em todas as VMs de TPU em um subbloco da sua reserva.
Modo operacional da reserva Como o Google Cloud gerencia o processo de recuperação da VM após um erro de host ou relatório de host com falha. O TPU Cluster Director só aceita a opção "ALL_CAPACITY", o que significa que você precisa autogerenciar o processo de manutenção e recuperação de uma VM. No entanto, você tem acesso total a todas as máquinas na sua reserva, além de um controle mais granular sobre a topologia e a manutenção da VM.
Tipo de implantação Tipo de implantação de capacidade. O TPU Cluster Director é compatível apenas com `DENSE`.

Confirmar o rascunho da reserva de capacidade

Você precisa confirmar a reserva provisória criada pela equipe da sua conta para receber a capacidade do TPU Cluster Director no projeto do Google Cloud . Siga as instruções em Analisar e enviar um rascunho de solicitação de reserva para confirmar a reserva.

Verificar o status de uma solicitação de capacidade

É possível determinar o status da sua solicitação de capacidade do Cluster Director de TPU. Se a solicitação for aprovada, a capacidade será alocada no horário de início e pelo período solicitados. O faturamento começa no horário de início da reserva.

Para mais detalhes, consulte Conferir reservas adiantadas.

Para conferir os detalhes de uma solicitação de reserva futura, execute o seguinte comando usando a Google Cloud CLI:

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

Substitua:

  • RESERVATION_NAME: o nome da sua solicitação de reserva.
  • ZONE: a zona em que o Google criou a solicitação.

O resultado será o seguinte:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Expandir uma solicitação de capacidade

Você pode receber capacidade extra com uma reserva. Quando uma capacidade adicional é adicionada, ela herda todas as propriedades da reserva, como políticas de compartilhamento. É possível solicitar um CUD com a capacidade adicional. A nova CUD vai apontar para a mesma reserva. Sua equipe de conta vai concluir o processo de expansão de reserva para você.

Conferir detalhes da reserva no console do Google Cloud

Depois que a reserva adiantada for atendida, ela vai aparecer no console do Google Cloud na página "Reserva" com os detalhes. Uma reserva de TPU com um tipo de implantação Dense indica que é uma reserva do TPU Cluster Director.