Solicitar capacidade de TPU no modo "Toda a capacidade"

Entre em contato com sua Google Cloud equipe de conta para solicitar uma reserva no modo "Toda a capacidade" .

Solicitar capacidade de TPU no modo "Toda a capacidade" com compartilhamento de projeto opcional

Entre em contato com sua equipe de conta e forneça as informações de ingestão necessárias. Sua equipe de conta vai criar uma reserva adiantada em estado de rascunho para você analisar no Google Cloud console.

É possível solicitar uma reserva que pode ser compartilhada com outros Google Cloud projetos na sua organização. Você também pode solicitar uma reserva que pode ser compartilhada com outro Google Cloud serviço, como a Vertex AI. Indique sua preferência de compartilhamento de reserva como parte das informações de ingestão que você fornece à sua equipe de conta:

Propriedade Descrição
Número do projeto O número (não o ID) do projeto em que sua equipe de conta cria a solicitação e o Compute Engine provisiona a capacidade.
Geração de TPU Trillium ou Ironwood
Zona A zona em que você quer reservar capacidade.
Número de chips O número total de chips de TPU a serem reservados.
Horário de início O horário de início do período de reserva
Horário de término O horário de término do período de reserva
Nome da reserva O nome da reserva que o Compute Engine cria para entregar a capacidade reservada
Exclusão automática da reserva Se você quer que o Compute Engine exclua automaticamente a reserva criada automaticamente no final do período de reserva. Se você quiser excluir a reserva manualmente, entre em contato com sua equipe de conta.
Tipo de compartilhamento Se apenas seu projeto pode usar a reserva criada automaticamente (LOCAL), ou se outros projetos podem usar a reserva (SPECIFIC_PROJECTS). Não é possível mudar essa configuração depois de enviar a solicitação. Para compartilhar a capacidade reservada com outros projetos na sua organização, faça o seguinte:
  1. Se ainda não tiver feito isso, verifique se o projeto em que o Google cria a solicitação tem permissão para criar reservas compartilhadas.
  2. Forneça os IDs dos projetos com que você quer compartilhar a capacidade reservada com. É possível especificar até 100 projetos na sua organização.
Nome do compromisso Se o período de reserva for de um ano ou mais, compre e anexe um compromisso baseado em recursos aos recursos reservados. É possível comprar um compromisso com um plano de 1 ano ou 3 anos. Se você compartilhar a capacidade reservada com outros projetos, eles só receberão descontos se usarem a mesma conta do Cloud Billing que o projeto em que você reserva a capacidade. Para mais detalhes, consulte Ativar o compartilhamento de CUDs para compromissos baseados em recursos.

As propriedades a seguir são predefinidas para sua reserva no modo "Toda a capacidade":

Propriedade Descrição
Tipo de programação de manutenção Como o Compute Engine programa a manutenção do host para as VMs no seu cluster. O Cluster Director de TPU só aceita a opção GROUPED, o que significa que a manutenção é sincronizada em todas as VMs de TPU em um sub-bloco da sua reserva.
Modo operacional de reserva Como Google Cloud gerencia o processo de recuperação de VM após um erro de host ou relatório de host com falha. O Cluster Director de TPU só aceita a opção `ALL_CAPACITY`, o que significa que você precisa autogerenciar o processo de manutenção e recuperação de uma VM. No entanto, você tem acesso total a todas as máquinas na sua reserva, bem como um controle mais granular sobre a topologia e a manutenção da VM.
Tipo de implantação Tipo de implantação de capacidade. O Cluster Director de TPU só aceita `DENSE`.

Confirmar o rascunho da reserva de capacidade

Confirme o rascunho da reserva que sua equipe de conta cria para você em ordem para receber a capacidade do Cluster Director de TPU no seu Google Cloud projeto. Siga as instruções em Analisar e enviar uma solicitação de reserva de rascunho para confirmar a reserva.

Verificar o status de uma solicitação de capacidade

É possível determinar o status da sua solicitação de capacidade do Cluster Director de TPU. Se a solicitação for aprovada, a capacidade será alocada no horário de início solicitado para a duração solicitada. O faturamento começa no horário de início da reserva.

Para mais detalhes, consulte Conferir reservas adiantadas.

Para conferir os detalhes de uma solicitação de reserva adiantada, execute o comando a seguir usando a Google Cloud CLI:

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

Substitua:

  • RESERVATION_NAME: o nome da sua solicitação de reserva.
  • ZONE: a zona em que o Google criou a solicitação.

O resultado será assim:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Expandir uma solicitação de capacidade

É possível receber capacidade extra por meio de uma reserva. Quando a capacidade extra é adicionada, ela herda todas as propriedades da reserva, como as políticas de compartilhamento. É possível solicitar um CUD com a capacidade extra. O novo CUD vai apontar para a mesma reserva. Sua equipe de conta vai concluir o processo de expansão da reserva para você.

Conferir detalhes da reserva no Google Cloud console

Depois que sua reserva adiantada for concluída, você poderá encontrá-la na página de reserva do Google Cloud console console e conferir os detalhes. Uma reserva de TPU com um tipo de implantação Dense indica que é uma reserva do Cluster Director de TPU.