Solicitar capacidade de TPU no modo "Toda a capacidade"
Entre em contato com sua equipe de conta do Google Cloud para solicitar uma reserva no modo "Toda a capacidade".
Solicitar capacidade de TPU no modo "Toda a capacidade" com compartilhamento de projeto opcional
Entre em contato com a equipe da sua conta e informe os dados necessários. Sua equipe de conta vai criar uma reserva adiantada em estado de rascunho para você analisar no console Google Cloud .
É possível solicitar uma reserva que pode ser compartilhada entre outros projetos do Google Cloud na sua organização. Você também pode solicitar uma reserva que pode ser compartilhada com outro serviço do Google Cloud , como a Vertex AI. Indique sua preferência de compartilhamento de reserva como parte das informações de recebimento que você envia à equipe da sua conta:
| Propriedade | Descrição |
|---|---|
| Número do projeto | O número (não o ID) do projeto em que a equipe da sua conta cria a solicitação e o Compute Engine provisiona a capacidade. |
| Geração de TPU | Trillium ou Ironwood |
| Zona | A zona em que você quer reservar capacidade. |
| Número de chips | O número total de chips de TPU a serem reservados. |
| Horário de início | O horário de início do período de reserva |
| Horário de término | O horário de término do período de reserva |
| Nome da reserva | O nome da reserva que o Compute Engine cria para entregar sua capacidade reservada. |
| Exclusão automática de reservas | Se você quer que o Compute Engine exclua automaticamente a reserva criada automaticamente no final do período de reserva. Se você quiser excluir a reserva manualmente, entre em contato com sua equipe de conta. |
| Tipo de compartilhamento | Se apenas seu projeto pode usar a reserva criada automaticamente (LOCAL) ou se outros projetos podem usar a reserva (SPECIFIC_PROJECTS). Não é possível mudar essa configuração depois de enviar a solicitação. Para compartilhar a capacidade reservada com outros projetos na sua organização, faça o seguinte:
|
| Nome do compromisso | Se o período da reserva for de um ano ou mais, compre e anexe um compromisso baseado em recursos aos recursos reservados. É possível comprar um compromisso com um plano de um ou três anos. Se você compartilhar a capacidade reservada com outros projetos, eles só vão receber descontos se usarem a mesma conta do Cloud Billing que o projeto em que você reserva a capacidade. Para mais detalhes, consulte Ativar o compartilhamento de CUDs para compromissos baseados em recursos. |
As seguintes propriedades são predefinidas para sua reserva no modo "Toda a capacidade":
| Propriedade | Descrição |
|---|---|
| Tipo de programação de manutenção | Como o Compute Engine programa a manutenção do host para as VMs no seu cluster. O TPU Cluster Director só é compatível com a opção GROUPED, o que significa que a manutenção é sincronizada em todas as VMs de TPU em um subbloco da sua reserva. |
| Modo operacional da reserva | Como o Google Cloud gerencia o processo de recuperação da VM após um erro de host ou relatório de host com falha. O TPU Cluster Director só aceita a opção "ALL_CAPACITY", o que significa que você precisa autogerenciar o processo de manutenção e recuperação de uma VM. No entanto, você tem acesso total a todas as máquinas na sua reserva, além de um controle mais granular sobre a topologia e a manutenção da VM. |
| Tipo de implantação | Tipo de implantação de capacidade. O TPU Cluster Director é compatível apenas com `DENSE`. |
Confirmar o rascunho da reserva de capacidade
Você precisa confirmar a reserva provisória criada pela equipe da sua conta para receber a capacidade do TPU Cluster Director no projeto do Google Cloud . Siga as instruções em Analisar e enviar um rascunho de solicitação de reserva para confirmar a reserva.
Verificar o status de uma solicitação de capacidade
É possível determinar o status da sua solicitação de capacidade do Cluster Director de TPU. Se a solicitação for aprovada, a capacidade será alocada no horário de início e pelo período solicitados. O faturamento começa no horário de início da reserva.
Para mais detalhes, consulte Conferir reservas adiantadas.
Para conferir os detalhes de uma solicitação de reserva futura, execute o seguinte comando usando a Google Cloud CLI:
gcloud compute future-reservations describe RESERVATION_NAME \ --zone=ZONE
Substitua:
- RESERVATION_NAME: o nome da sua solicitação de reserva.
- ZONE: a zona em que o Google criou a solicitação.
O resultado será o seguinte:
creationTimestamp: '2025-04-01' kind: compute#FutureReservation name: 'RESERVATION_NAME' aggregateReservations: vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L status: lockTime: 2024-03-01T17:00:00Z procurementStatus: APPROVED timeWindow: endTime: 2025-06-01T17:00:00Z startTime: 2024-05-01T17:00:00Z ...
Expandir uma solicitação de capacidade
Você pode receber capacidade extra com uma reserva. Quando uma capacidade adicional é adicionada, ela herda todas as propriedades da reserva, como políticas de compartilhamento. É possível solicitar um CUD com a capacidade adicional. A nova CUD vai apontar para a mesma reserva. Sua equipe de conta vai concluir o processo de expansão de reserva para você.
Conferir detalhes da reserva no console do Google Cloud
Depois que a reserva adiantada for atendida, ela vai aparecer no console do Google Cloud
na página "Reserva"
com os detalhes. Uma reserva de TPU com um tipo de implantação Dense indica que
é uma reserva do TPU Cluster Director.