Solicitar capacidade de TPU no modo "Toda a capacidade"
Entre em contato com sua Google Cloud equipe de conta para solicitar uma reserva no modo "Toda a capacidade" .
Solicitar capacidade de TPU no modo "Toda a capacidade" com compartilhamento de projeto opcional
Entre em contato com sua equipe de conta e forneça as informações de ingestão necessárias. Sua equipe de conta vai criar uma reserva adiantada em estado de rascunho para você analisar no Google Cloud console.
É possível solicitar uma reserva que pode ser compartilhada com outros Google Cloud projetos na sua organização. Você também pode solicitar uma reserva que pode ser compartilhada com outro Google Cloud serviço, como a Vertex AI. Indique sua preferência de compartilhamento de reserva como parte das informações de ingestão que você fornece à sua equipe de conta:
| Propriedade | Descrição |
|---|---|
| Número do projeto | O número (não o ID) do projeto em que sua equipe de conta cria a solicitação e o Compute Engine provisiona a capacidade. |
| Geração de TPU | Trillium ou Ironwood |
| Zona | A zona em que você quer reservar capacidade. |
| Número de chips | O número total de chips de TPU a serem reservados. |
| Horário de início | O horário de início do período de reserva |
| Horário de término | O horário de término do período de reserva |
| Nome da reserva | O nome da reserva que o Compute Engine cria para entregar a capacidade reservada |
| Exclusão automática da reserva | Se você quer que o Compute Engine exclua automaticamente a reserva criada automaticamente no final do período de reserva. Se você quiser excluir a reserva manualmente, entre em contato com sua equipe de conta. |
| Tipo de compartilhamento | Se apenas seu projeto pode usar a reserva criada automaticamente (LOCAL),
ou se outros projetos podem usar a reserva (SPECIFIC_PROJECTS). Não é possível
mudar essa configuração depois de enviar a solicitação. Para compartilhar a capacidade reservada com outros projetos na sua organização, faça o seguinte:
|
| Nome do compromisso | Se o período de reserva for de um ano ou mais, compre e anexe um compromisso baseado em recursos aos recursos reservados. É possível comprar um compromisso com um plano de 1 ano ou 3 anos. Se você compartilhar a capacidade reservada com outros projetos, eles só receberão descontos se usarem a mesma conta do Cloud Billing que o projeto em que você reserva a capacidade. Para mais detalhes, consulte Ativar o compartilhamento de CUDs para compromissos baseados em recursos. |
As propriedades a seguir são predefinidas para sua reserva no modo "Toda a capacidade":
| Propriedade | Descrição |
|---|---|
| Tipo de programação de manutenção | Como o Compute Engine programa a manutenção do host para as VMs no seu
cluster. O Cluster Director de TPU só aceita a opção GROUPED, o que
significa que a manutenção é sincronizada em todas as VMs de TPU em um sub-bloco da
sua reserva. |
| Modo operacional de reserva | Como Google Cloud gerencia o processo de recuperação de VM após um erro de host ou relatório de host com falha. O Cluster Director de TPU só aceita a opção `ALL_CAPACITY`, o que significa que você precisa autogerenciar o processo de manutenção e recuperação de uma VM. No entanto, você tem acesso total a todas as máquinas na sua reserva, bem como um controle mais granular sobre a topologia e a manutenção da VM. |
| Tipo de implantação | Tipo de implantação de capacidade. O Cluster Director de TPU só aceita `DENSE`. |
Confirmar o rascunho da reserva de capacidade
Confirme o rascunho da reserva que sua equipe de conta cria para você em ordem para receber a capacidade do Cluster Director de TPU no seu Google Cloud projeto. Siga as instruções em Analisar e enviar uma solicitação de reserva de rascunho para confirmar a reserva.
Verificar o status de uma solicitação de capacidade
É possível determinar o status da sua solicitação de capacidade do Cluster Director de TPU. Se a solicitação for aprovada, a capacidade será alocada no horário de início solicitado para a duração solicitada. O faturamento começa no horário de início da reserva.
Para mais detalhes, consulte Conferir reservas adiantadas.
Para conferir os detalhes de uma solicitação de reserva adiantada, execute o comando a seguir usando a Google Cloud CLI:
gcloud compute future-reservations describe RESERVATION_NAME \ --zone=ZONE
Substitua:
- RESERVATION_NAME: o nome da sua solicitação de reserva.
- ZONE: a zona em que o Google criou a solicitação.
O resultado será assim:
creationTimestamp: '2025-04-01' kind: compute#FutureReservation name: 'RESERVATION_NAME' aggregateReservations: vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L status: lockTime: 2024-03-01T17:00:00Z procurementStatus: APPROVED timeWindow: endTime: 2025-06-01T17:00:00Z startTime: 2024-05-01T17:00:00Z ...
Expandir uma solicitação de capacidade
É possível receber capacidade extra por meio de uma reserva. Quando a capacidade extra é adicionada, ela herda todas as propriedades da reserva, como as políticas de compartilhamento. É possível solicitar um CUD com a capacidade extra. O novo CUD vai apontar para a mesma reserva. Sua equipe de conta vai concluir o processo de expansão da reserva para você.
Conferir detalhes da reserva no Google Cloud console
Depois que sua reserva adiantada for concluída, você poderá encontrá-la na página de reserva do Google Cloud console
console
e conferir os detalhes. Uma reserva de TPU com um tipo de implantação Dense indica que é uma reserva do Cluster Director de TPU.