Peça capacidade de TPU no modo de toda a capacidade
Contacte a Google Cloud equipa da conta para pedir uma reserva no modo de capacidade total.
Peça capacidade de TPUs no modo de capacidade total com partilha de projetos opcional
Contacte a equipa da conta com as informações de registo necessárias. A equipa da sua conta vai criar uma reserva futura no estado de rascunho para que a possa rever através da consola Google Cloud .
Pode pedir uma reserva que pode ser partilhada com outros Google Cloud projetos na sua organização. Também pode pedir uma reserva que possa ser partilhada com outro serviço, como o Vertex AI. Google Cloud Indique a sua preferência de partilha de reservas como parte das informações de registo que dá à sua equipa de conta:
| Propriedade | Descrição |
|---|---|
| Número do projeto | O número (não o ID) do projeto onde a sua equipa da conta cria o pedido e o Compute Engine aprova a capacidade. |
| Geração de TPUs | Trillium ou Ironwood |
| Zona | A zona onde quer reservar capacidade. |
| Número de chips | O número total de chips de TPU a reservar. |
| Hora de início | A hora de início do período de reserva |
| Hora de fim | A hora de fim do período de reserva |
| Nome da reserva | O nome da reserva que o Compute Engine cria para fornecer a sua capacidade reservada |
| Eliminação automática de reservas | Se quer que o Compute Engine elimine automaticamente a reserva criada automaticamente no final do período de reserva. Se quiser eliminar manualmente a reserva, tem de contactar a equipa da sua conta para a eliminar. |
| Tipo de partilha | Se apenas o seu projeto pode usar a reserva criada automaticamente (LOCAL) ou se outros projetos podem usar a reserva (SPECIFIC_PROJECTS). Não pode
alterar esta definição depois de enviar o pedido. Para partilhar capacidade reservada
com outros projetos na sua organização, faça o seguinte:
|
| Nome do compromisso | Se o período de reserva for de um ano ou mais, tem de comprar e anexar um compromisso baseado em recursos aos recursos reservados. Pode comprar um compromisso com um plano de 1 ano ou 3 anos. Se partilhar a capacidade reservada com outros projetos, esses projetos só recebem descontos se usarem a mesma conta do Cloud Billing que o projeto onde reserva capacidade. Para ver detalhes, consulte o artigo Ative a partilha de CUDs para compromissos baseados em recursos. |
As seguintes propriedades estão predefinidas para a sua reserva no modo de capacidade total:
| Propriedade | Descrição |
|---|---|
| Tipo de agendamento de manutenção | Como o Compute Engine agenda a manutenção do anfitrião para as VMs no seu cluster. O TPU Cluster Director só suporta a opção GROUPED, o que significa que a manutenção é sincronizada em todas as VMs de TPU num sub-bloco da sua reserva. |
| Modo de funcionamento da reserva | Como Google Cloud gerir o processo de recuperação da VM após um erro do anfitrião ou um relatório de anfitrião com falhas. O TPU Cluster Director só suporta a opção `ALL_CAPACITY`, o que significa que tem de autogerir o processo de manutenção e recuperação de uma VM. No entanto, tem acesso total a todas as máquinas na sua reserva, bem como um controlo mais detalhado sobre a topologia e a manutenção da VM. |
| Tipo de implementação | Tipo de implementação de capacidade. O Cluster Director de TPU só suporta `DENSE`. |
Confirme o rascunho da reserva de capacidade
Tem de confirmar a reserva de rascunho que a equipa da sua conta cria para si para receber a capacidade do TPU Cluster Director no seu Google Cloud projeto. Siga as instruções em Reveja e envie um pedido de reserva de rascunho para confirmar a reserva.
Verifique o estado de um pedido de capacidade
Pode determinar o estado do seu pedido de capacidade do diretor do cluster de TPUs. Se o pedido for aprovado, a capacidade é atribuída na hora de início pedida durante o período pedido. A faturação começa à hora de início da reserva.
Para mais detalhes, consulte o artigo Veja reservas futuras.
Para ver os detalhes de um pedido de reserva futuro, execute o seguinte comando através da CLI do Google Cloud:
gcloud compute future-reservations describe RESERVATION_NAME \ --zone=ZONE
Substitua o seguinte:
- RESERVATION_NAME: o nome do seu pedido de reserva.
- ZONE: a zona onde a Google criou o pedido.
O resultado é semelhante ao seguinte:
creationTimestamp: '2025-04-01' kind: compute#FutureReservation name: 'RESERVATION_NAME' aggregateReservations: vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L status: lockTime: 2024-03-01T17:00:00Z procurementStatus: APPROVED timeWindow: endTime: 2025-06-01T17:00:00Z startTime: 2024-05-01T17:00:00Z ...
Expanda um pedido de capacidade existente
Pode receber capacidade adicional através de uma reserva existente. Quando é adicionada capacidade adicional, esta herda todas as propriedades de reserva, como as políticas de partilha de reservas. Pode pedir um CUD com a capacidade adicional. O novo CUD vai apontar para a mesma reserva. A equipa da conta conclui o processo de expansão da reserva por si.
Veja os detalhes da reserva na consola Google Cloud
Assim que a sua reserva futura for concretizada, pode encontrá-la na página de reservas da Google Cloud consola
e ver os respetivos detalhes. Uma reserva de TPU com um tipo de implementação Dense indica que se trata de uma reserva do diretor do cluster de TPU.