Visão geral da criação do Cloud TPU
O Compute Engine permite criar e gerenciar máquinas virtuais (VMs) do Cloud TPU como instâncias individuais ou como parte de um grupo gerenciado de instâncias (MIG). Os MIGs podem ter várias VMs de TPU de host único ou frações de TPU de vários hosts. Os MIGs com VMs de host único são mais adequados quando você tem várias cargas de trabalho independentes, por exemplo, cargas de trabalho de inferência. Os MIGs com frações de TPU de vários hosts têm várias VMs de TPU interconectadas que funcionam juntas como uma unidade em uma única carga de trabalho. A maneira como você cria e gerencia as VMs de TPU depende dos requisitos da carga de trabalho.
Para saber como criar uma única VM de TPU, consulte Criar uma instância de VM de TPU única. Para saber mais sobre MIGs e TPUs, consulte Criar VMs do Cloud TPU com MIGs
A seguir
- Saiba como criar um MIG com frações de Cloud TPU de host único.
- Saiba como criar um MIG com uma fração de Cloud TPU de vários hosts.
- Saiba como gerenciar VMs de TPU.
- Saiba mais sobre TPUs no GKE.
- Saiba como executar uma carga de trabalho de ML em TPUs, por exemplo, disponibilizar o Qwen2-72B-Instruct com o vLLM em TPUs.