Présentation de la création de Cloud TPU
Compute Engine vous permet de créer et de gérer des machines virtuelles (VM) TPU, soit en tant qu'instances individuelles, soit en tant que membres d'un groupe d'instances géré (MIG). Les MIG peuvent comporter plusieurs VM TPU à hôte unique ou tranches TPU multi-hôtes. Les MIG avec des VM à hôte unique sont idéaux lorsque vous avez plusieurs charges de travail indépendantes, par exemple des charges de travail d'inférence. Les MIG avec des tranches TPU multi-hôtes comportent plusieurs VM TPU interconnectées qui fonctionnent ensemble comme une unité sur une même charge de travail. La façon dont vous créez et gérez vos VM TPU dépend des exigences de votre charge de travail.
Pour savoir comment créer une seule VM TPU, consultez Créer une instance de VM TPU unique. Pour en savoir plus sur les MIG et les TPU, consultez Créer des VM Cloud TPU avec des MIG.
Étapes suivantes
- Découvrez comment créer un MIG avec des tranches Cloud TPU à hôte unique.
- Découvrez comment créer un MIG avec une tranche Cloud TPU multi-hôte.
- Découvrez comment gérer les VM TPU.
- En savoir plus sur les TPU dans GKE
- Découvrez comment exécuter une charge de travail de ML sur des TPU, par exemple Diffuser Qwen2-72B-Instruct avec vLLM sur des TPU.