Descripción general de la creación de Cloud TPU
Compute Engine te permite crear y administrar máquinas virtuales (VMs) de TPU, ya sea como instancias individuales o como parte de un grupo de instancias administrado (MIG). Los MIG pueden tener varias VMs de TPU de host único o porciones de TPU de varios hosts. Los MIG con VMs de host único son ideales cuando tienes varias cargas de trabajo independientes, por ejemplo, cargas de trabajo de inferencia. Los MIG con porciones de TPU de varios hosts tienen varias VMs de TPU interconectadas que funcionan juntas como una unidad en una sola carga de trabajo. La forma en que creas y administras tus VMs de TPU depende de los requisitos de tu carga de trabajo.
Para aprender a crear una sola VM de TPU, consulta Crea una instancia de VM de TPU única. Para obtener información sobre los MIG y las TPU, consulta Crea VMs de Cloud TPU con MIG.
¿Qué sigue?
- Aprende a crear un MIG con porciones de Cloud TPU de host único.
- Aprende a crear un MIG con una porción de Cloud TPU de varios hosts.
- Aprende a administrar VMs de TPU.
- Obtén información sobre las TPU en GKE.
- Aprende a ejecutar una carga de trabajo de AA en TPU, por ejemplo, entrega Qwen2-72B-Instruct con vLLM en TPU.