TPU v2

Ce document décrit l'architecture et les configurations compatibles de Cloud TPU v2.

Architecture du système

Les détails d'architecture et les caractéristiques de performance des TPU v2 sont présentés dans l'article A Domain Specific Supercomputer for Training Deep Neural Networks (Super-ordinateur spécifique au domaine pour l'entraînement de réseaux de neurones profonds).

Configurations

Une tranche TPU v2 est composée de 512 puces interconnectées par des liaisons reconfigurables à haut débit. Pour créer une tranche TPU v2, utilisez le flag --accelerator-type dans la commande de création de TPU (gcloud compute tpus tpu-vm). Vous spécifiez le type d'accélérateur en indiquant la version du TPU et le nombre de cœurs TPU. Par exemple, pour un seul TPU v2, utilisez --accelerator-type=v2-8. Pour une tranche TPU v2 avec 128 TensorCores, utilisez --accelerator-type=v2-128.

La commande suivante montre comment créer une tranche TPU v2 avec 128 TensorCores :

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=us-central1-a \
    --accelerator-type=v2-128 \
    --version=tpu-ubuntu2204-base

Pour en savoir plus sur la gestion des TPU, consultez Gérer des TPU. Pour en savoir plus sur l'architecture système de Cloud TPU, consultez Architecture du système.

Le tableau suivant présente la liste des types de TPU v2 compatibles :

Version du TPU	Fin de la compatibilité
v2-8	(Date de fin pas encore fixée)
v2-32	(Date de fin pas encore fixée)
v2-128	(Date de fin pas encore fixée)
v2-256	(Date de fin pas encore fixée)
v2-512	(Date de fin pas encore fixée)