Configurer l'environnement Cloud TPU

Avant de pouvoir utiliser des ressources Cloud TPU pour entraîner des modèles ou exécuter l'inférence sur ceux-ci, vous devez d'abord :

Configurer votre projet Google Cloud

Pour utiliser Cloud TPU, vous devez disposer d'un compte et d'un projet Google Cloud .

  1. Dans la consoleGoogle Cloud , connectez-vous à votre compte Google ou créez-en un.

  2. Créez un projet Google Cloud . Pour en savoir plus, consultez Créer un projet.

  3. Activez la facturation pour votre projet Google Cloud .

    Toute utilisation de Google Cloud nécessite que la facturation soit configurée. Vous ne serez facturé qu'après avoir commencé à utiliser les ressources Google Cloud . Pour en savoir plus, consultez la documentation Cloud Billing.

    L'utilisation de toutes les versions de Cloud TPU est facturée conformément aux tarifs régionaux standards indiqués sur la page Tarifs de Cloud TPU.

  4. Installez la Google Cloud CLI. La Google Cloud CLI est un ensemble de bibliothèques et d'outils permettant d'accéder aux ressources et aux services Google Cloud , et de les gérer.

  5. Configurez la commande gcloud que vous avez installée dans la Google Cloud CLI.

    Exécutez les commandes suivantes pour configurer gcloud afin qu'il utilise votre projet Google Cloud.

    $ gcloud config set project PROJECT_ID
  6. Assurez-vous que la facturation est activée pour votre projet Google Cloud .

    Toute utilisation de Google Cloud nécessite que la facturation soit configurée. Vous ne serez facturé qu'après avoir commencé à utiliser les ressources Google Cloud . Pour en savoir plus, consultez la documentation Cloud Billing.

    L'utilisation de toutes les versions de Cloud TPU est facturée conformément aux tarifs régionaux standards indiqués sur la page Tarifs de Cloud TPU.

Configurer votre environnement pour qu'il utilise Cloud TPU

Avant de demander un Cloud TPU, vous devez activer l'API Cloud TPU et vous assurer que vous disposez des autorisations nécessaires pour gérer l'accès à votre projet et créer un Cloud TPU. Il est également recommandé de créer un compte de service géré par l'utilisateur à associer à votre TPU.

  1. Activez l'API Cloud TPU depuis la console Google Cloud ou à l'aide de gcloud CLI dans Cloud Shell :

    gcloud

    $ gcloud services enable tpu.googleapis.com

    Console

    1. Dans la console Google Cloud , accédez à la page de l'API Cloud TPU.

    Accéder à la page de l'API Cloud TPU

    1. Cliquez sur Activer.
  2. Assurez-vous de disposer des rôles suivants sur votre projet :

    Suivez les instructions dans Consulter les accès actuels pour voir quels comptes principaux ont accès à votre projet, dossier ou organisation. Pour consulter les accès dont vous disposez, recherchez la ligne contenant votre adresse e-mail dans la colonne Compte principal. Si votre adresse e-mail ne figure pas dans cette colonne, cela signifie que vous n'avez aucun rôle. Dans la colonne Rôle de la ligne contenant votre adresse e-mail, vérifiez que la liste des rôles inclut les rôles requis.

    Si un des rôles requis est manquant, accordez-vous ce rôle ou demandez à un administrateur de le faire.

  3. Créez un agent de service Cloud TPU :

    Les agents de service représentent un type d'identité de service géré par Google et utilisé par le service Cloud TPU pour effectuer des opérations dans votre projet Google Cloud . Par exemple, l'agent de service est utilisé pour créer et gérer des ressources Cloud TPU.

      $ gcloud beta services identity create --service tpu.googleapis.com --project PROJECT_ID
  4. Créez un compte de service TPU :

    Les comptes de service servent d'identifiants pour vos VM TPU. Les rôles associés à un compte de service accordent l'accès aux ressources Google Cloud . Nous vous recommandons d'utiliser un compte de service géré par l'utilisateur, en n'accordant que les autorisations requises par votre VM TPU. Lorsque vous utilisez un compte de service géré par l'utilisateur, vous devez le spécifier lorsque vous créez une VM TPU à l'aide du flag --service-account.

    1. Suivez les instructions dans Créer des comptes de service pour créer un compte de service géré par l'utilisateur.

    2. Suivez les instructions dans Gérer l'accès aux projets, aux dossiers et aux organisations pour accorder à votre compte de service l'accès aux services Google Cloud auxquels votre TPU accédera. Les rôles suivants sont recommandés pour que votre TPU puisse accéder aux servicesGoogle Cloud couramment utilisés.

Préparer la création d'un Cloud TPU

Avant de créer un Cloud TPU, vous devez demander un quota. Vous devez également envisager d'utiliser des ressources en file d'attente et décider des paramètres que vous souhaitez utiliser pour configurer votre TPU.

  1. Sélectionnez une option de consommation.

    Les options de consommation sont les méthodes utilisées pour demander de la capacité Cloud TPU. Choisissez une option de consommation en fonction des facteurs suivants :

    • Dans quels délais avez-vous besoin de la capacité ?
    • Pendant combien de temps avez-vous besoin de la capacité ?
    • Avez-vous besoin de la capacité pour une durée fixe ou flexible ?
    • Votre capacité peut-elle être préemptée ?
    • Tarification

    Pour en savoir plus, consultez Options de consommation Cloud TPU.

  2. Demandez des quotas :

    Les quotas de TPU sont des limites sur le nombre de cœurs Cloud TPU que vous pouvez utiliser avec un projetGoogle Cloud . Chaque version de TPU est associée à son propre quota. Pour créer un Cloud TPU, votre projet Google Cloud doit disposer d'un quota pour la version et la taille de TPU que vous souhaitez créer, ainsi que pour la zone dans laquelle vous souhaitez le créer. Pour en savoir plus sur l'allocation de quotas, les types de quotas et la façon de demander des quotas, consultez Quotas.

    Si vous créez des TPU avec Google Kubernetes Engine ou Vertex AI, vous aurez besoin d'un quota pour ces services. Pour en savoir plus sur les quotas GKE, consultez Planifier la configuration de vos TPU avec GKE. Pour en savoir plus sur les quotas Vertex AI, consultez Quotas et limites de Vertex AI.

  3. Déterminez si vous souhaitez utiliser des ressources en file d'attente.

    Il est recommandé de créer un Cloud TPU en tant que ressource en file d'attente. Les ressources mises en file d'attente vous permettent de recevoir de la capacité dès qu'elle est disponible. Vous pouvez spécifier une heure de début et de fin pour le traitement de la demande (facultatif).

    Il existe différentes commandes gcloud CLI pour travailler avec les ressources en file d'attente. Pour en savoir plus, consultez le guide de l'utilisateur des ressources en file d'attente.

  4. Déterminez les paramètres de création de Cloud TPU :

    • Zone : définissez le flag --zone sur la zone dans laquelle vous souhaitez créer un TPU. Vous devez disposer d'un quota alloué dans cette zone. Pour en savoir plus, consultez Régions et zones TPU.

    • Configuration des TPU : si vous n'avez pas besoin de spécifier une topologie personnalisée ou que vous utilisez des TPU v2 ou v3, définissez le flag --accelerator-type sur vVERSION-TENSORCORES. Remplacez VERSION par le numéro de version de TPU que vous souhaitez utiliser. Remplacez TENSORCORES par le nombre de TensorCores que vous souhaitez utiliser.

      Si vous souhaitez personnaliser la topologie physique de votre TPU, utilisez les flags --version et --topology. Définissez le flag --version sur la version de TPU que vous souhaitez utiliser. Définissez le flag --topology sur la topologie que vous souhaitez utiliser.

      Pour en savoir plus sur les configurations de TPU, y compris les configurations et variantes de topologie compatibles, consultez Versions de TPU.

    • Version du logiciel : si vous demandez une ressource en file d'attente, définissez le flag --runtime-version sur le nom de la version du logiciel que vous souhaitez utiliser. Sinon, utilisez le flag --version. Les versions logicielles de TPU sont disponibles pour les frameworks TensorFlow, PyTorch et JAX. Pour en savoir plus sur les versions logicielles compatibles, consultez Versions logicielles des VM TPU.

    • Compte de service : définissez --service-account sur l'adresse e-mail d'un compte de service (si vous en avez créé un) pour l'associer à votre TPU. Si aucune valeur n'est fournie, le compte de service Compute Engine par défaut est utilisé.

    • Type de quota : ajoutez le flag correspondant au type de quota que vous souhaitez utiliser :

      Type de quota Flag
      Réservé --reserved
      VM Spot --spot
      Préemptif (non disponible pour les ressources en file d'attente ; utilisez plutôt --spot) --preemptible
      À la demande Aucun flag supplémentaire n'est nécessaire.
    • Configuration avancée : vous pouvez ajouter des flags supplémentaires à votre requête pour configurer votre TPU. Pour en savoir plus, consultez la documentation de gcloud compute tpus tpu-vm create et les sections suivantes :

Pour obtenir des exemples de création d'un Cloud TPU, consultez Premiers pas.

Étapes suivantes

  1. Découvrez comment créer et gérer des ressources de VM et de TPU.
  2. Suivez un guide de démarrage rapide Cloud TPU.