Glossaire des erreurs Cloud TPU

Ce document fournit un glossaire des erreurs courantes et les solutions du service Cloud TPU.


Type d'accélérateur non valide

Message d'erreur

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

Solution

Un paramètre non valide a été fourni dans la commande "create". La disponibilité d'un accélérateur dans une zone dépend des paramètres suivants : le type, le flag preemptible, le flag spot et le flag reserved. Les flags preemptible, spot et reserved peuvent être modifiées en les incluant ou en les excluant dans la commande "create".

Un TPU créé avec le flag reserved utilisera la capacité réservée. L'inclusion des flags spot ou preemptible permettra au TPU d'être préempté par des TPU de priorité supérieure. Si aucun de ces flags n'est fourni, le TPU sera à la demande. Pour que la configuration soit valide, un seul de ces flags peut être activé à la fois. Pour en savoir plus, consultez la documentation sur la commande "create".

Les types d'accélérateurs disponibles dans chaque zone sont indiqués dans la documentation sur les régions et zones TPU. Vous pouvez également utiliser une requête à l'aide de la commande "accelerator-types list". Modifiez la commande "create" pour utiliser l'un de ces types d'accélérateur, puis réessayez. Si le problème persiste, contactez l'assistance.

Réseau introuvable.

Message d'erreur

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

Solution

Le réseau xxxx est introuvable. Assurez-vous que le réseau a été créé et configuré correctement. Pour en savoir plus, consultez Créer et gérer des réseaux VPC.

Autorisation de compte de service refusée

Message d'erreur

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

Solution

Cette erreur se produit lorsqu'un utilisateur tente de créer ou de lister des nœuds dans un projet sans autorisation IAM. Ce problème est probablement dû au fait que le compte de service de l'API Cloud TPU ne dispose pas du rôle requis pour le projet. La documentation sur la gestion des comptes d'accès vous explique comment gérer l'accès. Suivez la procédure Attribuer ou révoquer un rôle unique et attribuez le rôle "Agent de service de l'API Cloud TPU" au compte "service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com" (assurez-vous de remplacer PROJECT_NUMBER par le numéro de votre projet, que vous trouverez dans les paramètres du projet dans la console Google Cloud ). Pour en savoir plus sur les agents de service, consultez la documentation sur les agents de service.

Quota dépassé

Message d'erreur

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

Solution

Votre projet a atteint une limite de quota. Pour en savoir plus sur l'utilisation des quotas, consultez la documentation sur les quotas Cloud. Il ne faut pas le confondre avec le quota de TPU, qui régit l'utilisation des pods TPU.

Vous pouvez demander une augmentation de la limite pour atteindre le quota approprié en suivant les étapes décrites dans Demander un ajustement de quota. Sur la page des quotas, vous pouvez rechercher le quota spécifié par la partie "YYYY" de ce message. Certains quotas sont répartis entre différentes régions ou différents services. Le message d'erreur indiquera celui qui doit être augmenté.

Les parties "XXXX" et "YYYY" du message peuvent représenter l'un des quotas suivants :

  • HEALTH_CHECKS : quota "Vérifications de l'état"
  • FIREWALLS : quota "Règles de pare-feu"
  • NETWORK_ENDPOINT_GROUPS : quota "Groupes de points de terminaison du réseau" pour cette région
  • READ_REQUESTS : quota "Requêtes de lecture par minute" pour le service d'API Compute Engine
  • OPERATION_READ_REQUESTS : quota "Requêtes de lecture d'opérations par minute"

Cette demande est généralement traitée sous deux à trois jours ouvrés. Si la demande est urgente, contactez un ingénieur client ou un responsable de compte technique.