Glossário de erros do Cloud TPU
Este documento oferece um glossário de erros comuns do serviço Cloud TPU com soluções possíveis.
Tipo de acelerador inválido
Mensagem de erro
generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and reserved (false) is not available in zone us-central1-a, please contact support.
Solução
Um parâmetro inválido foi fornecido ao comando create. A disponibilidade
de um acelerador em uma zona depende dos seguintes parâmetros: tipo, flag preemptible,
flag spot e flag reserved. As flags preemptible, spot
e reserved podem ser alteradas pela inclusão ou exclusão no comando
create.
Uma TPU criada com a flag reserved usa uma capacidade
reservada. Incluir as flags spot ou preemptible permite que a TPU seja interrompida por
TPUs de maior prioridade. Se nenhuma dessas flags for fornecida, a TPU será on demand. Não é
uma configuração válida ativar mais de uma dessas flags. Consulte a
documentação do comando create para mais informações.
Os tipos de acelerador disponíveis em cada zona podem ser encontrados na documentação de regiões e zonas de TPU ou consultados usando o comando accelerator-types list. Mude o comando create para usar um desses tipos de acelerador e tente de novo ou entre em contato com o suporte se o problema persistir.
Rede não encontrada
Mensagem de erro
Cloud TPU received a bad request. The field "Network" cannot be "xxxx": requested resource not found
Solução
A rede xxxx não foi encontrada. Verifique se a rede foi criada e configurada corretamente. Consulte Criar e gerenciar redes VPC para mais informações.
Permissão negada para conta de serviço
Mensagem de erro
generic::permission_denied: Cloud TPU got permissions denied when trying to access the customer project. Make sure that the IAM account 'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts
Solução
Esse erro ocorre quando um usuário tenta criar ou listar nós em um projeto
sem autorização do IAM. Uma causa provável desse problema é que a conta de serviço da API Cloud TPU
não tem o papel necessário no projeto. A documentação sobre como gerenciar contas de acesso
oferece uma visão geral de como fazer isso. Siga as etapas em Conceder ou revogar um único papel
e atribua à conta service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.como papel de Agente de serviço da API Cloud TPU.
Não se esqueça de substituir PROJECT_NUMBER pelo número do projeto, que pode ser encontrado nas configurações do projeto no console do Google Cloud . Para mais
informações sobre agentes de serviço, consulte a documentação sobre agentes de serviço.
Cota excedida
Mensagem de erro
You have reached XXXX limit. Please request an increase for the 'YYYY' quota for Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.
Solução
Seu projeto atingiu um limite de cota. Para saber como trabalhar com cotas, consulte a documentação sobre as cotas do Cloud. Não confunda essa cota com a cota de TPU, que rege o uso de pods de TPU.
Para pedir um aumento no limite, siga as etapas em Solicitar um ajuste de cota. Na página de cotas, pesquise a cota especificada pela parte YYYY da mensagem. Algumas cotas são divididas em diferentes regiões ou serviços. A mensagem de erro indica qual delas precisa ser aumentada.
As partes XXXX e YYYY da mensagem podem ser uma das seguintes opções:
- HEALTH_CHECKS: cota de verificações de integridade.
- FIREWALLS: cota de regras de firewall.
- NETWORK_ENDPOINT_GROUPS: cota de grupos de endpoints de rede para a região.
- READ_REQUESTS: cota de solicitações de leitura por minuto para o serviço da API Compute Engine.
- OPERATION_READ_REQUESTS: cota de solicitações de leitura de operações por minuto.
Em geral, essa solicitação é processada em até dois ou três dias úteis. Se o pedido for urgente, entre em contato com um engenheiro de clientes ou com o gerente técnico de contas.