Ao criar instâncias de VM confidencial com GPUs NVIDIA H100 na série de máquinas A3, você pode encontrar os seguintes erros relacionados a cotas de GPU.
Cota regional insuficiente
Esse erro ocorre quando uma solicitação excede a cota de GPU disponível em uma região específica.
Exemplo de mensagem de erro:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_PER_GPU_FAMILY exceeded. Limit: QUOTA_LIMIT in
region REGION
No console do Google Cloud , as mensagens de erro de cota de GPU podem mostrar um nome de cota genérico, como GPUS_PER_GPU_FAMILY
, em vez do tipo específico que você precisa aumentar. Para instâncias de VM confidenciais com GPUs, esse nome de cota se refere à cota preemptiva.
Para solicitar um aumento na cota de GPUs preemptivas NVIDIA H100 regionais, consulte Solicitar cota preemptiva.
Cota global insuficiente
Esse erro ocorre quando o uso total de GPU em todas as regiões excede a cota global de GPU.
Exemplo de mensagem de erro:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_ALL_REGIONS exceeded. Limit: QUOTA_LIMIT globally
Para solicitar um aumento de cota global, consulte Solicitar cota global.