Vista geral da criação de uma instância com GPUs anexadas

Este documento fornece uma vista geral dos passos necessários para criar uma instância do Compute Engine com unidades de processamento de gráficos (GPUs) anexadas. Pode usar GPUs para acelerar cargas de trabalho específicas, como a aprendizagem automática e o processamento de dados.

Também pode usar alguns tipos de máquinas com GPU no hipercomputador de IA. O AI Hypercomputer é um sistema de supercomputação otimizado para suportar as suas cargas de trabalho de inteligência artificial (IA) e aprendizagem automática (AA). Esta opção é recomendada para criar uma infraestrutura densamente alocada e otimizada para o desempenho que tenha integrações para o Google Kubernetes Engine (GKE) e os programadores do Slurm.

Para mais informações sobre as GPUs no Compute Engine, consulte o artigo Acerca das GPUs.

Selecione o modelo de GPU

Para ver uma lista dos modelos de GPU disponíveis, consulte o artigo Plataformas de GPU. Tome também nota do tipo de máquina suportado para o modelo de GPU selecionado.

Para cada modelo, também pode ser útil rever o seguinte:

Limitações

Além das restrições para todas as instâncias com GPUs, cada série de máquinas com GPUs anexadas tem as seguintes limitações:

Instâncias A4X

Instâncias A4

Instâncias A3 Ultra

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A3 Ultra.
  • Não recebe descontos por utilização sustentada nem descontos de fidelidade flexíveis para instâncias que usam um tipo de máquina A3 Ultra.
  • Só pode usar um tipo de máquina A3 Ultra em determinadas regiões e zonas.
  • Não pode usar o disco persistente (regional ou zonal) numa instância que use um tipo de máquina A3 Ultra.
  • O tipo de máquina A3 Ultra só está disponível na plataforma de CPU Emerald Rapids.
  • Não pode alterar o tipo de máquina de uma instância existente para um tipo de máquina A3 Ultra. Só pode criar novas instâncias A3-ultra. Depois de criar uma instância com um tipo de máquina A3 Ultra, não pode alterar o tipo de máquina.
  • Os tipos de máquinas A3 Ultra não suportam posse exclusiva.
  • Não pode executar sistemas operativos Windows num tipo de máquina A3 Ultra.

Instâncias A3 Mega

Instâncias A3 High

Instâncias A3 Edge

Instâncias padrão A2

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina padrão A2.
  • Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina padrão A2.
  • Só pode usar um tipo de máquina A2 Standard em determinadas regiões e zonas.
  • O tipo de máquina A2 Standard só está disponível na plataforma Cascade Lake.
  • Se a sua instância usar um tipo de máquina A2 Standard, só pode mudar de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard. Não pode alterar o tipo de máquina. Para mais informações, consulte o artigo Modifique instâncias otimizadas para aceleradores.
  • Não pode usar o sistema operativo Windows com o tipo de máquina a2-megagpu-16g. Quando usar um sistema operativo Windows, escolha um tipo de máquina padrão A2 diferente.
  • Não pode fazer uma formatação rápida dos SSDs locais anexados em instâncias do Windows que usam tipos de máquinas padrão A2. Para formatar estes SSDs locais, tem de fazer uma formatação completa através do utilitário diskpart e especificar format fs=ntfs label=tmpfs.
  • Os tipos de máquinas padrão A2 não suportam a posse exclusiva.

Instâncias A2 Ultra

  • Só pode pedir capacidade através das opções de consumo suportadas para um tipo de máquina A2 Ultra.
  • Não recebe descontos por utilização sustentada nem descontos por utilização de fidelidade flexível para instâncias que usam um tipo de máquina A2 Ultra.
  • Só pode usar um tipo de máquina A2 Ultra em determinadas regiões e zonas.
  • O tipo de máquina A2 Ultra só está disponível na plataforma Cascade Lake.
  • Se a sua instância usar um tipo de máquina A2 Ultra, não pode alterar o tipo de máquina. Se precisar de usar um tipo de máquina A2 Ultra diferente ou qualquer outro tipo de máquina, tem de criar uma nova instância.
  • Não pode alterar nenhum outro tipo de máquina para um tipo de máquina A2 Ultra. Se precisar de uma instância que use um tipo de máquina A2 Ultra, tem de criar uma nova instância.
  • Não pode fazer uma formatação rápida dos SSDs locais anexados em instâncias do Windows que usam tipos de máquinas A2 Ultra. Para formatar estes SSDs locais, tem de fazer uma formatação completa através do utilitário diskpart e especificar format fs=ntfs label=tmpfs.

Instâncias G4

Instâncias G2

Instâncias N1+GPU

Para saber mais sobre as limitações das instâncias N1 com GPUs, consulte as funcionalidades da série de máquinas N1 e as GPUs da série de máquinas N1.

Escolha um sistema operativo

Se estiver a usar GPUs para aprendizagem automática, use um dos seguintes sistemas operativos:

  • Imagens otimizadas para cargas de trabalho de IA. Pode usar imagens do Ubuntu e do Rocky, que estão disponíveis em versões otimizadas para aceleradores com controladores da NVIDIA e o CUDA Toolkit pré-instalado. Consulte as imagens do SO na documentação do hipercomputador de IA.

  • Deep Learning VM Images. Cada VM de aprendizagem profunda tem uma ferramenta de instalação de controladores de GPU e inclui pacotes como o TensorFlow e o PyTorch. Também pode usar uma VM de aprendizagem profunda para cargas de trabalho de GPU gerais. Para saber mais acerca das imagens disponíveis e dos pacotes instalados nestas imagens, consulte o artigo Escolher uma imagem na documentação da VM de aprendizagem profunda.

Em alternativa, pode usar uma imagem pública ou personalizada. Para a maioria das imagens públicas ou imagens personalizadas, tem de instalar os controladores da NVIDIA e o CUDA Toolkit. Para ajudar a identificar que controladores são adequados para o seu modelo de GPU, consulte o artigo sobre a instalação de controladores de GPU.

Verifique a quota da GPU

Para proteger os sistemas e os utilizadores do Compute Engine, os novos projetos têm uma quota de GPU global, que limita o número total de GPUs que pode criar em qualquer zona suportada. Para rever a quota de GPU, consulte o artigo Quota de GPU.

Se precisar de uma quota de GPU adicional, peça um aumento da quota. Quando pede quota de GPU, tem de pedir quota para os tipos de GPU que quer criar em cada região e uma quota global adicional para o número total de GPUs de todos os tipos em todas as zonas.

Se o seu projeto tiver um histórico de faturação estabelecido, recebe automaticamente a quota depois de enviar o pedido.

Instâncias de GPU e quotas de atribuição preemptivas

Normalmente, as instâncias que usam o modelo de aprovisionamento padrão não podem usar quotas de alocação preemptivas. As quotas preemptivas destinam-se a cargas de trabalho temporárias e estão normalmente mais disponíveis. Se o seu projeto não tiver uma quota preemptível e nunca a tiver pedido, todas as instâncias no seu projeto consomem quotas de alocação padrão.

Se pedir uma quota de alocação preemptível, as instâncias que usam o modelo de aprovisionamento padrão têm de cumprir todos os seguintes critérios para consumir a quota de alocação preemptível:

Quando consome a atribuição preemptível para cargas de trabalho de GPU com limite de tempo, pode beneficiar do tempo de execução ininterrupto e da elevada obtenção da quota de atribuição preemptível. Para mais informações, consulte o artigo Quotas preemptíveis.

Crie uma instância com GPUs anexadas

Para criar uma instância com GPUs anexadas, conclua os seguintes passos:

  1. Crie a instância. O método usado para criar uma instância depende da carga de trabalho que quer executar.

    Tipos de máquinas com GPU
    Cargas de trabalho de IA e ML Gráficos e visualização Outras cargas de trabalho da GPU
    Os tipos de máquinas da série A otimizados para aceleradores foram concebidos para cargas de trabalho de computação de elevado desempenho (HPC), inteligência artificial (IA) e aprendizagem automática (AA).

    Para estes tipos de máquinas, o modelo de GPU é anexado automaticamente à instância.

    Os tipos de máquinas da série G otimizados para aceleradores foram concebidos para cargas de trabalho, como cargas de trabalho de simulação do NVIDIA Omniverse, aplicações com utilização intensiva de gráficos, transcodificação de vídeo e computadores virtuais. Estes tipos de máquinas suportam as estações de trabalho virtuais (vWS) NVIDIA RTX.

    Para estes tipos de máquinas, o modelo de GPU é anexado automaticamente à instância.

    Para os tipos de máquinas de uso geral N1, exceto para o N1 de núcleo partilhado (f1-micro e g1-small), pode anexar um conjunto selecionado de modelos de GPU. Alguns destes modelos de GPU também suportam estações de trabalho virtuais (vWS) NVIDIA RTX.

    Para cargas de trabalho de IA, ML e HPC, escolha uma das seguintes opções:

    Para criar uma instância G2 (L4) ou G4 (RTX PRO 6000), consulte o artigo Crie uma instância G2 ou G4. Para criar uma instância N1 com GPUs NVIDIA T4, P4, P100 ou V100 anexadas, consulte o artigo Crie uma instância N1 com GPUs anexadas.
  2. Para que a instância use a GPU, tem de instalar o controlador da GPU na instância. Se ativou uma estação de trabalho virtual NVIDIA RTX (anteriormente conhecida como NVIDIA GRID), instale um controlador para a estação de trabalho virtual.

O que se segue?