O Compute Engine fornece unidades de processamento gráfico (GPUs, na sigla em inglês) que podem ser adicionadas às instâncias de máquina virtual (VM, na sigla em inglês). É possível usar essas GPUs para acelerar cargas de trabalho específicas nas suas VMs, como aprendizado de máquina e processamento de dados.
Só é possível usar duas famílias de máquinas ao executar GPUs no Compute Engine:
- A família de máquinas com otimização de acelerador. Todos os tipos de máquina com otimização para aceleradores têm GPUs anexadas.
- A família de máquinas de uso geral N1 A maioria dos tipos de máquina N1 pode ser usada, exceto o tipo de máquina com núcleo compartilhado N1. Se você não estiver usando uma máquina de uso geral N1, mude para uma máquina de uso geral N1 e adicione as GPUs.
Antes de começar
- Para analisar outras etapas de pré-requisito, como selecionar uma imagem do SO e verificar a cota da GPU, consulte o documento de visão geral.
-
Configure a autenticação, caso ainda não tenha feito isso.
Com isso, você confirma sua identidade para acesso a serviços e APIs do Google Cloud . Para executar código ou exemplos em um ambiente de desenvolvimento local, faça a autenticação no Compute Engine com um destes métodos:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
Para usar as amostras da API REST desta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para gcloud CLI.
Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:
gcloud initAo usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.
Saiba mais em Autenticar para usar REST na documentação de autenticação do Google Cloud .
VMs otimizadas para aceleradores
Cada tipo de máquina com otimização de acelerador tem um modelo específico de GPUs NVIDIA anexado para oferecer suporte ao tipo de carga de trabalho recomendado.
Cargas de trabalho de IA e ML Gráficos e visualização Os tipos de máquina da série A otimizados para aceleradores foram projetados para cargas de trabalho de computação de alto desempenho (HPC), inteligência artificial (IA) e machine learning (ML). Para esses tipos de máquina, o modelo de GPU é anexado automaticamente à instância.
Os tipos de máquina da série G otimizados para aceleradores são projetados para cargas de trabalho como as de simulação do NVIDIA Omniverse, aplicativos com muitos gráficos, transcodificação de vídeo e desktops virtuais. Esses tipos de máquina são compatíveis com NVIDIA RTX Virtual Workstations (vWS). Para esses tipos de máquina, o modelo de GPU é anexado automaticamente à instância.
- A4X
(NVIDIA GB200 Superchips)
(nvidia-gb200) - A4
(NVIDIA B200)
(nvidia-b200) - A3 Ultra
(NVIDIA H200)
(nvidia-h200-141gb) - A3 Mega
(NVIDIA H100)
(nvidia-h100-mega-80gb) - A3 High
(NVIDIA H100)
(nvidia-h100-80gb) - A3 Edge
(NVIDIA H100)
(nvidia-h100-80gb) - A2 Ultra
(NVIDIA A100 80GB)
(nvidia-a100-80gb) - A2 Standard
(NVIDIA A100)
(nvidia-a100-40gb)
É possível modificar cada instância otimizada para aceleradores da seguinte maneira:
Para instâncias A4X, A4, A3 e A2 Ultra, não é possível modificar o tipo de máquina. Se você estiver usando um desses tipos de máquina na sua instância e precisar alterar o tipo de máquina, crie uma nova instância.
Para instâncias padrão A2, é possível modificar a contagem de GPUs alternando de um tipo de máquina padrão A2 para outro tipo de máquina A2 padrão.
Para instâncias G4, é possível modificar a contagem de GPUs alternando de um tipo de máquina G4 para outro tipo de máquina G4.
Para instâncias da G2, faça o seguinte:
- É possível modificar a contagem de GPUs alternando de um tipo de máquina G2 para outro tipo de máquina G2.
- É possível alternar de um tipo de máquina G2 para um tipo de máquina de uma família de máquinas diferente, como de uso geral ou com otimização para computação. Consulte Editar o tipo de máquina de uma VM.
Não é possível remover GPUs de nenhum tipo de máquina otimizado para acelerador.
Modificar a contagem de GPUs
É possível modificar a contagem de GPUs de uma instância padrão A2, G4 ou otimizada para aceleradores G2 usando o Google Cloud console ou REST.
Console
Para modificar o número de GPUs da sua instância, interrompa a instância e edite a configuração dela.
Verifique se todos os aplicativos críticos estão parados na instância.
No console do Google Cloud , acesse a página Instâncias de VM para ver sua lista de instâncias.
Clique no nome da instância com o número de GPUs que você quer modificar. A página Detalhes é aberta.
Conclua as etapas a seguir na página Detalhes.
Se a instância estiver em execução, clique em Parar para interromper a instância. Se não houver a opção Parar, clique em Mais ações > Parar.
Clique em Editar.
Na seção Configuração da máquina, selecione a família de máquinas GPU e faça o seguinte:
Na lista Número de GPUs, aumente ou diminua a contagem de GPUs.
Para aplicar as alterações, clique em Salvar.
Para reiniciar a instância, clique em Iniciar/Retomar.
REST
Para modificar o número de GPUs na instância, interrompa a instância e altere o tipo de máquina. Cada tipo de máquina com otimização para aceleradores tem um número específico de GPUs anexadas. Se você mudar o tipo de máquina, isso ajustará o número de GPUs conectadas à instância.
Verifique se todos os aplicativos importantes estão parados na instância. Depois, crie um comando POST para interrompê-la. Assim, ela pode ser movida para um sistema host em que as GPUs estejam disponíveis.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
Depois que a instância parar, crie uma solicitação POST para modificar o tipo de máquina.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType { machineType: "zones/ZONE/machineTypes/MACHINE_TYPE" }Inicie a instância.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
Substitua:
PROJECT_ID: o ID do projeto.VM_NAME: o nome da instância em que você quer adicionar GPUs.ZONE: a zona em que a instância está localizada. Essa zona precisa ser compatível com GPUs.MACHINE_TYPE: o tipo de máquina que você quer usar. Ele precisa ser um dos seguintes:- Se a instância usa uma máquina padrão A2, selecione outro tipo de máquina padrão A2.
- Se a instância estiver usando uma máquina G4, selecione outro tipo de máquina G4.
- Se a instância estiver usando um tipo de máquina G2, selecione outro
tipo de máquina G2.
Os tipos de máquina G2 também oferecem suporte a memória personalizada. A memória precisa ser um múltiplo de 1.024 MB e estar dentro do intervalo de memória compatível. Por exemplo, o nome do tipo de máquina para uma instância com 4 vCPUs e 19 GB de memória seria
g2-custom-4-19456.
Limitações
Instâncias A2
- Só é possível solicitar capacidade usando as opções de consumo aceitas para um tipo de máquina padrão A2.
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina A2 padrão.
- Só é possível usar um tipo de máquina padrão A2 em determinadas regiões e zonas.
- Os tipos de máquina A2 padrão só estão disponíveis na plataforma Cascade Lake.
- Se a instância usa um tipo de máquina padrão A2, só é possível trocar esse tipo A2 padrão por outro tipo A2 padrão. Não é possível mudar para outro tipo de máquina. Para mais informações, consulte Modificar instâncias otimizadas para aceleradores.
- Não é possível usar o sistema operacional Windows com o tipo de máquina
a2-megagpu-16g. Ao usar um sistema operacional Windows, escolha outro tipo de máquina A2. - Não é possível fazer um formato rápido dos SSDs locais anexados em instâncias do Windows que usam tipos de máquina padrão A2.
Para formatar esses SSDs locais, é preciso usar
o utilitário diskpart
e especificar
format fs=ntfs label=tmpfs. - Os tipos de máquina A2 padrão não dão suporte a locatário único.
Instâncias G2
- Só é possível solicitar capacidade usando as opções de consumo compatíveis para um tipo de máquina G2.
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina G2.
- Só é possível usar um tipo de máquina G2 em determinadas regiões e zonas.
- Os tipos de máquina G2 só estão disponíveis na plataforma Cascade Lake.
- O disco permanente padrão (
pd-standard) não é compatível com instâncias que usam o tipo de máquina G2. Para saber quais são os tipos de disco compatíveis, consulte Tipos de disco compatíveis com a G2. - Não é possível criar GPUs de várias instâncias em uma instância que usa um tipo de máquina G2.
- Se precisar mudar o tipo de máquina de uma instância G2, consulte Modificar instâncias otimizadas para aceleradores.
- Não é possível usar o Deep Learning VM Images como discos de inicialização para instâncias que usam o tipo de máquina G2.
- O driver padrão atual para o Container-Optimized OS não oferece suporte a GPUs L4 em execução nos tipos de máquina G2. Além disso, o Container-Optimized OS é compatível apenas com um conjunto selecionado de drivers.
Se você quiser usar o Container-Optimized OS em tipos de máquina G2, leia as seguintes observações:
- Use uma versão do Container-Optimized OS que seja compatível com a versão mínima recomendada do driver NVIDIA ou
525.60.13. Para mais informações, consulte as Notas de lançamento do Container-Optimized OS. - Ao instalar o driver,
especifique a versão mais recente disponível que funciona para as GPUs L4.
Por exemplo,
sudo cos-extensions install gpu -- -version=525.60.13.
- Use uma versão do Container-Optimized OS que seja compatível com a versão mínima recomendada do driver NVIDIA ou
- Use a Google Cloud CLI ou REST para criar instâncias G2 nos seguintes cenários:
- Você quer especificar valores de memória personalizados.
- Você quer personalizar o número de núcleos de CPU visíveis.
Instâncias G4
- Só é possível solicitar capacidade usando as opções de consumo compatíveis para um tipo de máquina G4.
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível para instâncias que usam um tipo de máquina G4.
- Só é possível usar um tipo de máquina G4 em determinadas regiões e zonas.
- Não é possível usar o Persistent Disk (regional ou zonal) em uma instância que usa um tipo de máquina G4.
- O tipo de máquina G4 está disponível apenas na plataforma AMD EPYC Turin de 5ª geração.
- Não é possível criar instâncias de VM confidencial que usam um tipo de máquina G4.
- Não é possível criar instâncias G4 em nós de locatário individual.
- Não é possível usar sistemas operacionais Windows em instâncias
g4-standard-384.
Instâncias de uso geral N1
Esta seção mostra como adicionar ou remover GPUs de uma máquina de uso geral N1.
Em resumo, o processo para adicionar, modificar ou remover GPUs de uma instância atual é o seguinte:
- Verifique se a instância tem um tamanho de disco de inicialização de pelo menos 40 GB.
- Interrompa a instância.
Adicionar, modificar ou remover as GPUs;
Se a instância N1 não tiver GPUs anexadas, siga estas etapas:
- Prepare sua instância para a modificação.
- Modifique a configuração de manutenção do host para a instância. Instâncias com GPUs não podem migrar em tempo real porque estão atribuídas a dispositivos de hardware específicos. Para mais informações, consulte Restrições da GPU.
- Mudar o tipo de máquina. As GPUs são compatíveis apenas com tipos de máquina N1 selecionados.
- Instale um driver de GPU na instância para que o sistema possa usar o dispositivo de GPU.
Preparar a instância
Quando uma GPU é adicionada a uma instância, a ordem da interface de rede pode mudar.
A maioria das imagens públicas no Compute Engine não tem nomes de interface de rede persistentes e se ajusta à nova ordem.
No entanto, se você estiver usando o SLES ou uma imagem personalizada, será necessário atualizar a configuração do sistema para evitar que a interface de rede persista. Para evitar que a interface de rede persista, execute o seguinte comando na instância:
rm /etc/udev/rules.d/70-persistent-net.rules
Adicionar GPUs ou modificar o tipo de GPU em instâncias atuais
Esta seção mostra como adicionar GPUs ou modificar o tipo de GPU em uma instância N1 de uso geral. Este procedimento é compatível com os seguintes tipos de GPU:
GPUs NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):
- NVIDIA T4 Virtual Workstation:
nvidia-tesla-t4-vws - NVIDIA P4 Virtual Workstation:
nvidia-tesla-p4-vws NVIDIA P100 Virtual Workstation:
nvidia-tesla-p100-vwsPara essas estações de trabalho virtuais, uma licença da NVIDIA RTX Virtual Workstation (vWS) é adicionada automaticamente à instância.
Console
Para adicionar GPUs ou modificar o tipo de GPU, conclua as etapas a seguir.
Verifique se todos os aplicativos críticos estão parados na instância.
No console do Google Cloud , acesse a página Instâncias de VM para ver sua lista de instâncias.
Clique no nome da instância que você quer atualizar. A página Detalhes é aberta.
Conclua as etapas a seguir na página Detalhes.
Se a instância estiver em execução, clique em Parar. Se não houver a opção Parar, clique em Mais ações > Parar.
Clique em Editar.
Na seção Configuração da máquina, selecione a família de máquinas GPU e faça o seguinte:
Na lista Tipo de GPU, selecione ou alterne para qualquer um dos tipos de GPU suportados nas VMs N1.
Na lista Número de GPUs, selecione o número de GPUs.
Se o modelo de GPU for compatível com estação de trabalho virtual NVIDIA RTX (vWS) para cargas de trabalho gráficas e você planeja executar cargas de trabalho com muitos gráficos nessa instância, selecione Ativar Estação de trabalho virtual (NVIDIA GRID).
Se a instância não tinha GPUs anexadas antes, faça o seguinte:
Se a instância tiver um tipo de máquina com núcleo compartilhado, será necessário alterá-lo. Na lista Tipo de máquina, selecione um dos tipos de máquina N1 predefinidos. Outra opção é especificar as configurações de tipo de máquina personalizado.
Na seção Gerenciamento, faça o seguinte:
Na lista Na manutenção do host, selecione Encerrar instância da VM. As instâncias com GPUs anexadas não podem migrar em tempo real. Consulte Gerenciar eventos do host da GPU.
Na lista Reinicialização automática, selecione Desativada.
Para aplicar as alterações, clique em Salvar.
Para reiniciar a VM, clique em Iniciar/Retomar.
REST
Para adicionar ou modificar GPUs na instância, interrompa a instância e altere a configuração dela por meio da API.
Verifique se todos os aplicativos importantes estão parados na instância. Depois, crie um comando POST para interrompê-la. Assim, ela pode ser movida para um sistema host em que as GPUs estejam disponíveis.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
Se a instância não tiver GPUs anexadas, siga estas etapas:
Identifique o tipo de GPU que você quer adicionar à instância. É possível enviar uma solicitação
GETpara listar os tipos de GPU disponíveis para o projeto em uma zona específica.GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
Se a instância tiver um tipo de máquina com núcleo compartilhado, altere o tipo de máquina para ter uma ou mais vCPUs. Não é possível adicionar aceleradores a instâncias com tipos de máquinas com núcleo compartilhado.
Crie um comando POST para definir as opções de programação da instância.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling { "onHostMaintenance": "TERMINATE", "automaticRestart": true }
Crie uma solicitação POST para adicionar ou modificar as GPUs anexadas à instância.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources { "guestAccelerators": [ { "acceleratorCount": ACCELERATOR_COUNT, "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE" } ] }Inicie a instância.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
Substitua:
PROJECT_ID: o ID do projeto.VM_NAME: o nome da instância em que você quer adicionar GPUs.ZONE: a zona em que a instância está localizada.ACCELERATOR_COUNT: o número de GPUs que você quer anexar à instância. Para obter uma lista de limites da GPU com base no tipo de máquina da instância, consulte GPUs no Compute Engine.ACCELERATOR_TYPE: o modelo de GPU que você quer anexar ou alterar. Se você planeja executar cargas de trabalho com muitos gráficos nessa instância, use um dos modelos de estação de trabalho virtual.Escolha um dos seguintes valores:
GPUs NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
- NVIDIA T4:
NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):
- NVIDIA T4 Virtual Workstation:
nvidia-tesla-t4-vws - NVIDIA P4 Virtual Workstation:
nvidia-tesla-p4-vws - NVIDIA P100 Virtual Workstation:
nvidia-tesla-p100-vws
Para essas estações de trabalho virtuais, uma licença da NVIDIA RTX Virtual Workstation (vWS) é adicionada automaticamente à instância.
- NVIDIA T4 Virtual Workstation:
Instalar drivers
Para instalar os drivers, escolha uma das seguintes opções:
- Se você planeja executar cargas de trabalho com muitos gráficos, como as de jogos e visualização, instale drivers para a estação de trabalho virtual NVIDIA RTX.
- Para a maioria das cargas de trabalho, instale os drivers da GPU.
Remover GPUs
Esta seção mostra como remover os seguintes tipos de GPU de uma instância de uso geral N1 atual.
GPUs NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
NVIDIA RTX Virtual Workstation (vWS) (anteriormente conhecida como NVIDIA GRID):
- NVIDIA T4 Virtual Workstation:
nvidia-tesla-t4-vws - NVIDIA P4 Virtual Workstation:
nvidia-tesla-p4-vws NVIDIA P100 Virtual Workstation:
nvidia-tesla-p100-vwsPara essas estações de trabalho virtuais, uma licença da NVIDIA RTX Virtual Workstation (vWS) é adicionada automaticamente à instância.
Use o Google Cloud console para remover GPUs de uma instância. Para remover as GPUs, siga as etapas a seguir:
Verifique se todos os aplicativos críticos estão parados na instância.
No console do Google Cloud , acesse a página Instâncias de VM para ver sua lista de instâncias.
Clique no nome da instância com as GPUs que você quer remover. A página Detalhes é aberta.
Conclua as etapas a seguir na página Detalhes.
Se a instância estiver em execução, clique em Parar para interromper a instância. Se não houver a opção Parar, clique em Mais ações > Parar.
Na barra de ferramentas, clique em Editar.
Na seção Configuração da máquina, selecione a família de máquinas Uso geral e faça o seguinte:
Para ver as GPUs anexadas, abra Configurações avançadas.
Na seção GPUs, remova GPUs usando uma das seguintes opções:
Para remover algumas GPUs, na lista Número de GPUs, selecione um número novo.
Para remover todas as GPUs, clique em Excluir GPU.
Opcional: modifique a configuração da política de manutenção do host da instância. As instâncias com GPUs precisam ter a política de manutenção do host definida como Encerrar a instância da VM. No entanto, se você removeu todas as GPUs, terá a opção de migrar essa instância em tempo real durante a manutenção do host. Para mais informações, consulte Definir política de manutenção do host da VM.
Para aplicar as alterações, clique em Salvar.
Para reiniciar a instância, clique em Iniciar/Retomar.
A seguir
- Saiba mais sobre as plataformas de GPU.
- Adicione SSDs locais a instâncias. Dispositivos SSD locais funcionam bem com GPUs quando os aplicativos exigem armazenamento de alto desempenho.
- Crie grupos de instâncias de GPU usando modelos de instância.
- Consulte Como monitorar o desempenho da GPU para mais informações sobre esse assunto.
- Para melhorar o desempenho da rede, consulte Usar uma largura de banda de rede maior.
- Para lidar com a manutenção do host da GPU, consulte "Como manipular eventos do host da GPU".
- Veja o tutorial Como executar cargas de trabalho de inferência do TensorFlow em escala com a TensorRT5 e a GPU NVIDIA T4.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-10-22 UTC.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-10-22 UTC."],[],[]] - A4X
(NVIDIA GB200 Superchips)