Criar uma VM N1 com GPUs anexadas

Linux Windows

Neste documento, explicamos como criar uma VM que tenha GPUs anexadas e usa uma família de máquinas N1. É possível usar a maioria dos tipos de máquinas N1, exceto N1 shared-core.

Antes de começar

Para analisar outras etapas de pré-requisito, como selecionar uma imagem do SO e verificar a cota da GPU, consulte o documento de visão geral.
Configure a autenticação, caso ainda não tenha feito isso. Com isso, você confirma sua identidade para acesso a serviços e APIs do Google Cloud . Para executar código ou exemplos em um ambiente de desenvolvimento local, faça a autenticação no Compute Engine com um destes métodos:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:
  gcloud init
  Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.
  
  Observação: se você já instalou a gcloud CLI, execute o comando gcloud components update para verificar se você tem a versão mais recente.
2. Set a default region and zone.
REST

Para usar as amostras da API REST desta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para gcloud CLI.
Saiba mais em Autenticar para usar REST na documentação de autenticação do Google Cloud .

Papéis necessários

Para receber as permissões necessárias para criar VMs, peça ao administrador para conceder a você o papel do IAM de Administrador da instância do Compute (v1) (roles/compute.instanceAdmin.v1) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esse papel predefinido contém as permissões necessárias para criar VMs. Para acessar as permissões exatas necessárias, abra a seção Permissões necessárias:

Permissões necessárias

As permissões a seguir são necessárias para criar VMs:

compute.instances.create no projeto
Usar uma imagem personalizada para criar a VM: compute.images.useReadOnly na imagem
Usar um snapshot para criar a VM: compute.snapshots.useReadOnlyno snapshot
Usar um modelo de instância para criar a VM: compute.instanceTemplates.useReadOnly no modelo de instância
Especificar uma sub-rede para a VM: compute.subnetworks.use no projeto ou na sub-rede escolhida
Especificar um endereço IP estático para a VM: compute.addresses.use no projeto
Atribuir um endereço IP externo à VM ao usar uma rede VPC: compute.subnetworks.useExternalIp no projeto ou na sub-rede escolhida
Atribuir uma rede legada à VM: compute.networks.use no projeto
Atribuir um endereço IP externo à VM usando uma rede legada: compute.networks.useExternalIp no projeto
Definir os metadados da instância de VM para a VM: compute.instances.setMetadata no projeto
Definir tags para a VM: compute.instances.setTags na VM
Definir rótulos para a VM: compute.instances.setLabels na VM
Definir uma conta de serviço a ser usada pela VM: compute.instances.setServiceAccount na VM
Criar um disco para a VM: compute.disks.create no projeto
Anexar um disco atual no modo somente leitura ou de leitura e gravação: compute.disks.use no disco
Anexar um disco atual no modo somente leitura: compute.disks.useReadOnly no disco

Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.

Visão geral

Os seguintes modelos de GPU podem ser anexados a VMs que usam famílias de máquinas N1.

GPUs NVIDIA:

NVIDIA T4: nvidia-tesla-t4
NVIDIA P4: nvidia-tesla-p4
NVIDIA P100: nvidia-tesla-p100
NVIDIA V100: nvidia-tesla-v100

NVIDIA RTX Virtual Workstation (vWS) (antiga NVIDIA GRID):

NVIDIA T4 Virtual Workstation: nvidia-tesla-t4-vws
NVIDIA P4 Virtual Workstation: nvidia-tesla-p4-vws
NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws

Para essas estações de trabalho virtuais, uma licença da NVIDIA RTX Virtual Workstation (vWS) é adicionada automaticamente à sua instância.

Criar uma VM com GPUs anexadas

É possível criar uma VM N1 que tenha GPUs anexadas usando o console doGoogle Cloud , a CLI do Google Cloud ou a REST.

Console

No console do Google Cloud , acesse a página Criar uma instância.

Acessar "Criar uma instância"
Especifique um Nome para sua VM. Consulte a Convenção de nomenclatura de recursos.
Selecione uma região e uma zona em que as GPUs estejam disponíveis. Veja a lista de zonas de GPU disponíveis.
Na seção Configuração da máquina, selecione a família de máquinas GPU e faça o seguinte:
1. Na lista Tipo de GPU, selecione um dos modelos de GPU compatíveis com a máquina N1.
2. Na lista Número de GPUs, selecione o número de GPUs.
3. Se o modelo de GPU for compatível com NVIDIA RTX Virtual Workstations (vWS) para cargas de trabalho gráficas e você planeja executar cargas de trabalho com muitos gráficos nessa VM, selecione Ativar Virtual Workstation (NVIDIA GRID)
4. Na lista Tipo de máquina, selecione um dos tipos de máquina N1 predefinidos. Outra opção é especificar as configurações de tipo de máquina personalizado.
Na seção Disco de inicialização, clique em Mudar. A página Configuração do disco de inicialização será aberta.
Na página Configuração do disco de inicialização, faça o seguinte:
1. Na guia Imagens públicas, escolha uma imagem do Compute Engine compatível ou Deep Learning VM Images.
2. Especifique um tamanho do disco de inicialização de pelo menos 40 GB.
3. Para confirmar as opções do disco de inicialização, clique em Selecionar.
Opcional: na lista Modelo de provisionamento de VM, selecione um modelo de provisionamento.
Para criar e iniciar a VM, clique em Criar.

gcloud

Para criar e iniciar uma VM, use o comando gcloud compute instances create com as flags a seguir.

Se a carga de trabalho for tolerante a falhas ou puder ser iniciada a qualquer momento, considere usar um modelo de provisionamento diferente para reduzir os custos. Para mudar o modelo de provisionamento, inclua a flag --provisioning-model=<var>PROVISIONING_MODEL</var> no comando. Para mais informações sobre os modelos disponíveis, consulte Modelos de provisionamento de instâncias do Compute Engine.

gcloud compute instances create VM_NAME \
    --machine-type MACHINE_TYPE \
    --zone ZONE \
    --boot-disk-size DISK_SIZE \
    --accelerator type=ACCELERATOR_TYPE,count=ACCELERATOR_COUNT \
    [--image IMAGE | --image-family IMAGE_FAMILY] \
    --image-project IMAGE_PROJECT \
    --maintenance-policy TERMINATE \
    [--provisioning-model=PROVISIONING_MODEL]

Substitua:

VM_NAME: o nome da nova VM.
MACHINE_TYPE: o tipo de máquina selecionado para a VM.
ZONE: a zona da VM. Essa zona precisa ser compatível com o tipo de GPU.
DISK_SIZE: o tamanho do disco de inicialização em GB. Especifique um tamanho do disco de inicialização de pelo menos 40 GB.
IMAGE ou IMAGE_FAMILY compatível com GPUs. Especifique uma destas opções:
- IMAGE: especifique a versão exigida de uma imagem pública. Por exemplo, --image debian-10-buster-v20200309.
- IMAGE_FAMILY: uma família de imagens. Isso cria a VM a partir da imagem do SO mais recente e não obsoleta. Por exemplo, se você especificar --image-family debian-10, o Compute Engine criará uma VM a partir da versão mais recente da imagem do SO na família de imagens Debian 10.
Também é possível especificar uma imagem personalizada ou Deep Learning VM Images.
IMAGE_PROJECT: o projeto de imagem do Compute Engine a que a família de imagens pertence. Se estiver usando uma imagem personalizada ou Deep Learning VM Images, especifique o projeto a que essas imagens pertencem.
PROVISIONING_MODEL: o modelo de provisionamento da VM. Especifique SPOT ou FLEX_START. Se você não especificar um modelo de provisionamento, o modelo padrão será usado. Essa flag é opcional.
ACCELERATOR_COUNT: o número de GPUs que você quer adicionar à VM. Consulte GPUs no Compute Engine para ver uma lista de limites de GPUs com base no tipo de máquina da VM.
ACCELERATOR_TYPE: o modelo de GPU que você quer usar. Se você planeja executar cargas de trabalho com muitos gráficos nesta VM, use um dos modelos de estação de trabalho virtual.

Escolha um dos seguintes valores:
- GPUs NVIDIA:
  - NVIDIA T4: nvidia-tesla-t4
  - NVIDIA P4: nvidia-tesla-p4
  - NVIDIA P100: nvidia-tesla-p100
  - NVIDIA V100: nvidia-tesla-v100
- NVIDIA RTX Virtual Workstation (vWS) (antiga NVIDIA GRID):
  - NVIDIA T4 Virtual Workstation: nvidia-tesla-t4-vws
  - NVIDIA P4 Virtual Workstation: nvidia-tesla-p4-vws
  - NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws
    
    Para essas estações de trabalho virtuais, uma licença da NVIDIA RTX Virtual Workstation é adicionada automaticamente à instância.

Exemplo

Por exemplo, é possível usar o seguinte comando gcloud para iniciar uma VM do Ubuntu 22.04 com uma GPU NVIDIA T4 e duas vCPUs na zona us-east1-d.

gcloud compute instances create gpu-instance-1 \
    --machine-type n1-standard-2 \
    --zone us-east1-d \
    --boot-disk-size 40GB \
    --accelerator type=nvidia-tesla-t4,count=1 \
    --image-family ubuntu-2204-lts \
    --image-project ubuntu-os-cloud \
    --maintenance-policy TERMINATE

REST

Identifique o tipo de GPU que você quer adicionar à VM. Envie uma solicitação GET para listar os tipos de GPU disponíveis para o projeto em uma zona específica.

Para criar VMs a um preço com desconto, especifique um modelo de provisionamento diferente adicionando o campo "provisioningModel": "PROVISIONING_MODEL" ao objeto scheduling na sua solicitação. Para mais informações sobre os modelos disponíveis, consulte Modelos de provisionamento de instâncias do Compute Engine.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes

Substitua:

PROJECT_ID: o ID do projeto.
ZONE: a zona a partir da qual você quer listar os tipos de GPU disponíveis.

Envie uma solicitação POST ao método instances.insert. Inclua o parâmetro acceleratorType para especificar o tipo de GPU que você quer usar e inclua o parâmetro acceleratorCount para especificar quantas GPUs quer adicionar. Também defina o parâmetro onHostMaintenance como TERMINATE.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "disks":
  [
    {
      "type": "PERSISTENT",
      "initializeParams":
      {
        "diskSizeGb": "DISK_SIZE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "boot": true
    }
  ],
  "name": "VM_NAME",
  "networkInterfaces":
  [
    {
      "network": "projects/PROJECT_ID/global/networks/NETWORK"
    }
  ],
  "guestAccelerators":
  [
    {
      "acceleratorCount": ACCELERATOR_COUNT,
      "acceleratorType": "projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
    }
  ],
  "scheduling":
  {
    ["automaticRestart": true],
    "onHostMaintenance": "TERMINATE",
    "provisioningModel": "PROVISIONING_MODEL"
  },
}

Substitua:

VM_NAME: o nome da VM.
PROJECT_ID: o ID do projeto.
ZONE: a zona da VM. Essa zona precisa ser compatível com o tipo de GPU.
MACHINE_TYPE: o tipo de máquina que você selecionou para a VM. Consulte GPUs no Compute Engine para ver quais tipos de máquinas estão disponíveis com base na quantidade de GPUs que você quer.
IMAGE ou IMAGE_FAMILY: especifique uma das seguintes opções:
- IMAGE: especifique a versão exigida de uma imagem pública. Por exemplo, "sourceImage": "projects/debian-cloud/global/images/debian-10-buster-v20200309".
- IMAGE_FAMILY: uma família de imagens. Isso cria a VM a partir da imagem do SO mais recente e não obsoleta. Por exemplo, se você especificar "sourceImage": "projects/debian-cloud/global/images/family/debian-10", o Compute Engine criará uma VM a partir da versão mais recente da imagem do SO na família de imagens Debian 10.
Também é possível especificar uma imagem personalizada ou Deep Learning VM Images.
IMAGE_PROJECT: o projeto de imagem do Compute Engine a que a família de imagens pertence. Se estiver usando uma imagem personalizada ou Deep Learning VM Images, especifique o projeto a que essas imagens pertencem.
DISK_SIZE: o tamanho do disco de inicialização em GB. Especifique um tamanho do disco de inicialização de pelo menos 40 GB.
NETWORK: a rede VPC que você quer usar para a VM. Você pode especificar default para usar sua rede padrão.
ACCELERATOR_COUNT: o número de GPUs que você quer adicionar à VM. Consulte GPUs no Compute Engine para ver uma lista de limites de GPUs com base no tipo de máquina da VM.
ACCELERATOR_TYPE: o modelo de GPU que você quer usar. Se você planeja executar cargas de trabalho com muitos gráficos nesta VM, use um dos modelos de estação de trabalho virtual.

Escolha um dos seguintes valores:
- GPUs NVIDIA:
  - NVIDIA T4: nvidia-tesla-t4
  - NVIDIA P4: nvidia-tesla-p4
  - NVIDIA P100: nvidia-tesla-p100
  - NVIDIA V100: nvidia-tesla-v100
- NVIDIA RTX Virtual Workstation (vWS) (antiga NVIDIA GRID):
  - NVIDIA T4 Virtual Workstation: nvidia-tesla-t4-vws
  - NVIDIA P4 Virtual Workstation: nvidia-tesla-p4-vws
  - NVIDIA P100 Virtual Workstation: nvidia-tesla-p100-vws
    
    Para essas estações de trabalho virtuais, uma licença da NVIDIA RTX Virtual Workstation é adicionada automaticamente à instância.
PROVISIONING_MODEL: o modelo de provisionamento da VM. Especifique SPOT ou FLEX_START. Se você não especificar um modelo de provisionamento, o modelo padrão será usado. Esta propriedade é opcional. Para mais informações sobre modelos de provisionamento, consulte Modelos de provisionamento de instâncias do Compute Engine.

Instalar drivers

Para instalar os drivers, escolha uma das seguintes opções:

Se você planeja executar cargas de trabalho com muitos gráficos, como as de jogos e visualização, instale drivers para da NVIDIA RTX Virtual Workstation.
Para a maioria das cargas de trabalho, instale os drivers da GPU.

A seguir

Saiba mais sobre as plataformas de GPU.
Adicione SSDs locais a instâncias. Dispositivos SSD locais funcionam bem com GPUs quando os aplicativos exigem armazenamento de alto desempenho.
Instale os drivers da GPU. Se você ativou a NVIDIA RTX Virtual Workstation, instale um driver para a estação de trabalho virtual.
Para lidar com a manutenção do host da GPU, consulte Como manipular eventos de manutenção do host da GPU.

Criar uma VM N1 com GPUs anexadas Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Antes de começar

Console

gcloud

REST

Papéis necessários

Permissões necessárias

Visão geral

Criar uma VM com GPUs anexadas

Console

gcloud

REST

Instalar drivers

A seguir

Criar uma VM N1 com GPUs anexadas