Criar uma instância otimizada para IA com A3 High ou A3 Mega

Neste documento, descrevemos as etapas para criar instâncias de máquina virtual (VM) autônomas que usam tipos de máquinas otimizadas para aceleradores A3 High ou A3 Mega. Para saber mais sobre os tipos de máquinas, consulte A3 High e A3 Mega na documentação do Compute Engine.

Para saber mais sobre outras maneiras de criar VMs ou clusters, consulte a página Visão geral.

Antes de começar

Antes de criar VMs, siga estas etapas, caso ainda não tenha feito isso:

  1. Escolha uma opção de consumo: a opção escolhida determina como você recebe e usa os recursos de GPU.

    Para saber mais, consulte Escolher uma opção de consumo.

  2. Obter capacidade: o processo para obter capacidade varia de acordo com cada opção de consumo.

    Para saber mais sobre o processo de obtenção de capacidade para a opção de consumo escolhida, consulte Visão geral da capacidade.

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

In the Google Cloud console, activate Cloud Shell.

Activate Cloud Shell

At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

REST

Para usar as amostras da API REST desta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para gcloud CLI.

    Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:

    gcloud init

    Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.

Saiba mais em Autenticar para usar REST na documentação de autenticação do Google Cloud .

Funções exigidas

Para receber as permissões necessárias para criar VMs, peça ao administrador para conceder a você o papel do IAM de Administrador da instância do Compute (v1) (roles/compute.instanceAdmin.v1) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esse papel predefinido contém as permissões necessárias para criar VMs. Para acessar as permissões exatas necessárias, abra a seção Permissões necessárias:

Permissões necessárias

As permissões a seguir são necessárias para criar VMs:

  • compute.instances.create no projeto
  • Usar uma imagem personalizada para criar a VM: compute.images.useReadOnly na imagem
  • Usar um snapshot para criar a VM: compute.snapshots.useReadOnly no snapshot
  • Usar um modelo de instância para criar a VM: compute.instanceTemplates.useReadOnly no modelo de instância
  • Especificar uma sub-rede para a VM: compute.subnetworks.use no projeto ou na sub-rede escolhida
  • Especificar um endereço IP estático para a VM: compute.addresses.use no projeto
  • Atribuir um endereço IP externo à VM ao usar uma rede VPC: compute.subnetworks.useExternalIp no projeto ou na sub-rede escolhida
  • Atribuir uma rede legada à VM: compute.networks.use no projeto
  • Atribuir um endereço IP externo à VM usando uma rede legada: compute.networks.useExternalIp no projeto
  • Definir os metadados da instância de VM para a VM: compute.instances.setMetadata no projeto
  • Definir tags para a VM: compute.instances.setTags na VM
  • Definir rótulos para a VM: compute.instances.setLabels na VM
  • Definir uma conta de serviço a ser usada pela VM: compute.instances.setServiceAccount na VM
  • Criar um disco para a VM: compute.disks.create no projeto
  • Anexar um disco atual no modo somente leitura ou de leitura e gravação: compute.disks.use no disco
  • Anexar um disco atual no modo somente leitura: compute.disks.useReadOnly no disco

Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.

Visão geral

A criação de uma instância com o tipo de máquina a3h-or-a3m inclui as seguintes etapas:

  1. Criar redes VPC
  2. Opcional: criar uma política de posicionamento compacto
  3. Criar uma instância

Criar redes VPC

Para ativar a comunicação eficiente das suas VMs de GPU, crie uma rede de gerenciamento e uma ou mais redes de dados. A rede de gerenciamento é usada para acesso externo, por exemplo, SSH, e para a maioria das comunicações de rede gerais. As redes de dados são usadas para comunicação de alta performance entre as GPUs em diferentes VMs, por exemplo, para tráfego de acesso direto à memória remota (RDMA).

Para essas redes VPC, recomendamos definir a unidade máxima de transmissão (MTU) para um valor maior. Valores de MTU mais altos aumentam o tamanho do pacote e reduzem a sobrecarga do cabeçalho do pacote, o que aumenta a capacidade de dados do payload. Para mais informações sobre como criar redes VPC, consulte Criar e verificar uma rede MTU de frame jumbo.

Criar rede de gerenciamento, sub-rede e regra de firewall

Siga estas etapas para configurar a rede de gerenciamento:

  1. Crie a rede de gerenciamento usando o comando networks create:

    gcloud compute networks create NETWORK_NAME_PREFIX-mgmt-net \
        --project=PROJECT_ID \
        --subnet-mode=custom \
        --mtu=8244
    
  2. Crie a sub-rede de gerenciamento usando o comando networks subnets create:

    gcloud compute networks subnets create NETWORK_NAME_PREFIX-mgmt-sub \
        --project=PROJECT_ID \
        --network=NETWORK_NAME_PREFIX-mgmt-net \
        --region=REGION \
        --range=192.168.0.0/24
    
  3. Crie regras de firewall usando o comando firewall-rules create.

    1. Crie uma regra de firewall para a rede de gerenciamento.

      gcloud compute firewall-rules create NETWORK_NAME_PREFIX-mgmt-internal \
          --project=PROJECT_ID \
          --network=NETWORK_NAME_PREFIX-mgmt-net \
          --action=ALLOW \
          --rules=tcp:0-65535,udp:0-65535,icmp \
          --source-ranges=192.168.0.0/16
      
    2. Crie a regra de firewall tcp:22 para limitar quais endereços IP de origem podem se conectar à sua VM usando SSH.

      gcloud compute firewall-rules create NETWORK_NAME_PREFIX-mgmt-external-ssh \
          --project=PROJECT_ID \
          --network=NETWORK_NAME_PREFIX-mgmt-net \
          --action=ALLOW \
          --rules=tcp:22 \
          --source-ranges=SSH_SOURCE_IP_RANGE
      
    3. Crie a regra de firewall icmp que pode ser usada para verificar se há problemas de transmissão de dados na rede.

      gcloud compute firewall-rules create NETWORK_NAME_PREFIX-mgmt-external-ping \
          --project=PROJECT_ID \
          --network=NETWORK_NAME_PREFIX-mgmt-net \
          --action=ALLOW \
          --rules=icmp \
          --source-ranges=0.0.0.0/0
      

Substitua:

  • NETWORK_NAME_PREFIX: o prefixo de nome a ser usado para as redes e sub-redes VPC.
  • PROJECT_ID: o ID do projeto.
  • REGION: a região em que você quer criar as redes.
  • SSH_SOURCE_IP_RANGE: intervalo de IP no formato CIDR. Isso especifica quais endereços IP de origem podem se conectar à VM usando SSH.

Criar redes de dados, sub-redes e regra de firewall

O número de redes de dados varia de acordo com o tipo de máquina de GPU que você está criando.

A3 Mega

O A3 Mega exige oito redes de dados. Para criar oito redes de dados, cada uma com sub-redes e regras de firewall, use o comando a seguir.

for N in $(seq 1 8); do
gcloud compute networks create NETWORK_NAME_PREFIX-data-net-$N \
    --project=PROJECT_ID \
    --subnet-mode=custom \
    --mtu=8244

gcloud compute networks subnets create NETWORK_NAME_PREFIX-data-sub-$N \
    --project=PROJECT_ID \
    --network=NETWORK_NAME_PREFIX-data-net-$N \
    --region=REGION \
    --range=192.168.$N.0/24

gcloud compute firewall-rules create NETWORK_NAME_PREFIX-data-internal-$N \
    --project=PROJECT_ID \
    --network=NETWORK_NAME_PREFIX-data-net-$N \
    --action=ALLOW \
    --rules=tcp:0-65535,udp:0-65535,icmp \
    --source-ranges=192.168.0.0/16
done

A3 High

O A3 High exige quatro redes de dados. Use o comando a seguir para criar quatro redes de dados, cada uma com sub-redes e regras de firewall.

for N in $(seq 1 4); do
gcloud compute networks create NETWORK_NAME_PREFIX-data-net-$N \
    --project=PROJECT_ID \
    --subnet-mode=custom \
    --mtu=8244

gcloud compute networks subnets create NETWORK_NAME_PREFIX-data-sub-$N \
    --project=PROJECT_ID \
    --network=NETWORK_NAME_PREFIX-data-net-$N \
    --region=REGION \
    --range=192.168.$N.0/24

gcloud compute firewall-rules create NETWORK_NAME_PREFIX-data-internal-$N \
    --project=PROJECT_ID \
    --network=NETWORK_NAME_PREFIX-data-net-$N \
    --action=ALLOW \
    --rules=tcp:0-65535,udp:0-65535,icmp \
    --source-ranges=192.168.0.0/16
done

Opcional: criar uma política de posicionamento compacto

É possível especificar o posicionamento de VMs criando uma política de posicionamento compacto. Quando você aplica uma política de posicionamento compacto às VMs, o Compute Engine faz o possível para criar VMs que estejam o mais próximas possível umas das outras. Se o aplicativo for sensível à latência e você quiser que as VMs fiquem mais próximas (compactação máxima), especifique o campo maxDistance (prévia) ao criar uma política de posicionamento compacto. Um valor de maxDistance menor garante um posicionamento mais próximo da VM, mas também aumenta a chance de algumas VMs não serem criadas.

Para criar uma política de posicionamento compacto, selecione uma das seguintes opções:

gcloud

Para criar uma política de posicionamento compacto, use o comando gcloud beta compute resource-policies create group-placement:

gcloud beta compute resource-policies create group-placement POLICY_NAME \
    --collocation=collocated \
    --max-distance=MAX_DISTANCE \
    --region=REGION

Substitua:

  • POLICY_NAME: o nome da política de posicionamento compacto.
  • MAX_DISTANCE: a configuração da distância máxima para suas VMs. O valor precisa ser 3 para colocar VMs em blocos adjacentes ou 2 para colocar VMs no mesmo bloco. Para informações sobre o número máximo de VMs compatíveis com cada maxDistance por série de máquinas, consulte Sobre as políticas de posicionamento compactas na documentação do Compute Engine.
  • REGION: a região em que você quer criar a política de posicionamento compacto. Especifique uma região em que o tipo de máquina que você quer usar esteja disponível. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.

REST

Para criar uma política de posicionamento compacto, faça uma solicitação POST para o método resourcePolicies.insert beta. No corpo da solicitação, inclua o campo collocation definido como COLLOCATED e o campo maxDistance.

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/resourcePolicies
  {
    "name": "POLICY_NAME",
    "groupPlacementPolicy": {
      "collocation": "COLLOCATED",
      "maxDistance": MAX_DISTANCE
    }
  }

Substitua:

  • PROJECT_ID: ID do projeto;
  • POLICY_NAME: o nome da política de posicionamento compacto.
  • MAX_DISTANCE: a configuração da distância máxima para suas VMs. O valor precisa ser 3 para colocar VMs em blocos adjacentes ou 2 para colocar VMs no mesmo bloco. Para informações sobre o número máximo de VMs compatíveis com cada maxDistance por série de máquinas, consulte Sobre as políticas de posicionamento compactas na documentação do Compute Engine.
  • REGION: a região em que você quer criar a política de posicionamento compacto. Especifique uma região em que o tipo de máquina que você quer usar esteja disponível. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.

Criar um A3 High ou A3 Mega

Para criar uma VM A3 High ou A3 Mega, use um dos seguintes métodos. Se você escolher usar uma política de posicionamento compacto, use a Google Cloud CLI ou REST para criar a VM.

Os comandos a seguir também definem o escopo de acesso para suas instâncias. Para simplificar o gerenciamento de permissões, o Google recomenda definir o escopo de acesso de uma instância como cloud-platform e usar papéis do IAM para definir a quais serviços a instância pode acessar. Para mais informações, consulte Práticas recomendadas de escopos.

Console

  1. No console do Google Cloud , acesse a página Criar uma instância.

    Acessar "Criar uma instância"

  2. Especifique um Nome para sua VM. Consulte a Convenção de nomenclatura de recursos.

  3. Selecione a Região e a Zona em que você quer reservar capacidade. Confira a lista de regiões e zonas de GPU disponíveis.

  4. Clique na guia GPUs e siga estas etapas:

    1. Na lista Tipo de GPU, selecione o tipo de GPU.
      • Para VMs A3 High, selecione NVIDIA H100 80GB.
      • Para VMs A3 Mega, selecione NVIDIA H100 MEGA 80GB
    2. Na lista Número de GPUs, selecione 8.
  5. No menu de navegação, clique em SO e armazenamento e siga estas etapas:

    1. Clique em Alterar. O painel Configuração do disco de inicialização é aberto.
    2. Na guia Imagens públicas, selecione uma imagem recomendada. Para uma lista de imagens recomendadas, consulte Sistemas operacionais.
    3. Para confirmar as opções do disco de inicialização, clique em Selecionar.
  6. Configure a conta de serviço e os escopos de acesso da seguinte maneira. As cargas de trabalho em execução na instância usam a conta de serviço anexada para autorizar solicitações a outros serviços do Google Cloud .

    1. No menu de navegação, clique em Segurança.
    2. Na lista Conta de serviço, selecione uma conta para usar.
    3. Em Escopos de acesso, selecione a opção Permitir acesso total a todas as APIs do Cloud. Essa prática recomendada é recomendada porque permite gerenciar o acesso adicionando ou removendo papéis do IAM da conta de serviço. Para mais informações, consulte Anexar uma conta de serviço a uma instância.
  7. Para criar uma VM com várias NICs, siga estas etapas. Caso contrário, para criar uma VM de NIC única, pule estas etapas.

    1. No menu de navegação, clique em Rede.

    2. Na seção Interfaces de rede, siga estas etapas:

      1. Exclua a interface de rede padrão. Para excluir a interface, clique em Excluir.
      2. Clique em Adicionar uma interface de rede. Use essa opção para adicionar interfaces de rede que se conectam às redes VPC criadas na seção anterior. Ao adicionar as interfaces de rede, lembre-se do seguinte:
        • Para uma interface de rede usada na comunicação de host para host, selecione uma rede VPC e uma sub-rede comuns nas listas Rede e Sub-rede e defina a lista Placa de rede como gVNIC.
        • Para uma interface de rede usada na comunicação entre GPUs com GPUDirect-TCPXO (A3 Mega) ou GPUDirect-TCPX (A3 High), selecione as redes e sub-redes VPC especializadas correspondentes para cada interface e defina a lista Placa de rede como gVNIC para essas interfaces de rede também.
  8. No menu de navegação, clique em Avançado. Em seguida, siga estas etapas para o modelo de provisionamento que você quer usar.

    Início flexível

    1. Na seção Modelo de provisionamento, na lista Modelo de provisionamento de VM, selecione Início flexível.
    2. Em Insira o número de horas, digite o período máximo que você quer que a VM seja executada. O valor precisa estar entre 46 segundos (0.01) e sete dias (168 ou 168 horas).

    3. Selecione Definir um tempo de espera para a criação da VM.

      Com base nos requisitos zonais da sua carga de trabalho, especifique uma das seguintes durações para aumentar as chances de sucesso da solicitação de criação de VM:

      • Cargas de trabalho com requisitos zonais estritos: se a carga de trabalho exigir que você crie a VM em uma zona específica, especifique uma duração entre 90 segundos e 2 horas. Quanto maior a duração, maiores as chances de conseguir recursos.
      • Cargas de trabalho sem requisitos zonais estritos: se a VM puder ser executada em qualquer zona da região, especifique uma duração de 0 segundo ou desmarque a caixa de seleção Definir um tempo de espera para a criação da VM. Essa ação específica que o Compute Engine só aloca recursos se eles estiverem imediatamente disponíveis. Se a solicitação de criação da VM falhar porque os recursos não estão disponíveis, tente de novo em outra zona.

    4. No campo No encerramento da VM, selecione se a VM será interrompida ou excluída ao final da duração da execução:

      • Para excluir a VM, selecione Excluir.
      • Para interromper a VM, selecione Parar.

    Vinculada à reserva

    1. Clique em Escolher uma reserva. Essa ação abre um painel com uma lista de reservas disponíveis na zona selecionada. Na lista de reservas, siga estas etapas:

      1. Selecione a reserva que você quer usar para a VM. Também é possível selecionar um bloco específico na reserva.
      2. Clique em Escolher.

    Spot

    1. Na seção Modelo de provisionamento, selecione Spot na lista Modelo de provisionamento de VM.
    2. Opcional: para selecionar a ação de encerramento que acontece quando o Compute Engine encerra a VM:

      1. Abra a seção Configurações avançadas do modelo de provisionamento de VM.
      2. Na lista No encerramento da VM, escolha uma destas opções:
        • Para interromper a VM durante a preempção, escolha Parar (padrão).
        • Para excluir a VM durante a preempção, selecione Excluir.
  9. Para criar e iniciar a VM, clique em Criar.

gcloud

Para criar uma VM A3 High ou A3 Mega, use o comando gcloud compute instances create.

A3 Mega

Para criar a VM, use o comando gcloud compute instances create.

Os parâmetros que você precisa especificar dependem da opção de consumo que está usando para essa implantação. Selecione a guia que corresponde ao modelo de provisionamento da sua opção de consumo.

Início flexível

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=DISK_TYPE \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-5,subnet=GVNIC_NAME_PREFIX-sub-5,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-6,subnet=GVNIC_NAME_PREFIX-sub-6,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-7,subnet=GVNIC_NAME_PREFIX-sub-7,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-8,subnet=GVNIC_NAME_PREFIX-sub-8,no-address \
    --reservation-affinity=none \
    --provisioning-model=FLEX_START \
    --request-valid-for-duration=REQUEST_VALID_FOR_DURATION \
    --max-run-duration=MAX_RUN_DURATION \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE

Substitua:

  • VM_NAME: o nome da VM.
  • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
  • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 Mega, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas ou usar a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
  • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente ou use rocky-linux-accelerator-cloud para a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580.
  • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
  • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
  • DISK_SIZE: o tamanho do disco de inicialização em GB.
  • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
  • REQUEST_VALID_FOR_DURATION: o tempo de validade da solicitação para criar a VM. Formate o valor como o número de dias, horas, minutos ou segundos seguidos por d, h, m e s, respectivamente. Por exemplo, especifique 30m para 30 minutos ou 1h2m3s para uma hora, dois minutos e três segundos.

    Com base nos requisitos zonais da sua carga de trabalho, especifique uma das seguintes durações para aumentar as chances de sucesso da solicitação de criação de VM:

    • Cargas de trabalho com requisitos zonais estritos: se a carga de trabalho exigir que você crie a VM em uma zona específica, especifique uma duração entre 90 segundos (90s) e duas horas (2h). Quanto maior a duração, maiores as chances de conseguir recursos.
    • Cargas de trabalho sem requisitos zonais estritos: se a VM puder ser executada em qualquer zona da região, especifique uma duração de zero segundos (0s). Essa ação especifica que o Compute Engine só aloca recursos se eles estiverem disponíveis imediatamente. Se a solicitação de criação da VM falhar porque os recursos não estão disponíveis, tente de novo em uma zona diferente.
  • MAX_RUN_DURATION: por quanto tempo você quer que as VMs solicitadas sejam executadas. Formate o valor como o número de dias, horas, minutos ou segundos, seguido por d, h, m e s, respectivamente. O valor precisa estar entre 10 minutos e sete dias.

  • TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a VM ao final da duração da execução.

Vinculada à reserva

Antes de executar o comando, adicione a flag para uma política de posicionamento compacta.

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=DISK_TYPE \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-5,subnet=GVNIC_NAME_PREFIX-sub-5,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-6,subnet=GVNIC_NAME_PREFIX-sub-6,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-7,subnet=GVNIC_NAME_PREFIX-sub-7,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-8,subnet=GVNIC_NAME_PREFIX-sub-8,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE \
    --restart-on-failure

Siga estas etapas:

  1. Substitua:

    • VM_NAME: o nome da VM.
    • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
    • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 Mega, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas ou usar a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
    • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente ou use rocky-linux-accelerator-cloud para a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580.
    • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
    • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
    • DISK_SIZE: o tamanho do disco de inicialização em GB.
    • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
    • RESERVATION: o nome da reserva ou um bloco específico dentro de uma reserva. Para conferir o nome da reserva ou os blocos disponíveis, consulte Visualizar a capacidade reservada. Com base na sua exigência de posicionamento de instâncias, escolha uma das seguintes opções:
      • Para criar a instância em qualquer bloco:

        projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME

        Além disso, para criar várias instâncias no mesmo bloco, aplique a mesma política de posicionamento compacto que especifica uma colocação de bloco (maxDistance=2) ao criar cada instância. Em seguida, o Compute Engine aplica a política à reserva e cria instâncias no mesmo bloco.

      • Para criar a instância em um bloco específico:

        projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    • TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a VM ao final do período de reserva.

  2. Opcional: se você escolheu usar uma política de posicionamento compacto, adicione a seguinte flag ao comando:

      --resource-policies=POLICY_NAME
    

    Substitua:

    • POLICY_NAME: o nome da política de posicionamento compacto.
  3. Execute o comando.

Spot

Antes de executar o comando, adicione a flag para uma política de posicionamento compacta.

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=DISK_TYPE \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-5,subnet=GVNIC_NAME_PREFIX-sub-5,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-6,subnet=GVNIC_NAME_PREFIX-sub-6,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-7,subnet=GVNIC_NAME_PREFIX-sub-7,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-8,subnet=GVNIC_NAME_PREFIX-sub-8,no-address \
    --provisioning-model=SPOT \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE \
    --no-restart-on-failure

Siga estas etapas:

  1. Substitua:

    • VM_NAME: o nome da VM.
    • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
    • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 Mega, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas ou usar a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
    • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente ou use rocky-linux-accelerator-cloud para a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580.
    • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
    • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
    • DISK_SIZE: o tamanho do disco de inicialização em GB.
    • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
    • TERMINATION_ACTION: a ação a ser realizada quando o Compute Engine forçar a interrupção da instância, STOP (padrão) ou DELETE.

  2. Opcional: se você escolheu usar uma política de posicionamento compacto, adicione a seguinte flag ao comando:

      --resource-policies=POLICY_NAME
    

    Substitua:

    • POLICY_NAME: o nome da política de posicionamento compacto.
  3. Execute o comando.

A3 High

Para criar a VM, use o comando gcloud compute instances create.

Os parâmetros que você precisa especificar dependem da opção de consumo que está usando para essa implantação. Selecione a guia que corresponde ao modelo de provisionamento da sua opção de consumo.

Início flexível

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=DISK_TYPE \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
    --reservation-affinity=none \
    --provisioning-model=FLEX_START \
    --request-valid-for-duration=REQUEST_VALID_FOR_DURATION \
    --max-run-duration=MAX_RUN_DURATION \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE

Substitua:

  • VM_NAME: o nome da VM.
  • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
  • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 High, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
  • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente.
  • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
  • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
  • DISK_SIZE: o tamanho do disco de inicialização em GB.
  • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
  • REQUEST_VALID_FOR_DURATION: o tempo de validade da solicitação para criar a VM. Formate o valor como o número de dias, horas, minutos ou segundos seguidos por d, h, m e s, respectivamente. Por exemplo, especifique 30m para 30 minutos ou 1h2m3s para uma hora, dois minutos e três segundos.

    Com base nos requisitos zonais da sua carga de trabalho, especifique uma das seguintes durações para aumentar as chances de sucesso da solicitação de criação de VM:

    • Cargas de trabalho com requisitos zonais estritos: se a carga de trabalho exigir que você crie a VM em uma zona específica, especifique uma duração entre 90 segundos (90s) e duas horas (2h). Quanto maior a duração, maiores as chances de conseguir recursos.
    • Cargas de trabalho sem requisitos zonais estritos: se a VM puder ser executada em qualquer zona da região, especifique uma duração de zero segundos (0s). Essa ação especifica que o Compute Engine só aloca recursos se eles estiverem disponíveis imediatamente. Se a solicitação de criação da VM falhar porque os recursos não estão disponíveis, tente de novo em uma zona diferente.
  • MAX_RUN_DURATION: por quanto tempo você quer que as VMs solicitadas sejam executadas. Formate o valor como o número de dias, horas, minutos ou segundos, seguido por d, h, m e s, respectivamente. O valor precisa estar entre 10 minutos e sete dias.

  • TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a VM ao final da duração da execução.

Vinculada à reserva

Antes de executar o comando, adicione a flag para uma política de posicionamento compacta.

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=DISK_TYPE \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE \
    --restart-on-failure

Siga estas etapas:

  1. Substitua:

    • VM_NAME: o nome da VM.
    • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
    • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 High, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
    • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente.
    • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
    • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
    • DISK_SIZE: o tamanho do disco de inicialização em GB.
    • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
    • RESERVATION: o nome da reserva ou um bloco específico dentro de uma reserva. Para conferir o nome da reserva ou os blocos disponíveis, consulte Visualizar a capacidade reservada. Com base na sua exigência de posicionamento de instâncias, escolha uma das seguintes opções:
      • Para criar a instância em qualquer bloco:

        projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME

        Além disso, para criar várias instâncias no mesmo bloco, aplique a mesma política de posicionamento compacto que especifica uma colocação de bloco (maxDistance=2) ao criar cada instância. Em seguida, o Compute Engine aplica a política à reserva e cria instâncias no mesmo bloco.

      • Para criar a instância em um bloco específico:

        projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    • TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a VM ao final do período de reserva.

  2. Opcional: se você escolheu usar uma política de posicionamento compacto, adicione a seguinte flag ao comando:

      --resource-policies=POLICY_NAME
    

    Substitua:

    • POLICY_NAME: o nome da política de posicionamento compacto.
  3. Execute o comando.

Spot

Antes de executar o comando, adicione a flag para uma política de posicionamento compacta.

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=DISK_TYPE \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
    --provisioning-model=SPOT \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE \
    --no-restart-on-failure

Siga estas etapas:

  1. Substitua:

    • VM_NAME: o nome da VM.
    • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
    • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 High, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
    • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente.
    • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
    • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
    • DISK_SIZE: o tamanho do disco de inicialização em GB.
    • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
    • TERMINATION_ACTION: a ação a ser realizada quando o Compute Engine forçar a interrupção da instância, STOP (padrão) ou DELETE.

  2. Opcional: se você escolheu usar uma política de posicionamento compacto, adicione a seguinte flag ao comando:

      --resource-policies=POLICY_NAME
    

    Substitua:

    • POLICY_NAME: o nome da política de posicionamento compacto.
  3. Execute o comando.

REST

Para criar uma VM A3 High ou A3 Mega, envie uma solicitação POST para o método instances.insert.

A3 Mega

Para criar a VM, faça uma solicitação POST para o método instances.insert.

Os parâmetros que você precisa especificar dependem da opção de consumo que está usando para essa implantação. Selecione a guia que corresponde ao modelo de provisionamento da sua opção de consumo.

Início flexível

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "DISK_TYPE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-5",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-5"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-6",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-6"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-7",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-7"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-8",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-8"
    }
  ],
  "reservationAffinity":{
    "consumeReservationType": "NO_RESERVATION",
  },
  "scheduling":{
    "provisioningModel": "FLEX_START",
    "requestValidForDuration": {
      "seconds": REQUEST_VALID_FOR_DURATION
    },
    "maxRunDuration": {
      "seconds": MAX_RUN_DURATION
    },
    "instanceTerminationAction": "TERMINATION_ACTION",
    "onHostMaintenance": "TERMINATE",
  }
}

Substitua:

  • PROJECT_ID: o ID do projeto em que você quer criar a VM.
  • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
  • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
  • VM_NAME: o nome da VM.
  • DISK_SIZE: o tamanho do disco de inicialização em GB.
  • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
  • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente ou use rocky-linux-accelerator-cloud para a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580.
  • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 Mega, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas ou usar a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
  • NETWORK_PROJECT_ID: o ID do projeto da rede.
  • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
  • REGION: a região da sub-rede.
  • REQUEST_VALID_FOR_DURATION: a duração, em segundos, da validade da solicitação para criar a VM.

    Com base nos requisitos zonais da sua carga de trabalho, especifique uma das seguintes durações para aumentar as chances de sucesso da solicitação de criação de VM:

    • Cargas de trabalho com requisitos zonais estritos: se a carga de trabalho exigir que você crie a VM em uma zona específica, especifique uma duração entre 90 segundos (90) e duas horas (7200). Quanto maior a duração, maiores as chances de conseguir recursos.
    • Cargas de trabalho sem requisitos zonais estritos: se a VM puder ser executada em qualquer zona da região, especifique uma duração de zero segundos (0). Essa ação especifica que o Compute Engine só aloca recursos se eles estiverem disponíveis imediatamente. Se a solicitação de criação da VM falhar porque os recursos não estão disponíveis, tente de novo em uma zona diferente.
  • MAX_RUN_DURATION: a duração da execução das VMs solicitadas. Você precisa formatar o valor como o número de segundos. Por exemplo, especifique 86400 para 86.400 segundos (24 horas). O valor precisa estar entre 10 minutos e sete dias.

  • TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a VM ao final da duração da execução.

Vinculada à reserva

Antes de enviar a solicitação, adicione opcionalmente o campo para uma política de posicionamento compacta ao corpo da solicitação.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "DISK_TYPE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-5",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-5"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-6",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-6"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-7",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-7"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-8",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-8"
    }
  ],
  "reservationAffinity":{
    "consumeReservationType": "SPECIFIC_RESERVATION",
    "key": "compute.googleapis.com/reservation-name",
    "values":[
      "RESERVATION"
    ]
  },
  "scheduling":{
    "provisioningModel": "RESERVATION_BOUND",
    "instanceTerminationAction": "TERMINATION_ACTION",
    "onHostMaintenance": "TERMINATE",
    "automaticRestart": true
  }
}

Siga estas etapas:

  1. Substitua:

    • PROJECT_ID: o ID do projeto em que você quer criar a VM.
    • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
    • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
    • VM_NAME: o nome da VM.
    • DISK_SIZE: o tamanho do disco de inicialização em GB.
    • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
    • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente ou use rocky-linux-accelerator-cloud para a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580.
    • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 Mega, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas ou usar a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
    • NETWORK_PROJECT_ID: o ID do projeto da rede.
    • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
    • REGION: a região da sub-rede.
    • RESERVATION: o nome da reserva ou um bloco específico dentro de uma reserva. Para conferir o nome da reserva ou os blocos disponíveis, consulte Visualizar a capacidade reservada. Com base na sua exigência de posicionamento de instâncias, escolha uma das seguintes opções:
      • Para criar a instância em qualquer bloco:

        projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME

        Além disso, para criar várias instâncias no mesmo bloco, aplique a mesma política de posicionamento compacto que especifica uma colocação de bloco (maxDistance=2) ao criar cada instância. Em seguida, o Compute Engine aplica a política à reserva e cria instâncias no mesmo bloco.

      • Para criar a instância em um bloco específico:

        projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    • TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a VM ao final do período de reserva.

  2. Opcional: se você escolheu usar uma política de posicionamento compacto, adicione o seguinte campo ao corpo da solicitação:

      "resourcePolicies": [
        "projects/PROJECT_ID/regions/REGION/resourcePolicies/POLICY_NAME"
      ]
    

    Substitua:

    • PROJECT_ID: o ID do projeto da política de posicionamento compacto.
    • REGION: a região da política de posicionamento compacto.
    • POLICY_NAME: o nome da política de posicionamento compacto.
  3. Envie a solicitação.

Spot

Antes de enviar a solicitação, adicione opcionalmente o campo para uma política de posicionamento compacta ao corpo da solicitação.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "DISK_TYPE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-5",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-5"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-6",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-6"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-7",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-7"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-8",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-8"
    }
  ],
  "scheduling":
  {
    "provisioningModel": "SPOT",
    "instanceTerminationAction": "TERMINATION_ACTION",
    "onHostMaintenance": "TERMINATE",
    "automaticRestart": false
  }
}

Siga estas etapas:

  1. Substitua:

    • PROJECT_ID: o ID do projeto em que você quer criar a VM.
    • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
    • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
    • VM_NAME: o nome da VM.
    • DISK_SIZE: o tamanho do disco de inicialização em GB.
    • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
    • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente ou use rocky-linux-accelerator-cloud para a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580.
    • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 Mega, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas ou usar a imagem do Rocky Linux rocky-linux-8-optimized-gcp-nvidia-580. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
    • NETWORK_PROJECT_ID: o ID do projeto da rede.
    • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
    • REGION: a região da sub-rede.
    • TERMINATION_ACTION: a ação a ser realizada quando o Compute Engine forçar a interrupção da instância, STOP (padrão) ou DELETE.

  2. Opcional: se você escolheu usar uma política de posicionamento compacto, adicione o seguinte campo ao corpo da solicitação:

      "resourcePolicies": [
        "projects/PROJECT_ID/regions/REGION/resourcePolicies/POLICY_NAME"
      ]
    

    Substitua:

    • PROJECT_ID: o ID do projeto da política de posicionamento compacto.
    • REGION: a região da política de posicionamento compacto.
    • POLICY_NAME: o nome da política de posicionamento compacto.
  3. Envie a solicitação.

A3 High

Para criar a VM, faça uma solicitação POST para o método instances.insert.

Os parâmetros que você precisa especificar dependem da opção de consumo que está usando para essa implantação. Selecione a guia que corresponde ao modelo de provisionamento da sua opção de consumo.

Início flexível

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "DISK_TYPE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
    }
  ],
  "reservationAffinity":{
    "consumeReservationType": "NO_RESERVATION",
  },
  "scheduling":{
    "provisioningModel": "FLEX_START",
    "requestValidForDuration": {
      "seconds": REQUEST_VALID_FOR_DURATION
    },
    "maxRunDuration": {
      "seconds": MAX_RUN_DURATION
    },
    "instanceTerminationAction": "TERMINATION_ACTION",
    "onHostMaintenance": "TERMINATE",
  }
}

Substitua:

  • PROJECT_ID: o ID do projeto em que você quer criar a VM.
  • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
  • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
  • VM_NAME: o nome da VM.
  • DISK_SIZE: o tamanho do disco de inicialização em GB.
  • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
  • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente.
  • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 High, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
  • NETWORK_PROJECT_ID: o ID do projeto da rede.
  • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
  • REGION: a região da sub-rede.
  • REQUEST_VALID_FOR_DURATION: a duração, em segundos, da validade da solicitação para criar a VM.

    Com base nos requisitos zonais da sua carga de trabalho, especifique uma das seguintes durações para aumentar as chances de sucesso da solicitação de criação de VM:

    • Cargas de trabalho com requisitos zonais estritos: se a carga de trabalho exigir que você crie a VM em uma zona específica, especifique uma duração entre 90 segundos (90) e duas horas (7200). Quanto maior a duração, maiores as chances de conseguir recursos.
    • Cargas de trabalho sem requisitos zonais estritos: se a VM puder ser executada em qualquer zona da região, especifique uma duração de zero segundos (0). Essa ação especifica que o Compute Engine só aloca recursos se eles estiverem disponíveis imediatamente. Se a solicitação de criação da VM falhar porque os recursos não estão disponíveis, tente de novo em uma zona diferente.
  • MAX_RUN_DURATION: a duração da execução das VMs solicitadas. Você precisa formatar o valor como o número de segundos. Por exemplo, especifique 86400 para 86.400 segundos (24 horas). O valor precisa estar entre 10 minutos e sete dias.

  • TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a VM ao final da duração da execução.

Vinculada à reserva

Antes de enviar a solicitação, adicione opcionalmente o campo para uma política de posicionamento compacta ao corpo da solicitação.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "DISK_TYPE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
    }
  ],
  "reservationAffinity":{
    "consumeReservationType": "SPECIFIC_RESERVATION",
    "key": "compute.googleapis.com/reservation-name",
    "values":[
      "RESERVATION"
    ]
  },
  "scheduling":{
    "provisioningModel": "RESERVATION_BOUND",
    "instanceTerminationAction": "TERMINATION_ACTION",
    "onHostMaintenance": "TERMINATE",
    "automaticRestart": true
  }
}

Siga estas etapas:

  1. Substitua:

    • PROJECT_ID: o ID do projeto em que você quer criar a VM.
    • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
    • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
    • VM_NAME: o nome da VM.
    • DISK_SIZE: o tamanho do disco de inicialização em GB.
    • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
    • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente.
    • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 High, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
    • NETWORK_PROJECT_ID: o ID do projeto da rede.
    • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
    • REGION: a região da sub-rede.
    • RESERVATION: o nome da reserva ou um bloco específico dentro de uma reserva. Para conferir o nome da reserva ou os blocos disponíveis, consulte Visualizar a capacidade reservada. Com base na sua exigência de posicionamento de instâncias, escolha uma das seguintes opções:
      • Para criar a instância em qualquer bloco:

        projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME

        Além disso, para criar várias instâncias no mesmo bloco, aplique a mesma política de posicionamento compacto que especifica uma colocação de bloco (maxDistance=2) ao criar cada instância. Em seguida, o Compute Engine aplica a política à reserva e cria instâncias no mesmo bloco.

      • Para criar a instância em um bloco específico:

        projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    • TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a VM ao final do período de reserva.

  2. Opcional: se você escolheu usar uma política de posicionamento compacto, adicione o seguinte campo ao corpo da solicitação:

      "resourcePolicies": [
        "projects/PROJECT_ID/regions/REGION/resourcePolicies/POLICY_NAME"
      ]
    

    Substitua:

    • PROJECT_ID: o ID do projeto da política de posicionamento compacto.
    • REGION: a região da política de posicionamento compacto.
    • POLICY_NAME: o nome da política de posicionamento compacto.
  3. Envie a solicitação.

Spot

Antes de enviar a solicitação, adicione opcionalmente o campo para uma política de posicionamento compacta ao corpo da solicitação.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "DISK_TYPE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
    }
  ],
  "scheduling":
  {
    "provisioningModel": "SPOT",
    "instanceTerminationAction": "TERMINATION_ACTION",
    "onHostMaintenance": "TERMINATE",
    "automaticRestart": false
  }
}

Siga estas etapas:

  1. Substitua:

    • PROJECT_ID: o ID do projeto em que você quer criar a VM.
    • ZONE: a zona em que o tipo de máquina que você quer usar está disponível. Se você quiser especificar uma política de posicionamento compacto, use uma zona na mesma região da política. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.
    • MACHINE_TYPE: o tipo de máquina a ser usado para a VM. Para mais informações, consulte Tipos de máquinas com GPU.
    • VM_NAME: o nome da VM.
    • DISK_SIZE: o tamanho do disco de inicialização em GB.
    • DISK_TYPE: o tipo do disco de inicialização. Recomendamos usar hyperdisk-balanced.
    • IMAGE_PROJECT: o ID do projeto da imagem do SO. Por exemplo, use cos-cloud para a imagem do Container-Optimized OS cos-121-lts ou mais recente.
    • IMAGE_FAMILY: a família de imagens da imagem do SO que você quer usar. Para a série de máquinas A3 High, recomendamos usar a imagem do Container-Optimized OS cos-121-lts ou mais recente e desativar as atualizações automáticas. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.
    • NETWORK_PROJECT_ID: o ID do projeto da rede.
    • GVNIC_NAME_PREFIX: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.
    • REGION: a região da sub-rede.
    • TERMINATION_ACTION: a ação a ser realizada quando o Compute Engine forçar a interrupção da instância, STOP (padrão) ou DELETE.

  2. Opcional: se você escolheu usar uma política de posicionamento compacto, adicione o seguinte campo ao corpo da solicitação:

      "resourcePolicies": [
        "projects/PROJECT_ID/regions/REGION/resourcePolicies/POLICY_NAME"
      ]
    

    Substitua:

    • PROJECT_ID: o ID do projeto da política de posicionamento compacto.
    • REGION: a região da política de posicionamento compacto.
    • POLICY_NAME: o nome da política de posicionamento compacto.
  3. Envie a solicitação.

A seguir