GPUs disponíveis

As GPUs são usadas para acelerar cargas de trabalho, e o Cloud Workstations permite anexar GPUs a estações de trabalho. O Cloud Workstations é compatível com muitos dos vários modelos de GPU que podem ser anexados a VMs do Compute Engine. O modelo e a quantidade de GPUs a serem anexadas a cada estação de trabalho são especificados na configuração da estação de trabalho. O Cloud Workstations processa a conexão das GPUs e a instalação dos drivers de dispositivos.

A vinculação de GPUs a estações de trabalho afeta os custos, conforme descrito na visão geral de preços do Cloud Workstations.

Limitações

Uma configuração de estação de trabalho pode especificar GPUs, sujeitas às seguintes limitações:

  • O Cloud Workstations só é compatível com GPUs para configurações que especificam tipos de máquina nas séries N1, A2 ou A3. Consulte modelos de GPU compatíveis para mais detalhes.
  • A configuração precisa especificar zonas de réplica em que o modelo de GPU escolhido está disponível.
  • Não é possível configurar estações de trabalho para ter mais de um modelo de GPU anexado por vez.
  • As configurações que especificam tipos de máquina A2 Ultra não podem especificar armazenamento permanente. Considere usar uma solução baseada em NFS, como o Filestore ou o Cloud Storage FUSE, se for necessário armazenamento de arquivos permanente. Os tipos de máquina A2 padrão são compatíveis com armazenamento permanente. Para criar configurações sem armazenamento permanente, use o seguinte comando da Google Cloud CLI:

      gcloud workstations configs create CONFIG_NAME \
        --project=PROJECT_ID \
        --cluster=CLUSTER_NAME \
        --region=LOCATION \
        --machine-type=A2_MACHINE_TYPE \
        --no-persistent-storage
    

    Substitua:

    • PROJECT_ID: o ID do projeto que contém a configuração da estação de trabalho.
    • LOCATION: a região do cluster de estação de trabalho.
    • CLUSTER_NAME: o nome do cluster de estação de trabalho que contém a configuração da estação de trabalho.
    • CONFIG_NAME: o nome da configuração da estação de trabalho.
    • A2_MACHINE_TYPE: o tipo da máquina A2.
  • As configurações que especificam tipos de máquina A3 só são compatíveis com volumes permanentes do Hyperdisk.

  • O uso de tipos de disco do Google Cloud Hyperdisk só é compatível com as seguintes séries de máquinas:

    • A3
    • C3
    • C4
    • G4
    • M3
    • N4
    • N4D
    • Z3

Modelos de GPU compatíveis

O Cloud Workstations é compatível com muitos dos modelos de GPU que o Compute Engine disponibiliza. Os modelos compatíveis dependem da série de máquinas escolhida para a configuração da estação de trabalho, conforme resumido na tabela a seguir.

Série de máquinas N1

A série de máquinas de uso geral N1 é compatível com vários modelos de GPU, e as configurações de estação de trabalho que especificam qualquer um dos tipos de máquina N1 também podem especificar um dos seguintes modelos de GPU. Para o modelo de GPU escolhido, a configuração pode especificar uma contagem de quantas placas de GPU anexar a cada estação de trabalho.

Modelo de GPU Contagens de GPU
NVIDIA T4 (nvidia-tesla-t4) 1, 2 ou 4 GPUs
NVIDIA P4 (nvidia-tesla-p4) 1, 2 ou 4 GPUs
NVIDIA V100 (nvidia-tesla-v100) 1, 2, 4 ou 8 GPUs
NVIDIA P100 (nvidia-tesla-p100) 1, 2 ou 4 GPUs

Série de máquina A2

A série de máquinas A2 padrão otimizada para aceleradores tem um número fixo de GPUs NVIDIA A100 anexadas, com base apenas no tipo de máquina escolhido.

A tabela a seguir mostra o mapeamento do tipo de máquina para o número de cartões que serão anexados.

Modelo de GPU Tipo de máquina Contagem de GPUs
NVIDIA A100 40GB (nvidia-tesla-a100) a2-highgpu-1g 1 GPU
a2-highgpu-2g 2 GPUs
a2-highgpu-4g 4 GPUs
a2-highgpu-8g 8 GPUs
a2-megagpu-16g 16 GPUs

O Cloud Workstations não aceita tipos de máquina A2 ultra.

Série de máquinas A3

A série de máquinas otimizadas para aceleradores A3 Mega e A3 High tem um número fixo de GPUs NVIDIA H100 anexadas, com base apenas no tipo de máquina escolhido.

A tabela a seguir mostra o mapeamento do tipo de máquina para o número de cartões que serão anexados.

Modelo de GPU Tipo de máquina Contagem de GPUs
NVIDIA H100 80GB (nvidia-tesla-h100) a3-highgpu-1g 1 GPU
a3-highgpu-2g 2 GPUs
a3-highgpu-4g 4 GPUs
a3-highgpu-8g 8 GPUs
a3-megagpu-8g 8 GPUs

Suporte do Google Cloud Hyperdisk

Algumas cargas de trabalho de GPU exigem uma capacidade de processamento de disco muito alta. Para atender a esse caso de uso, as estações de trabalho do Cloud permitem o uso de discos Hyperdisk do Google Cloud Balanced High Availability como diretórios permanentes para os tipos de máquinas enumerados anteriormente.

O armazenamento do Hyperdisk pode ser configurado pelo console e pela CLI gcloud. Não é possível mudar o tipo de disco depois de criar uma configuração de estação de trabalho.

Anexar um Hyperdisk a uma estação de trabalho afeta os custos, conforme descrito em Preços do Hyperdisk do Google Cloud.

Adicionar GPUs a uma configuração de estação de trabalho

Para adicionar GPUs a uma configuração de estação de trabalho, siga as etapas em uma das guias a seguir.

Antes de começar

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:

gcloud init

Ao usar um provedor de identidade (IdP) externo, primeiro faça login na CLI gcloud com sua identidade federada.

Leia a visão geral dos preços do Cloud Workstations para entender como seus custos serão afetados pela configuração de GPUs. As GPUs são anexadas às máquinas virtuais (VMs) pré-iniciadas especificadas pelo Tamanho do pool de início rápido de uma configuração.

Atualizar a configuração atual

Console

Configure GPUs em uma configuração de estação de trabalho atual no console Google Cloud fazendo o seguinte:

  1. No console Google Cloud , acesse a página Configurações de estação de trabalho.

    Acessar as configurações da estação de trabalho

  2. Na lista Configurações de estação de trabalho, clique no Nome da configuração para adicionar GPUs.

  3. Na página Detalhes da configuração da estação de trabalho, clique em editar Editar.

  4. Na página Editar configuração da estação de trabalho, clique em Configurações da máquina no menu de navegação.

  5. Clique na chave para selecionar GPUs em vez da família de máquinas Uso geral.

    No campo Tipo de GPU, selecione o modelo de GPU que você quer usar.

    No campo Número de GPUs, selecione o número de placas de GPU que você quer anexar a cada estação de trabalho.

    No campo Tipo de máquina, selecione o tipo que você quer usar.

  6. Clique em Salvar para atualizar a configuração.

gcloud

Configure GPUs em uma configuração de estação de trabalho atual executando o comando gcloud workstations configs update.

Primeiro, colete algumas informações para saber quais modelos de GPU estão disponíveis e escolher um para sua configuração:

  1. Para verificar quais zonas de réplica a configuração especifica, execute o seguinte comando da CLI gcloud:

    gcloud workstations configs describe \
      --format="table(name.scope(workstationConfigs),replicaZones.list())" \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME
    

    Substitua:

    • PROJECT_ID: o ID do projeto que contém a configuração da estação de trabalho.
    • LOCATION: o local do cluster de estação de trabalho.
    • CLUSTER_NAME: o nome do cluster de estação de trabalho que contém a configuração da estação de trabalho.
    • CONFIG_NAME: o nome da configuração da estação de trabalho.
  2. Escolha um modelo de GPU compatível que esteja disponível nas duas zonas de réplica da configuração executando o comando gcloud compute accelerator-types list:

    gcloud compute accelerator-types list \
      --format="table(name:sort=1,zone,description,maximumCardsPerInstance)" \
      --filter='zone.basename()=(ZONES) AND name~"nvidia-tesla-(a100|p100|p4|t4|v100)$"' \
      --project=PROJECT_ID
    

    Substitua ZONES por uma lista separada por vírgulas das zonas de réplica determinadas na etapa anterior (por exemplo, us-central1-a,us-central1-c).

    Escolha um modelo de GPU que esteja listado duas vezes na tabela, indicando que ele está disponível nas duas zonas de réplica.

    Anote o número máximo de placas que podem ser anexadas ao modelo de GPU escolhido.

  3. Determine quais dos tipos de máquinas compatíveis estão disponíveis em ambas as zonas de réplica da configuração usando o comando gcloud compute machine-types list.

    1. Se você escolheu o modelo de GPU NVIDIA A100 de 40 GB na etapa anterior, a configuração precisa usar a série de máquinas A2:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:a2-highgpu- OR name:a2-megagpu-" \
        --zones=ZONES \
        --project=PROJECT_ID
      
    2. Se você escolheu outro modelo de GPU na etapa anterior, sua configuração precisa usar a série de máquinas N1:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:n1-standard-" \
        --zones=ZONES \
        --project=PROJECT_ID
      

    Escolha um tipo de máquina que esteja listado duas vezes na tabela, indicando que ele está disponível nas duas zonas de réplica.

  4. Agora que você selecionou um modelo de GPU e um tipo de máquina compatível, atualize a configuração:

    1. Para GPUs NVIDIA A100 de 40 GB, execute este comando para atualizar sua configuração:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=A2_MACHINE_TYPE
      

      Substitua A2_MACHINE_TYPE pelo tipo de máquina A2 escolhido, determinado na etapa anterior (por exemplo, a2-highgpu-1g).

    2. Para todos os outros modelos de GPU, execute este comando:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=N1_MACHINE_TYPE \
        --accelerator-type=ACCELERATOR_TYPE \
        --accelerator-count=ACCELERATOR_COUNT
      

      Substitua:

      • N1_MACHINE_TYPE: o tipo de máquina escolhido da série N1 (por exemplo, n1-standard-2).
      • ACCELERATOR_TYPE: o nome do modelo de GPU escolhido (por exemplo, nvidia-tesla-t4).
      • ACCELERATOR_COUNT: o número de GPUs a serem anexadas a cada estação de trabalho (por exemplo, 1, 2, 4). Precisa ser uma potência de dois menor que o máximo para o modelo de GPU.

AVISO: não é possível mudar para o Hyperdisk depois que a configuração da estação de trabalho é criada.


Criar uma configuração de estação de trabalho com GPUs

Para criar uma configuração de estação de trabalho que anexe GPUs a estações de trabalho baseadas nela, siga as etapas em uma das guias a seguir.

Antes de começar

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:

gcloud init

Ao usar um provedor de identidade (IdP) externo, primeiro faça login na CLI gcloud com sua identidade federada.

REST

Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.

    Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:

    gcloud init

    Ao usar um provedor de identidade (IdP) externo, primeiro faça login na CLI gcloud com sua identidade federada.

Saiba mais em Autenticar para usar REST na documentação de autenticação do Google Cloud .

Escolha um modelo de GPU e consulte a tabela de disponibilidade de GPU para selecionar uma região em que o modelo de GPU escolhido esteja disponível em pelo menos duas zonas.

Se você ainda não tiver um cluster na região escolhida em que possa criar uma nova configuração, siga as etapas para criar um cluster de estação de trabalho na região.

Leia a visão geral dos preços do Cloud Workstations para entender como seus custos serão afetados pela configuração de GPUs. As GPUs são anexadas às máquinas virtuais (VMs) pré-iniciadas especificadas pelo Tamanho do pool de início rápido de uma configuração.

Criar uma configuração

Console

Crie uma configuração de estação de trabalho com GPUs no console Google Cloud fazendo o seguinte:

  1. No console Google Cloud , acesse a página Configurações da estação de trabalho.

    Acessar as configurações da estação de trabalho

  2. Na página Configurações da estação de trabalho, clique em add_box Criar.

  3. Na etapa Informações básicas da página Criar configuração de estação de trabalho, especifique um nome para sua configuração no campo Nome.

    No campo Cluster de estação de trabalho, selecione um cluster na região escolhida.

    Clique em Continuar para avançar para a etapa Configurações da máquina.

  4. Na etapa Configurações da máquina da página Criar configuração de estação de trabalho, clique no botão para selecionar GPUs em vez da família de máquinas Uso geral.

    1. Em seguida, no campo Zonas, marque as caixas de seleção ao lado de duas zonas em que o modelo de GPU escolhido está disponível. Consulte a tabela de disponibilidade de GPU.

    2. No campo Tipo de GPU, selecione o modelo de GPU que você quer usar.

    3. No campo Número de GPUs, selecione o número de placas de GPU que você quer anexar a cada estação de trabalho.

    4. No campo Tipo de máquina, selecione um tipo de máquina compatível.

  5. Opcional:esse recurso ainda não está disponível na interface. Consulte as instruções do gcloud para usar a CLI e configurar esse recurso.

  6. Clique em Continuar para configurar as definições de ambiente e a política de gerenciamento de identidade e acesso (IAM) antes de clicar em Criar para provisionar a nova configuração de estação de trabalho.

gcloud

Crie uma configuração de estação de trabalho com GPUs usando a CLI gcloud executando o comando gcloud workstations configs create.

  • Para GPUs NVIDIA A100 de 40 GB, execute este comando para criar sua configuração:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=A2_MACHINE_TYPE
    

    Substitua:

    • PROJECT_ID: o ID do projeto que vai conter a nova configuração de estação de trabalho.
    • LOCATION: o local do cluster da estação de trabalho em que a configuração será contida.
    • CLUSTER_NAME: o nome do cluster de estação de trabalho que vai conter a nova configuração.
    • CONFIG_NAME: o nome da nova configuração de estação de trabalho.
    • REPLICA_ZONES: exatamente duas zonas na região do cluster em que o modelo de GPU escolhido está disponível (por exemplo, us-central1-a,us-central1-c).
    • A2_MACHINE_TYPE: o tipo de máquina da série A2 escolhido (por exemplo, a2-highgpu-1g).
  • Para todos os outros modelos de GPU, execute este comando para criar sua configuração:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=N1_MACHINE_TYPE \
      --accelerator-type=ACCELERATOR_TYPE \
      --accelerator-count=ACCELERATOR_COUNT
    

    Substitua:

    • PROJECT_ID: o ID do projeto que vai conter a nova configuração de estação de trabalho.
    • LOCATION: o local do cluster da estação de trabalho em que a configuração será contida.
    • CLUSTER_NAME: o nome do cluster de estação de trabalho que vai conter a nova configuração.
    • CONFIG_NAME: o nome da nova configuração de estação de trabalho.
    • REPLICA_ZONES: exatamente duas zonas na região do cluster em que o modelo de GPU escolhido está disponível (por exemplo, us-central1-a,us-central1-c).
    • N1_MACHINE_TYPE: o tipo de máquina da série N1 escolhido (por exemplo, n1-standard-2).
    • ACCELERATOR_TYPE: o nome do modelo de GPU escolhido (por exemplo, nvidia-tesla-t4).
    • ACCELERATOR_COUNT: o número de GPUs a serem anexadas a cada estação de trabalho (por exemplo, 1, 2, 4).
  • Opcional:para usar um Hyperdisk, adicione a flag --disk-type=hyperdisk-balanced-ha. Exemplo:

    gcloud beta workstations configs create \
      ... \
      --disk-type=hyperdisk-balanced-ha \
      --disk-size=200
    

    Esse comando cria um Hyperdisk de 200 GB. O tipo de disco não pode ser alterado depois da criação da configuração da estação de trabalho.

Drivers de dispositivo de GPU NVIDIA

O Cloud Workstations instala os drivers de dispositivo NVIDIA nas VMs host das estações de trabalho durante a inicialização da VM.

Para determinar qual versão do driver de dispositivo foi instalada em uma estação de trabalho, execute o seguinte comando:

nvidia-smi --query-gpu=name,driver_version --format=csv

Disponibilidade de GPUs por região e zona

É possível pesquisar por local ou modelo de GPU ou por uma combinação de ambos.

Zonas Local Plataformas de GPU
asia-east1-a Taiwan P100, T4
asia-east1-b Taiwan
asia-east1-c Taiwan H100, P100, T4, V100
asia-east2-a Hong Kong T4
asia-east2-b Hong Kong
asia-east2-c Hong Kong T4
asia-northeast1-a Tóquio A100 40 GB, T4
asia-northeast1-b Tóquio H100
asia-northeast1-c Tóquio A100 40 GB, T4
asia-northeast3-a Seul A100 40GB, H100
asia-northeast3-b Seul A100 40 GB, T4
asia-northeast3-c Seul H100, T4
asia-south1-a
asia-south1-b
Mumbai T4
asia-south1-c Mumbai H100
asia-southeast1-a Singapura T4
asia-southeast1-b
asia-southeast1-c
Singapura A100 40GB, H100, P4, T4
australia-southeast1-a Sydney P4, T4
australia-southeast1-b Sydney P100, P4
australia-southeast1-c Sydney H100, T4
australia-southeast2-a
australia-southeast2-b
australia-southeast2-c
Melbourne
europe-central2-a Varsóvia
europe-central2-b
europe-central2-c
Varsóvia T4
europe-north1-a
europe-north1-b
Finlândia
europe-north1-c Finlândia H100
europe-southwest1-a
europe-southwest1-b
europe-southwest1-c
Madri
europe-west1-b Bélgica H100, P100, T4
europe-west1-c Bélgica H100, T4
europe-west1-d Bélgica P100, T4
europe-west12-a
europe-west12-b
Turim
europe-west2-a Londres T4
europe-west2-b Londres H100, T4
europe-west2-c Londres
europe-west3-a Frankfurt H100
europe-west3-b Frankfurt T4
europe-west3-c Frankfurt H100
europe-west4-a Países Baixos A100 40GB, P100, T4, V100
europe-west4-b Países Baixos A100 40GB, H100, P4, T4, V100
europe-west4-c Países Baixos H100, P4, T4, V100
europe-west6-a
europe-west6-b
europe-west6-c
Zurique
europe-west8-a
europe-west8-b
Milão
europe-west8-c Milão H100
europe-west9-a
europe-west9-b
Paris
europe-west9-c Paris H100
me-central2-a
me-central2-b
me-central2-c
Damã
me-west1-a Tel Aviv A100 40 GB
me-west1-b Tel Aviv T4
me-west1-c Tel Aviv A100 40 GB, T4
northamerica-northeast1-a
northamerica-northeast1-b
Montreal P4
northamerica-northeast1-c Montreal P4, T4
southamerica-east1-a São Paulo T4
southamerica-east1-b São Paulo
southamerica-east1-c São Paulo T4
southamerica-west1-a
southamerica-west1-b
southamerica-west1-c
Santiago
us-central1-a Iowa A100 40GB, H100, P4, T4, V100
us-central1-b Iowa A100 40GB, H100, T4, V100
us-central1-c Iowa A100 40GB, H100, P100, P4, T4, V100
us-central1-f Iowa A100 40GB, P100, T4, V100
us-east1-b Carolina do Sul A100 40 GB, P100
us-east1-c Carolina do Sul P100, T4, V100
us-east1-d Carolina do Sul T4
us-east4-a
us-east4-b
us-east4-c
Norte da Virgínia H100, P4, T4
us-east5-a Columbus H100
us-east5-b
us-east5-c
Columbus
us-west1-a Oregon H100, P100, T4, V100
us-west1-b Oregon A100 40GB, H100, P100, T4, V100
us-west1-c Oregon
us-west4-a Las Vegas H100, T4
us-west4-b Las Vegas A100 40 GB, T4
us-west4-c Las Vegas

A seguir