VMs Arm no Compute

Google Cloud oferece uma variedade de servidores com tecnologia Arm no Compute Engine pelas séries de máquinas N4A (prévia), C4A bare metal (prévia), C4A e A4X. A arquitetura Arm é otimizada para eficiência energética e, por isso, pode oferecer uma melhor relação entre preço e desempenho.

Os processadores Arm são comuns em servidores padrão devido à eficiência energética em comparação com servidores x86. Smartphones e laptops são exemplos de dispositivos que funcionam com um processador Arm. Com um conjunto de instruções reduzido da CPU Arm, menos instruções equivalem a maior velocidade de desempenho com menor consumo de bateria e energia.

O N4A usa o processador Axion Arm do Google com o processador Neoverse N3. O C4A usa o processador Axion Arm baseado no Arm Neoverse V2. O Neoverse V2 é a primeira CPU da série V a ter melhorias de desempenho, energia e segurança do Armv9. Ela foi projetada para computação de alto desempenho, machine learning e computação em nuvem de uso geral. Considere usar máquinas virtuais (VMs) Arm de uso geral N4A ou C4A para qualquer um dos seguintes fins:

  • Executar cargas de trabalho com uso intenso de computação que exijam a capacidade de escalonar rapidamente o uso quando necessário.
  • Otimizar a relação preço-desempenho em cargas de trabalho compatíveis com Arm.
  • Criar com base em pilhas de software de código aberto modernas.
  • Desenvolver e testar sistemas móveis ou incorporados que usam uma CPU Arm.
  • Avaliar se a carga de trabalho é adequada para uma CPU Arm.

Para usar GPUs com uma CPU baseada em Arm, escolha a série de máquinas A4X Max ou A4X, que é executada na arquitetura de rack da NVIDIA. As instâncias dessas séries de máquinas têm Superchips NVIDIA Grace Blackwell anexados. Essas séries de máquinas são otimizadas para cargas de trabalho de computação em arquitetura de dispositivo unificado (CUDA) massivamente paralelas, como machine learning (ML) e computação de alto desempenho (HPC).

Série de máquinas A4X Max e A4X

As séries de máquinas A4X Max e A4X têm CPUs baseadas em Arm e GPUs anexadas. Os dois tipos de máquina nessa série têm dois soquetes com CPUs NVIDIA Grace Arm conectados a quatro GPUs com comunicação rápida de chip para chip (NVLink C2C).

  • A4X Max: oferece tipos de máquina com até 144 vCPUs e 960 GB de memória. Ele usa superchips NVIDIA GB300, que têm GPUs B300 com 279 GB de memória por GPU. O A4X Max está disponível como uma instância bare metal no tipo de máquina a4x-maxgpu-4g-metal.
  • A4X: oferece tipos de máquina com até 140 vCPUs e 884 GB de memória. Ele usa superchips NVIDIA GB200, que têm GPUs B200 com 186 GB de memória por GPU. O A4X está disponível no tipo de máquina a4x-highgpu-4g.

Opções de armazenamento para instâncias A4X Max e A4X

As instâncias A4X Max e A4X podem ser usadas com o armazenamento conectado do Google Cloud Hyperdisk e vêm com 12.000 GiB de SSD local. O Compute Engine anexa automaticamente os discos SSD locais às instâncias durante a criação delas.

Imagens do SO

As instâncias A4X Max e A4X são compatíveis com imagens do SO públicas baseadas em Arm. Também é possível criar imagens personalizadas usando uma imagem do SO pública baseada em Arm.

Série de máquinas N4A

A N4A (prévia) é a VM mais recente baseada no Google Axion, criada com a CPU Neoverse N3. A N4A oferece tipos de máquinas com até 64 vCPUs e 512 GB de memória DDR5 e suporte a unidade de processamento de infraestrutura (IPU) do Titanium. O N4A usa o gerenciamento dinâmico de recursos de última geração e está disponível nos tipos de máquina standard, highmem e highcpu com a opção de personalizar seu tipo de máquina e adicionar memória estendida.

O N4A oferece suporte a rede padrão de até 50 Gbps com a interface de rede gVNIC. A N4A também oferece suporte à interface de disco NVMe com armazenamento de capacidade de processamento do Hyperdisk, Hyperdisk equilibrado e Hyperdisk equilibrado de alta disponibilidade.

Série de máquinas C4A

A C4A é a primeira VM baseada em Arm criada na CPU Axion Arm64 do Google. O C4A oferece tipos de máquinas com até 72 vCPUs e 576 GB de memória DDR5. O C4A está disponível nos tipos de máquina standard, highmem e highcpu.

O C4A oferece um tipo de máquina bare metal highmem de 96 vCPUs com 768 GB de memória DDR5 (prévia).

O C4A é criado no Titanium, que usa descarregamentos de rede e permite o desempenho de rede Tier_1 por VM de até 100 Gbps com a interface de rede gVNIC. A C4A também oferece suporte às interfaces de disco NVMe e IDPF com volumes do Hyperdisk.

Multissegmentação simultânea

Na série de máquinas C4A, cada vCPU é respaldada por um único núcleo sem multissegmentação simultânea (SMT). Assim, as VMs C4A oferecem melhor desempenho por vCPU em comparação a uma VM com SMT ativado. Embora o SMT ofereça benefícios para certas cargas de trabalho, os núcleos com uma linha de execução única são ideais para cargas de trabalho com uso intenso de computação porque os processos podem acessar o núcleo inteiro em vez de compartilhá-lo com outros processos.

Imagens do SO

As VMs C4A e N4A são compatíveis com imagens do SO públicas baseadas em Arm. Você também pode criar imagens personalizadas usando uma imagem baseada em Arm disponível publicamente.

Série de máquinas Tau T2A

A série de máquinas Tau T2A Arm funciona com o processador Ampere Altra Arm de 64 núcleos a uma frequência de 3 GHz em todos os núcleos. A série Tau T2A permite executar cargas de trabalho que funcionem melhor ou exclusivamente com Arm.

A série de máquinas Tau T2A tem tipos de máquinas predefinidos de até 48 núcleos físicos com 4 GB de memória por vCPU. Os tipos de máquina Tau T2A são executados em um único nó NUMA.

Os tipos de máquinas Tau T2A são compatíveis apenas com a interface NVMe para armazenamento e NIC virtual do Google (gVNIC) para rede. As interfaces Virtio-Net e SCSI não são compatíveis. Todas as imagens do SO de Arm disponíveis publicamente são configuradas para usar as interfaces NVMe e gVNIC. gVNIC é uma interface de rede projetada especificamente para o Compute Engine. Ela oferece melhor desempenho e é compatível com larguras de banda e capacidade de processamento mais altas.

Nessa série de máquinas, um único núcleo é responsável por cada vCPU, sem multissegmentação simultânea (SMT, na sigla em inglês).

Recomendações de carga de trabalho

A série de máquinas C4A é uma excelente opção para uma ampla variedade de cargas de trabalho de escalonamento horizontal e computação intensiva, especialmente quando a relação custo-benefício é uma preocupação principal. Considere o C4A ao implantar cargas de trabalho como as seguintes:

  • Tratamento de dados de ML
  • Inferência de ML e disponibilização de modelos
  • Disponibilização de apps, Web e jogos
  • Desenvolvimento de sistemas incorporados
  • Desenvolvimento em CI/CD com Arm
  • Codificação, transcodificação e processamento de vídeos e imagens
  • Veiculação e trocas de publicidade digital
  • Servidores de cache
  • Identificação de medicamentos auxiliada por computador
  • Desenvolvimento para Android
  • Desenvolvimento de software automotivo autônomo ou convencional

A seguir