VMs Arm no Compute

Google Cloud oferece uma gama de servidores com tecnologia Arm no Compute Engine através das séries de máquinas N4A (pré-visualização), C4A bare metal (pré-visualização), C4A e A4X. A arquitetura Arm está otimizada para a eficiência energética e, como resultado, pode gerar um melhor preço em função do desempenho.

Os processadores ARM são comuns em servidores padrão devido à respetiva eficiência energética em comparação com os servidores x86. Os telemóveis e os portáteis são exemplos de dispositivos que são executados num processador Arm. Com o conjunto de instruções reduzido de uma CPU Arm, menos instruções equivalem a uma maior velocidade de desempenho com um menor consumo de bateria e energia.

A N4A usa o processador ARM Axion da Google com o processador Neoverse N3. O C4a usa o processador ARM Axion baseado no processador Arm Neoverse V2. O Neoverse V2 é a primeira CPU da série V a ter melhoramentos de desempenho, consumo de energia e segurança do Armv9. Foi concebida para computação de alto desempenho, aprendizagem automática e computação na nuvem de utilização geral. Considere usar máquinas virtuais (VMs) Arm de uso geral N4A ou C4A para qualquer um dos seguintes fins:

  • Executar cargas de trabalho com utilização intensiva de computação que requerem a capacidade de dimensionar rapidamente a utilização quando necessário.
  • Otimize o desempenho/preço em cargas de trabalho compatíveis com Arm.
  • Crie com base em stacks de software de código aberto modernos.
  • Desenvolver e testar sistemas incorporados ou para dispositivos móveis que usam uma CPU Arm.
  • Avalie se a sua carga de trabalho é adequada para uma CPU Arm.

Para usar GPUs com uma CPU baseada em Arm, escolha a série A4X Max ou A4X, que é executada na arquitetura de escala de rack da NVIDIA. As instâncias destas séries de máquinas têm Superchips NVIDIA Grace Blackwell anexados. Estas séries de máquinas estão otimizadas para cargas de trabalho de computação de arquitetura de dispositivos unificados de computação (CUDA) massivamente paralelizadas, como aprendizagem automática (ML) e computação de elevado desempenho (HPC).

A4X Max e série de máquinas A4X

As séries de máquinas A4X Max e A4X têm CPUs baseadas em ARM e GPUs anexadas. Ambos os tipos de máquinas nesta série têm dois processadores Grace Arm da NVIDIA ligados a quatro GPUs com comunicação rápida entre chips (NVLink C2C).

  • A4X Max: oferece tipos de máquinas com até 144 vCPUs e 960 GB de memória. Utiliza superchips GB300 da NVIDIA, que têm GPUs B300 que oferecem 279 GB de memória por GPU. O A4X Max está disponível como uma instância bare metal no tipo de máquina a4x-maxgpu-4g-metal.
  • A4X: oferece tipos de máquinas com até 140 vCPUs e 884 GB de memória. Utiliza superchips GB200 da NVIDIA, que têm GPUs B200 que oferecem 186 GB de memória por GPU. O A4X está disponível no a4x-highgpu-4g tipo de máquina.

Opções de armazenamento para instâncias A4X Max e A4X

As instâncias A4X Max e A4X podem ser usadas com o armazenamento associado do Google Cloud Hyperdisk e incluem 12 000 GiB de SSD local. O Compute Engine anexa automaticamente os discos SSD local às suas instâncias durante a criação das instâncias.

Imagens do SO

As instâncias A4X Max e A4X suportam imagens do SO públicas baseadas em Arm. Também pode criar imagens personalizadas com uma imagem de SO pública baseada em ARM.

Série de máquinas N4A

N4A (pré-visualização) é a VM mais recente baseada no Google Axion, criada na CPU Neoverse N3. As instâncias N4A oferecem tipos de máquinas com até 64 vCPUs e 512 GB de memória DDR5, bem como suporte para a unidade de processamento de infraestrutura (IPU) Titanium. O N4A usa a gestão de recursos dinâmicos de nova geração e está disponível nos tipos de máquinas standard, highmem e highcpu com a opção de personalizar o tipo de máquina e adicionar memória expandida.

O N4A suporta a rede padrão até 50 Gbps com a interface de rede gVNIC. O N4A também suporta a interface de disco NVMe com o armazenamento Hyperdisk Balanced, Hyperdisk Balanced High Availability e Hyperdisk Throughput.

Série de máquinas C4A

A C4A é a primeira VM baseada em Arm criada na CPU baseada em Arm64 Axion da Google. As C4A oferecem tipos de máquinas com até 72 vCPUs e 576 GB de memória DDR5. O C4A está disponível nos tipos de máquinas standard, highmem e highcpu.

O C4A oferece um tipo de máquina de metal nu highmem de 96 vCPUs com 768 GB de memória DDR5 (pré-visualização).

O C4A é baseado no Titanium, que usa descarregamentos de rede e permite um desempenho de rede de nível 1 por VM de até 100 Gbps com a interface de rede gVNIC. O C4A também suporta as interfaces de disco NVMe e IDPF com volumes Hyperdisk.

Multithreading simultâneo

Para a série de máquinas C4A, cada vCPU é suportada por um único núcleo sem multiprocessamento simultâneo (SMT). Assim, as VMs C4A oferecem um desempenho superior por vCPU em comparação com uma VM com SMT ativado. Embora a SMT ofereça vantagens a determinadas cargas de trabalho, os núcleos de processamento único são ideais para cargas de trabalho com utilização intensiva de computação, porque os processos podem aceder ao núcleo inteiro em vez de o partilharem com outros processos.

Imagens do SO

As VMs C4A e N4A suportam imagens do SO públicas baseadas em Arm. Também pode criar imagens personalizadas com uma imagem baseada em Arm disponível publicamente.

Série de máquinas Tau T2A

A série de máquinas Tau T2A Arm é executada no processador Ampere Altra Arm de 64 núcleos a uma frequência de 3,0 GHz de todos os núcleos. O Tau T2A permite executar cargas de trabalho que funcionam melhor ou exclusivamente no Arm.

A série de máquinas Tau T2A tem tipos de máquinas predefinidos de até 48 núcleos físicos com 4 GB de memória por vCPU. Os tipos de máquinas Tau T2A são executados num único nó NUMA.

Os tipos de máquinas Tau T2A só suportam a interface NVMe para armazenamento e a NIC virtual da Google (gVNIC) para rede. As interfaces Virtio-Net e SCSI não são suportadas. Todas as imagens do SO disponíveis publicamente estão configuradas para usar as interfaces NVMe e gVNIC. A gVNIC é uma interface de rede concebida especificamente para o Compute Engine. Oferece um melhor desempenho e suporta larguras de banda e débito de rede mais elevadas.

Para esta série de máquinas, cada vCPU é suportada por um único núcleo sem multithreading simultâneo (SMT).

Recomendações de carga de trabalho

A série de máquinas C4A é uma excelente escolha para uma vasta gama de cargas de trabalho de expansão e com utilização intensiva de computação, especialmente quando o desempenho de preços é uma preocupação fundamental. Considere o C4A quando implementar cargas de trabalho, como as seguintes:

  • Tratamento de dados de ML
  • Inferência de ML e publicação de modelos
  • Publicação de apps, publicação na Web e publicação de jogos
  • Desenvolvimento de sistemas incorporados
  • Desenvolvimento em CI/CD no Arm
  • Codificação, transcodificação e processamento de vídeo e imagem
  • Serviços e bolsas de publicidade digital
  • Servidores de cache
  • Descoberta computacional de medicamentos
  • Programação para Android
  • Desenvolvimento de software automóvel autónomo ou convencional

O que se segue?