VMs de Arm en Compute

Google Cloud ofrece una variedad de servidores con tecnología Arm en Compute Engine a través de las series de máquinas N4A, C4A y A4X. La arquitectura Arm está optimizada para la eficiencia energética y, como resultado, puede ofrecer una mejor relación precio-rendimiento.

Los procesadores Arm son comunes en los servidores estándar debido a su eficiencia energética en comparación con los servidores x86. Los teléfonos celulares y las laptops son ejemplos de dispositivos que se ejecutan en un procesador Arm. Con el conjunto de instrucciones reducido de una CPU Arm, menos instrucciones equivalen a una mayor velocidad de rendimiento con un menor consumo de energía y batería.

N4A usa el procesador Axion Arm de Google con el procesador Neoverse N3. C4A usa el procesador Axion Arm basado en el procesador Arm Neoverse V2. Neoverse V2 es la primera CPU de la serie V que tiene mejoras de rendimiento, energía y seguridad de Armv9. Está diseñada para la computación de alto rendimiento, el aprendizaje automático y la computación en la nube de uso general. Considera usar máquinas virtuales (VMs) Arm de uso general N4A o C4A para cualquiera de los siguientes propósitos:

  • Ejecuta cargas de trabajo de procesamiento intensivo que requieren la capacidad de escalar el uso con rapidez cuando sea necesario.
  • Optimiza el rendimiento y el precio en cargas de trabajo compatibles con Arm.
  • Compila en pilas de software modernas de código abierto.
  • Desarrolla y prueba sistemas incorporados o móviles que usen una CPU Arm.
  • Evalúa si la carga de trabajo es adecuada para una CPU Arm.

Para usar GPUs con una CPU basada en Arm, elige la serie de máquinas A4X Max o A4X, que se ejecuta en la arquitectura de rack de NVIDIA. Las instancias de estas series de máquinas tienen Superchips NVIDIA Grace Blackwell conectados. Estas series de máquinas están optimizadas para cargas de trabajo de procesamiento paralelizadas de forma masiva de la arquitectura unificada de dispositivos de procesamiento (CUDA), como el aprendizaje automático (AA) y la computación de alto rendimiento (HPC).

Series de máquinas A4X Max y A4X

Las series de máquinas A4X Max y A4X tienen CPUs basadas en Arm y GPUs conectadas. Ambos tipos de máquinas de esta serie tienen dos sockets con CPUs NVIDIA Grace Arm conectadas a cuatro GPUs con comunicación rápida de chip a chip (NVLink C2C).

  • A4X Max: Ofrece tipos de máquinas con hasta 144 CPU virtuales y 960 GB de memoria. Usa Superchips NVIDIA GB300, que tienen GPUs B300 que ofrecen 279 GB de memoria por GPU. A4X Max está disponible como una instancia de Bare Metal en el tipo de máquina a4x-maxgpu-4g-metal.
  • A4X: Ofrece tipos de máquinas que tienen hasta 140 CPU virtuales y 884 GB de memoria. Usa Superchips NVIDIA GB200, que tienen GPUs B200 que ofrecen 186 GB de memoria por GPU. A4X está disponible en el tipo de máquina a4x-highgpu-4g.

Opciones de almacenamiento para instancias de A4X Max y A4X

A4X Max y A4X se pueden usar con el almacenamiento conectado a Google Cloud Hyperdisk y vienen con 12,000 GiB de SSD local. Compute Engine conecta automáticamente los discos SSD locales a tus instancias durante la creación de instancias.

Imágenes de SO

Las instancias de A4X Max y A4X admiten imágenes de SO públicas basadas en Arm. También puedes crear imágenes personalizadas con una imagen de SO pública basada en Arm.

Serie de máquinas N4A

N4A es la VM más reciente basada en Google Axion, creada en la CPU Neoverse N3. N4A ofrece tipos de máquinas con hasta 64 CPU virtuales y 512 GB de memoria DDR5, y compatibilidad con la unidad de procesamiento de infraestructura (IPU) Titanium. N4A uses next-generation administración dinámica de recursos y está disponible en los tipos de máquinas standard, highmem y highcpu con la opción de personalizar tu tipo de máquina y agregar memoria extendida.

N4A admite redes estándar de hasta 50 Gbps con la interfaz de red gVNIC. N4A también admite la interfaz de disco NVMe con almacenamiento Hyperdisk Balanced, Hyperdisk Balanced High Availability y Hyperdisk Throughput.

Serie de máquinas C4A

C4A es la primera VM basada en Arm creada en la CPU Axion Arm64 de Google. C4A ofrece tipos de máquinas con hasta 72 CPU virtuales y 576 GB de memoria DDR5. C4A está disponible en los tipos de máquinas standard, highmem y highcpu.

C4A ofrece dos tipos de máquinas de Bare Metal:

  • c4a-highmem-96-metal con 96 GB de CPU virtuales y 768 GB de memoria DDR5
  • c4a-standard-96-metal con 96 GB de CPU virtuales y 384 GB de memoria DDR5

C4A se basa en Titanium que usa descargas de red y permite un rendimiento de red Tier_1 por VM de hasta 100 Gbps con la interfaz de red gVNIC. C4A también admite las interfaces de disco NVMe e IDPF con volúmenes de Hyperdisk.

Multiprocesamiento simultáneo

Para la serie de máquinas C4A, cada CPU virtual está respaldada por un solo núcleo sin subprocesos múltiples simultáneos (SMT). Por lo tanto, las VMs de C4A ofrecen un mayor rendimiento por CPU virtual en comparación con una VM con SMT habilitado. Si bien SMT proporciona beneficios a ciertas cargas de trabajo, los núcleos de subprocesos únicos son ideales para cargas de trabajo de procesamiento intensivo, ya que los procesos pueden acceder a todo el núcleo en lugar de compartirlo con otros procesos.

Imágenes de SO

Las VMs de C4A y N4A admiten imágenes de SO públicas basadas en Arm. También puedes crear imágenes personalizadas con una imagen basada en Arm disponible de manera pública.

Serie de máquinas Tau T2A

La serie de máquinas Tau T2A Arm se ejecuta en el procesador Ampere Altra Arm de 64 núcleos con una frecuencia de todos los núcleos de 3.0 GHz. Tau T2A permite ejecutar cargas de trabajo que se ejecutan mejor o exclusivamente en Arm.

La serie de máquinas Tau T2A tiene tipos predefinidos de máquinas de hasta 48 núcleos físicos con 4 GB de memoria por CPU virtual. Los tipos de máquinas Tau T2A se ejecutan dentro de un solo NUMA NUMA.

Los tipos de máquinas Tau T2A solo admiten la interfaz NVMe para el almacenamiento y NIC virtual (gVNIC) de Google para las herramientas de redes. Las interfaces Virtio-Net y SCSI no son compatibles. Todas las imágenes de SO de Arm disponibles de forma pública están configuradas para usar las interfaces NVMe y gVNIC. gVNIC es una interfaz de red diseñada específicamente para Compute Engine. Proporciona un mejor rendimiento y admite mayor ancho de banda de red y capacidad de procesamiento.

Para esta serie de máquinas, cada CPU virtual está respaldada por un solo núcleo sin subprocesos múltiples simultáneos (SMT).

Recomendaciones de cargas de trabajo

La serie de máquinas C4A es una excelente opción para una amplia variedad de cargas de trabajo de escalamiento horizontal y de procesamiento intensivo, en especial cuando el rendimiento del precio es una preocupación clave. Considera C4A cuando implementes cargas de trabajo como las siguientes:

  • Procesamiento de datos de AA
  • Inferencia de AA y entrega de modelos
  • Entrega de aplicaciones, entrega web y entrega de juegos
  • Desarrollo de sistemas incorporados
  • Desarrollo en CI/CD en Arm
  • Codificación, transcodificación y procesamiento de imágenes y videos
  • Entrega e intercambio de publicidad digital
  • Servidores almacenados en caché
  • Descubrimiento de medicamentos computacionales
  • Desarrollo de Android
  • Desarrollo de software para automóviles autónomos o convencionales

¿Qué sigue?