VM Arm sur Compute Engine

Google Cloud propose une gamme de serveurs optimisés par Arm dans Compute Engine via les séries de machines N4A (preview), C4A bare metal (preview), C4A et A4X. L'architecture Arm est optimisée pour accroître l'efficacité énergétique. Par conséquent, elle peut offrir un meilleur rapport prix-performances.

Les processeurs Arm sont courants sur les serveurs standards en raison de leur efficacité énergétique par rapport aux serveurs x86. Les téléphones mobiles et les ordinateurs portables sont des exemples d'appareils fonctionnant avec un processeur Arm. Avec l'ensemble d'instructions réduit d'un processeur Arm, vous bénéficiez de meilleures performances avec une batterie et une consommation d'énergie réduites.

N4A utilise le processeur Axion Arm de Google avec le processeur Neoverse N3. C4A utilise le processeur Axion Arm basé sur le processeur Arm Neoverse V2. Le Neoverse V2 est le premier processeur de la série V à bénéficier des améliorations apportées à Armv9 en termes de performances, de puissance et de sécurité. Elle est conçue pour le calcul hautes performances, le machine learning et le cloud computing à usage général. Envisagez d'utiliser des machines virtuelles (VM) Arm à usage général N4A ou C4A pour l'un des objectifs suivants :

  • Exécuter des charges de travail nécessitant beaucoup de ressources de calcul qui doivent effectuer un scaling rapide de l'utilisation si nécessaire
  • Optimiser le rapport prix-performances sur les charges de travail compatibles avec Arm
  • Créez des solutions sur des piles logicielles Open Source modernes.
  • Développer et tester des systèmes mobiles ou intégrés utilisant un processeur Arm
  • Déterminer si votre charge de travail est adaptée à un processeur Arm

Pour utiliser des GPU avec un processeur basé sur Arm, choisissez la série de machines A4X Max ou A4X, qui s'exécute sur l'architecture rack NVIDIA. Les instances de ces séries de machines sont associées à des superchips NVIDIA Grace Blackwell. Ces séries de machines sont optimisées pour les charges de travail de calcul CUDA (Compute Unified Device Architecture) massivement parallélisées, telles que le machine learning (ML) et le calcul hautes performances (HPC, High Performance Computing).

Série de machines A4X Max et A4X

Les séries de machines A4X Max et A4X sont équipées de processeurs basés sur Arm et de GPU associés. Les deux types de machines de cette série disposent de deux sockets avec des processeurs NVIDIA Grace Arm connectés à quatre GPU avec une communication puce à puce (NVLink-C2C) rapide.

  • A4X-Max : propose des types de machines offrant jusqu'à 144 vCPU et 960 Go de mémoire. Il utilise des superchips NVIDIA GB300, qui sont équipés de GPU B300 offrant 279 Go de mémoire par GPU. A4X Max est disponible en tant qu'instance Bare Metal dans le type de machine a4x-maxgpu-4g-metal.
  • A4X : propose des types de machines offrant jusqu'à 140 vCPU et 884 Go de mémoire. Elle utilise des superchips NVIDIA GB200, qui sont équipés de GPU B200 offrant 186 Go de mémoire par GPU. A4X est disponible dans le type de machine a4x-highgpu-4g.

Options de stockage pour les instances A4X Max et A4X

Les instances A4X Max et A4X peuvent être utilisées avec le stockage associé Google Cloud Hyperdisk et sont fournies avec 12 000 Gio de SSD local. Compute Engine associe automatiquement les disques SSD locaux à vos instances lors de leur création.

Images d'OS

Les instances A4X Max et A4X sont compatibles avec les images d'OS publiques basées sur Arm. Vous pouvez également créer des images personnalisées à l'aide d'une image d'OS publique basée sur Arm.

Série de machines N4A

N4A (preview) est la dernière VM basée sur Google Axion, conçue sur le processeur Neoverse N3. Les N4A proposent des types de machines avec jusqu'à 64 processeurs virtuels et 512 Go de mémoire DDR5, ainsi que la prise en charge de l'unité de traitement de l'infrastructure (IPU) Titanium. Les machines N4A utilisent la gestion dynamique des ressources de nouvelle génération. Elles sont disponibles dans les types de machines standard, highmem et highcpu, avec la possibilité de personnaliser votre type de machine et d'ajouter de la mémoire étendue.

N4A accepte la mise en réseau standard jusqu'à 50 Gbit/s avec l'interface réseau gVNIC. Les N4A sont également compatibles avec l'interface de disque NVMe avec le stockage Hyperdisk Balanced, Hyperdisk Balanced High Availability et Hyperdisk Throughput.

Série de machines C4A

C4A est la première VM basée sur l'architecture ARM et conçue sur le processeur Axion Arm64 de Google. C4A propose des types de machines offrant jusqu'à 72 processeurs virtuels et 576 Go de mémoire DDR5. C4A est disponible dans les types de machines standard, highmem et highcpu.

C4A propose un type de machine highmem Bare Metal (Preview) avec 96 processeurs virtuels et 768 Go de mémoire DDR5.

C4A est basé sur Titanium, qui utilise des déchargements réseau et permet des performances réseau Tier_1 par VM allant jusqu'à 100 Gbit/s avec l'interface réseau gVNIC. C4A est également compatible avec les interfaces de disque NVMe et IDPF avec les volumes Hyperdisk.

Multithreading simultané

Pour la série de machines C4A, chaque processeur virtuel est sauvegardé par un seul cœur sans multithreading simultané (SMT). Ainsi, les VM C4A offrent de meilleures performances par vCPU qu'une VM avec SMT activé. Bien que SMT offre des avantages pour certaines charges de travail, les cœurs à un seul thread sont parfaits pour les charges de travail nécessitant beaucoup de ressources de calcul, car les processus peuvent accéder à l'intégralité du cœur plutôt que de le partager avec d'autres processus.

Images d'OS

Les VM C4A et N4A sont compatibles avec les images d'OS publiques basées sur Arm. Vous pouvez également créer des images personnalisées à l'aide d'une image Arm publique.

Série de machines Tau T2A

La série de machines Tau T2A Arm s'exécute sur le processeur Ampere Altra Arm à 64 cœurs à une fréquence tout cœur de 3 GHz. La série Tau T2A permet d'exécuter des charges de travail qui s'exécutent de façon optimale ou exclusivement sur Arm.

La série de machines Tau T2A propose des types de machines prédéfinis comportant jusqu'à 48 cœurs physiques, avec 4 Go de mémoire par processeur virtuel. Les types de machines Tau T2A s'exécutent dans un seul nœud NUMA.

Les types de machines Tau T2A ne sont compatibles qu'avec l'interface NVMe pour le stockage et la carte d'interface réseau virtuelle Google (gVNIC) pour la mise en réseau. Les interfaces Virtio-Net et SCSI ne sont pas acceptées. Toutes les images de l'OS Arm disponibles publiquement sont configurées pour utiliser les interfaces NVMe et gVNIC. gVNIC est une interface réseau conçue spécifiquement pour Compute Engine. Elle offre de meilleures performances, et une bande passante et un débit réseau plus élevés.

Pour cette série de machines, chaque processeur virtuel est sauvegardé par un seul cœur sans multithreading simultané (SMT).

Recommandations concernant les charges de travail

La série de machines C4A est un excellent choix pour un large éventail de charges de travail évolutives et intensives en calcul, en particulier lorsque le rapport prix/performances est une préoccupation majeure. Envisagez d'utiliser C4A lorsque vous déployez des charges de travail telles que les suivantes :

  • Traitement des données de ML
  • Inférence de ML et diffusion de modèles
  • Diffusion d'applications, diffusion Web et diffusion de jeux
  • Développement de systèmes intégrés
  • Développement sur CI/CD sur Arm
  • Encodage, transcodage et traitement des vidéos et images
  • Échanges et diffusion d'annonces numériques
  • Serveurs cache
  • Découverte de médicaments par calcul
  • Développement d'Android
  • Développement de logiciels automobiles classiques ou autonomes

Étapes suivantes