Google Cloud propose une gamme de serveurs basés sur l'architecture Arm dans Compute Engine via les séries de machines N4A, C4A et A4X. L'architecture Arm est optimisée pour accroître l'efficacité énergétique. Par conséquent, elle peut offrir un meilleur rapport prix-performances.
Les processeurs Arm sont courants sur les serveurs standards en raison de leur efficacité énergétique par rapport aux serveurs x86. Les téléphones mobiles et les ordinateurs portables sont des exemples d'appareils exécutés sur un processeur Arm. Avec l'ensemble d'instructions réduit d'un processeur Arm, vous bénéficiez de meilleures performances avec une batterie et une consommation d'énergie réduites.
La série N4A utilise le processeur Arm Axion de Google avec le processeur Neoverse N3. La série C4A utilise le processeur Arm Axion basé sur le processeur Arm Neoverse V2. Le Neoverse V2 est le premier processeur de la série V à bénéficier d'améliorations en termes de performances, d'efficacité énergétique et de sécurité Armv9. Il est conçu pour le calcul hautes performances, le machine learning et le cloud computing à usage général. Envisagez d'utiliser des machines virtuelles (VM) Arm à usage général N4A ou C4A pour l'une des raisons suivantes :
- Exécuter des charges de travail nécessitant beaucoup de ressources de calcul qui doivent effectuer un scaling rapide de l'utilisation si nécessaire
- Optimiser le rapport prix-performances sur les charges de travail compatibles avec Arm
- Développer sur des piles logicielles Open Source modernes
- Développer et tester des systèmes mobiles ou intégrés utilisant un processeur Arm
- Déterminer si votre charge de travail est adaptée à un processeur Arm
Pour utiliser des GPU avec un processeur basé sur l'architecture Arm, choisissez la série de machines A4X Max ou A4X, qui s'exécute sur l'architecture NVIDIA Rack Scale. Les instances de ces séries de machines sont associées à des superchips NVIDIA Grace Blackwell. Ces séries de machines sont optimisées pour les charges de travail de calcul CUDA (Compute Unified Device Architecture) soumises à un traitement en parallèle massif, telles que le machine learning (ML) et le calcul hautes performances (HPC, High Performance Computing).
Séries de machines A4X Max et A4X
Les séries de machines A4X Max et A4X sont équipées de processeurs basés sur l'architecture Arm et de GPU associés. Les deux types de machines de cette série disposent de deux sockets avec des processeurs Arm NVIDIA Grace connectés à quatre GPU avec une communication puce à puce (NVLink C2C) rapide.
- A4X Max : propose des types de machines offrant jusqu'à 144 processeurs virtuels et 960 Go de
mémoire. Il utilise des superchips NVIDIA GB300, qui sont équipés de GPU B300 offrant 279 Go de mémoire par GPU. A4X Max est disponible en tant qu'instance Bare Metal dans le type de machine
a4x-maxgpu-4g-metal. - A4X : propose des types de machines offrant jusqu'à 140 processeurs virtuels et 884 Go de
mémoire. Il utilise des superchips NVIDIA GB200, qui sont équipés de GPU B200 offrant 186 Go de mémoire par GPU. A4X est disponible dans le type de machine
a4x-highgpu-4g.
Options de stockage pour les instances A4X Max et A4X
Les séries A4X Max et A4X peuvent être utilisées avec le stockage associé Google Cloud Hyperdisk et sont fournies avec 12 000 Gio de disque SSD local. Compute Engine associe automatiquement les disques SSD locaux à vos instances lors de leur création.
Images d'OS
Les instances A4X Max et A4X sont compatibles avec les images d'OS publiques basées sur Arm. Vous pouvez également créer des images personnalisées à l'aide d'une image d'OS Arm publique.
Série de machines N4A
La série N4A est la
dernière VM basée sur Google Axion, conçue sur le processeur Neoverse N3. Elle propose des types de machines offrant jusqu'à 64 processeurs virtuels et 512 Go de mémoire DDR5, et est compatible avec l'unité de traitement de l'infrastructure (IPU) Titanium. La série N4A utilise la gestion dynamique des ressources de nouvelle génération
et est
disponible dans les types de machines standard, highmem, et highcpu, avec la possibilité
de personnaliser votre type de machine et d'ajouter de la mémoire étendue.
La série N4A est compatible avec la mise en réseau standard jusqu'à 50 Gbit/s avec l' interface réseau gVNIC. Elle est également compatible avec l'interface de disque NVMe avec le stockage Hyperdisk Balanced, Hyperdisk Balanced High Availability et Hyperdisk Throughput.
Série de machines C4A
C4A est la première VM basée sur l'architecture Arm
, conçue sur le processeur Arm64 Axion de Google. Elle propose des types de machines offrant jusqu'à 72 processeurs virtuels et 576 Go de mémoire DDR5. La série C4A est disponible dans les types de machines standard, highmem et highcpu.
Elle propose deux types de machines Bare Metal :
c4a-highmem-96-metalavec 96 processeurs virtuels et 768 Go de mémoire DDR5c4a-standard-96-metalavec 96 processeurs virtuels et 384 Go de mémoire DDR5
La série C4A est conçue sur Titanium qui utilise des déchargements réseau et permet des performances réseau Tier_1 par VM allant jusqu'à 100 Gbit/s avec l'interface réseau gVNIC. Elle est également compatible avec les interfaces de disque NVMe et IDPF avec les volumes Hyperdisk.
Multithreading simultané
Pour la série de machines C4A, chaque processeur virtuel est sauvegardé par un seul cœur sans multithreading simultané (SMT). Ainsi, les VM C4A offrent de meilleures performances par processeur virtuel qu'une VM avec SMT activé. Bien que SMT offre des avantages pour certaines charges de travail, les cœurs à un seul thread sont parfaits pour les charges de travail nécessitant beaucoup de ressources de calcul, car les processus peuvent accéder à l'intégralité du cœur plutôt que de le partager avec d'autres processus.
Images d'OS
Les VM C4A et N4A sont compatibles avec les images d'OS publiques basées sur Arm. Vous pouvez également créer des images personnalisées à l'aide d'une image Arm publique.
Série de machines Tau T2A
La série de machines Arm Tau T2A s'exécute sur le processeur Ampere Altra Arm à 64 cœurs à une fréquence de 3 GHz tout cœur. La série Tau T2A permet d'exécuter des charges de travail qui s'exécutent de façon optimale ou exclusivement sur Arm.
La série de machines Tau T2A propose des types de machines prédéfinis comportant jusqu'à 48 cœurs physiques, avec 4 Go de mémoire par processeur virtuel. Les types de machines Tau T2A s'exécutent dans un seul NUMA NUMA.
Les types de machines Tau T2A ne sont compatibles qu'avec l'interface NVMe pour le stockage et la carte d'interface réseau virtuelle Google (gVNIC) pour la mise en réseau. Les interfaces Virtio-Net et SCSI ne sont pas acceptées. Toutes les images de l'OS Arm disponibles publiquement sont configurées pour utiliser les interfaces NVMe et gVNIC. gVNIC est une interface réseau conçue spécifiquement pour Compute Engine. Elle offre de meilleures performances, et une bande passante et un débit réseau plus élevés.
Pour cette série de machines, chaque processeur virtuel est sauvegardé par un seul cœur sans multithreading simultané (SMT).
Recommandations concernant les charges de travail
La série de machines C4A est un excellent choix pour un large éventail de charges de travail à scaling horizontal et nécessitant beaucoup de ressources de calcul, en particulier lorsque le rapport prix-performances est un facteur clé. Envisagez d'utiliser la série C4A lorsque vous déployez des charges de travail telles que les suivantes :
- Traitement des données de ML
- Inférence de ML et diffusion de modèles
- Diffusion d'applications, diffusion Web et diffusion de jeux
- Développement de systèmes intégrés
- Développement sur CI/CD sur Arm
- Encodage, transcodage et traitement des vidéos et images
- Échanges et diffusion d'annonces numériques
- Serveurs cache
- Découverte de médicaments par calcul
- Développement d'Android
- Développement de logiciels automobiles classiques ou autonomes
Étape suivante
- Consultez les spécifications et les fonctionnalités des séries de machines A4X Max et A4X.
- Consultez les spécifications de la série de machines N4A.
- Consultez les spécifications de la série de machines C4A.
- Découvrez les plates-formes de processeur disponibles pour Google Cloud.
- Créez et démarrez une instance Compute Engine à l'aide d'une image d'OS Arm.