VMs mit Compute aktivieren

Google Cloud bietet eine Reihe von Arm-basierten Servern in Compute Engine über die Maschinenserien N4A (Vorschau), C4A und A4X. Die Arm-Architektur ist auf Energieeffizienz ausgelegt und kann daher ein besseres Preis-Leistungs-Verhältnis erzielen.

Arm-Prozessoren werden aufgrund ihrer Energieeffizienz im Vergleich zu x86-Servern häufig in Standardservern verwendet. Smartphones und Laptops sind Beispiele für Geräte, die mit einem Arm-Prozessor betrieben werden. Mit einem geringeren Satz von Befehls-Arm-CPUs und weniger Anleitungen entspricht er einer höheren Leistungsgeschwindigkeit bei geringerem Akku- und Stromverbrauch.

N4A verwendet den Axion Arm-Prozessor von Google mit dem Neoverse N3-Prozessor. Für C4A wird der Axion Arm-Prozessor auf Basis des Arm Neoverse V2-Prozessors verwendet. Die Neoverse V2 ist die erste CPU der V-Serie mit Armv9-Leistungs-, Energie- und Sicherheitsverbesserungen. Sie ist für Hochleistungs-Computing, maschinelles Lernen und Cloud-Computing für allgemeine Zwecke konzipiert. N4A- oder C4A-Arm-VMs für allgemeine Zwecke können für folgende Zwecke verwendet werden:

  • Führen Sie rechenintensive Arbeitslasten aus, die eine schnelle Skalierung der Nutzung erfordern.
  • Preis-Leistungs-Verhältnis von Arm-kompatiblen Arbeitslasten optimieren
  • Nutzen Sie moderne Open-Source-Software-Stacks.
  • Mobile und eingebettete Systeme entwickeln und testen, die eine ARM-CPU verwenden.
  • Prüfen Sie, ob Ihre Arbeitslast für eine Arm-CPU geeignet ist.

Wenn Sie GPUs mit einer Arm-basierten CPU verwenden möchten, wählen Sie die A4X-Maschinenserie aus, die auf der NVIDIA GB200 NVL72-Plattform ausgeführt wird. VMs, die mit dieser Maschinenserie erstellt werden, haben angehängte NVIDIA GB200 Grace Blackwell-Superchips. Diese Maschinenserie ist für massiv parallelisierte CUDA-Computing-Arbeitslasten (Compute Unified Device Architecture) wie maschinelles Lernen (ML) und Hochleistungs-Computing (HPC) optimiert.

A4X-Maschinenserie

A4X ist die erste Compute Engine-VM mit Arm-basierten CPUs und angehängten GPUs. A4X bietet Maschinentypen mit bis zu 140 vCPUs und 884 GB Arbeitsspeicher. A4X verwendet NVIDIA GB200-GPUs, die 186 GB Arbeitsspeicher pro GPU bieten. A4X hat zwei Sockel mit NVIDIA Grace Arm-CPUs, die über eine schnelle Chip-to-Chip-Kommunikation (NVLink C2C) mit vier B200-GPUs verbunden sind. A4X ist für den Maschinentyp a4x-highgpu-4g verfügbar.

Speicheroptionen für A4X-Instanzen

A4X kann mit angehängtem Google Cloud Hyperdisk-Speicher verwendet werden und bietet 12.000 GiB lokale SSD. Compute Engine hängt die lokalen SSD-Laufwerke automatisch an Ihre A4X-Instanzen an, wenn Sie die Instanz erstellen.

Betriebssystem-Images

A4X-Instanzen unterstützen öffentliche Arm-basierte Betriebssystem-Images. Sie können auch benutzerdefinierte Images mit einem öffentlichen Arm-basierten Betriebssystem-Image erstellen.

N4A-Maschinenserie

N4A (Vorschau) ist die neueste Google Axion-basierte VM, die auf der Neoverse N3-CPU basiert. N4A bietet Maschinentypen mit bis zu 64 vCPUs und 512 GB DDR5-Arbeitsspeicher sowie Unterstützung für die Titanium-IPU (Infrastructure Processing Unit). N4A verwendet die nächste Generation des dynamischen Ressourcenmanagements und ist in den Maschinentypen standard, highmem und highcpu verfügbar. Sie können Ihren Maschinentyp anpassen und zusätzlichen Arbeitsspeicher hinzufügen.

N4A unterstützt Standardnetzwerke mit bis zu 50 Gbit/s mit der gVNIC-Netzwerkschnittstelle. N4A unterstützt auch die NVMe-Laufwerksschnittstelle mit Hyperdisk Balanced-, Hyperdisk Balanced High Availability- und Hyperdisk Throughput-Speicher.

C4A-Maschinenserie

C4A ist die erste Arm-basierte VM, die auf der Axion-CPU von Google basiert, die auf Arm64 basiert. C4A bietet Maschinentypen mit bis zu 72 vCPUs und 576 GB DDR5-Arbeitsspeicher. C4A ist für die Maschinentypen standard, highmem und highcpu verfügbar.

C4A basiert auf Titanium, das Netzwerk-Offloads verwendet und mit der gVNIC-Netzwerkschnittstelle eine Tier_1-Netzwerkleistung pro VM von bis zu 100 Gbit/s ermöglicht. C4A unterstützt auch die NVMe-Laufwerksschnittstelle mit Hyperdisk Balanced- und Hyperdisk Extreme-Laufwerken.

Gleichzeitiges Multithreading

In der C4A-Maschinenserie wird jede vCPU von einem einzelnen Kern ohne gleichzeitiges Multithreading (SMT) unterstützt. Somit bieten C4A-VMs eine höhere Leistung pro vCPU als VMs mit aktiviertem SMT. SMT bietet zwar bestimmte Arbeitslasten, aber Kerne mit einem Thread sind ideal für rechenintensive Arbeitslasten, da Prozesse auf den gesamten Kern zugreifen können, anstatt sie für andere Prozesse freizugeben.

Betriebssystem-Images

C4A- und N4A-VMs unterstützen öffentliche Arm-basierte Betriebssystem-Images. Sie können auch benutzerdefinierte Images mit einem öffentlich verfügbaren Arm-basierten Image erstellen.

Tau-T2A-Maschinenserie

Die Maschinenserie Tau T2A Arm wird auf dem Ampere Altra Arm-Prozessor mit 64 Kernen und einer All-Core-Frequenz von 3,0 GHz ausgeführt. Tau T2A ermöglicht die Ausführung von Arbeitslasten, die am besten oder ausschließlich in Arm ausgeführt werden.

Die Tau-T2A-Maschinenserie hat vordefinierte Maschinentypen mit bis zu 48 physischen Kernen und 4 GB Arbeitsspeicher pro vCPU. Tau-T2A-Maschinentypen werden in einem einzelnen NUMA-Knoten ausgeführt.

Tau T2A-Maschinentypen unterstützen nur die NVMe-Schnittstelle für Speicher und Google Virtual NIC (gVNIC) für das Netzwerk. Virtio-Net- und SCSI-Schnittstellen werden nicht unterstützt. Alle öffentlich verfügbaren ARM-Betriebssystem-Images sind für die Verwendung der NVMe- und gVNIC-Schnittstellen konfiguriert. gVNIC ist eine Netzwerkschnittstelle, die speziell für Compute Engine entwickelt wurde. Sie bietet eine bessere Leistung und unterstützt höhere Netzwerkbandbreiten und einen höheren Durchsatz.

In dieser Maschinenserie wird jede vCPU von einem einzelnen Kern ohne gleichzeitiges Multithreading (SMT) unterstützt.

Empfehlungen für Arbeitslasten

Die C4A-Maschinenserie ist eine ausgezeichnete Wahl für eine Vielzahl von horizontal skalierbaren und rechenintensiven Arbeitslasten, insbesondere wenn das Preis-Leistungs-Verhältnis ein wichtiger Faktor ist. C4A ist eine gute Option, wenn Sie Arbeitslasten wie die folgenden bereitstellen:

  • ML-Datenverarbeitung
  • ML-Inferenz und Modellbereitstellung
  • App-Bereitstellung, Web-Serving und Spielebereitstellung
  • Entwicklung eingebetteter Systeme
  • Entwicklung auf CI/CD in Arm
  • Videocodierung, Transcodierung und Verarbeitung
  • Digitale Werbeplattformen und -bereitstellung
  • Cacheserver
  • Computergestützte Arzneimittelforschung
  • Android-Entwicklung
  • Autonome oder konventionelle Entwicklung von Automobilsoftware

Nächste Schritte