Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Übersicht zum Erstellen einer Instanz mit angehängten GPUs

Linux Windows

Dieses Dokument bietet eine Übersicht über die Schritte, die zum Erstellen einer Compute Engine-Instanz mit angehängten Grafikprozessoren (Graphics Processing Units, GPUs) erforderlich sind. Sie können GPUs verwenden, um bestimmte Arbeitslasten wie maschinelles Lernen und Datenverarbeitung zu beschleunigen.

Sie können auch einige GPU-Maschinentypen auf AI Hypercomputer verwenden. AI Hypercomputer ist ein Supercomputing-System, das Ihre Arbeitslasten im Bereich künstliche Intelligenz (KI) und maschinelles Lernen (ML) unterstützt. Diese Option wird empfohlen, um eine eng zugewiesene, leistungsoptimierte Infrastruktur mit Integrationen für Google Kubernetes Engine- (GKE) und Slurm-Scheduler zu erstellen.

Weitere Informationen zu GPUs in Compute Engine finden Sie unter GPUs.

GPU-Modell auswählen

Eine Liste der verfügbaren GPU-Modelle finden Sie unter GPU-Plattformen. Notieren Sie sich den Maschinentyp, der für das ausgewählte GPU-Modell unterstützt wird.

Für jedes Modell kann es auch hilfreich sein, Folgendes zu prüfen:

Unterstützte Regionen und Zonen.
GPU-Preise, um zu erfahren, mit welchen Kosten die Nutzung der einzelnen GPU-Modelle in Ihren Instanzen verbunden ist. Weitere Informationen zu Instanzen, die beschleunigungsoptimierte Maschinen verwenden, finden Sie unter Preise für VM-Instanzen.

Beschränkungen

Zusätzlich zu den Einschränkungen für alle Instanzen mit GPUs gelten für jede Maschinenserie mit angehängten GPUs die folgenden Einschränkungen:

A4X Max-Instanzen

Sie können nur Kapazität anfordern, für die die unterstützten Verbrauchsoptionen verwendet werden.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die diesen Maschinentyp verwenden.
Sie können Instanzen nur in bestimmten Regionen und Zonen erstellen.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
Dieser Maschinentyp ist nur auf der NVIDIA Grace-Plattform verfügbar.
Änderungen des Maschinentyps werden für A4X Max nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf diesem Maschinentyp ausführen. Eine Liste der unterstützten Linux-Betriebssysteme finden Sie unter Unterstützte Betriebssysteme für GPU-Instanzen.
A4X Max-Instanzen unterstützen Folgendes nicht:
Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an A4X Max-Maschinentypen anhängen.

A4X-Instanzen

Sie können nur Kapazität anfordern, für die die unterstützten Verbrauchsoptionen verwendet werden.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die diesen Maschinentyp verwenden.
Sie können Instanzen nur in bestimmten Regionen und Zonen erstellen.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
Dieser Maschinentyp ist nur auf der NVIDIA Grace-Plattform verfügbar.
Änderungen des Maschinentyps werden für A4X nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf diesem Maschinentyp ausführen. Eine Liste der unterstützten Linux-Betriebssysteme finden Sie unter Unterstützte Betriebssysteme für GPU-Instanzen.
Wenn Sie bei A4X-Instanzen ethtool -S verwenden, um das GPU-Netzwerk zu überwachen, werden die Zähler für physische Ports, die mit _phy enden, nicht aktualisiert. Dies ist das erwartete Verhalten für Instanzen, die die MRDMA-Architektur für virtuelle Funktionen (VF) verwenden. Weitere Informationen finden Sie unter MRDMA-Funktionen und Tools zur Netzwerküberwachung.
A4X-Instanzen unterstützen Folgendes nicht:
Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an A4X-Maschinentypen anhängen.

A4-Instanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A4-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A4-Maschinentyp verwenden.
Sie können einen A4-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
Der A4-Maschinentyp ist nur auf der Emerald Rapids-CPU-Plattform verfügbar.
Sie können den Maschinentyp einer Instanz nicht in einen A4-Maschinentyp ändern oder umgekehrt. Sie müssen eine neue Instanz mit diesem Maschinentyp erstellen.
A4-Maschinentypen unterstützen keine einzelnen Mandanten.
Sie können Windows-Betriebssysteme nicht auf einem A4-Maschinentyp ausführen.
Bei A4-Instanzen werden die Zähler für physische Ports, die mit _phy enden, nicht aktualisiert, wenn Sie ethtool -S verwenden, um das GPU-Netzwerk zu überwachen. Dies ist das erwartete Verhalten für Instanzen, die die MRDMA-Architektur für virtuelle Funktionen (VF) verwenden. Weitere Informationen finden Sie unter MRDMA-Funktionen und Tools zur Netzwerküberwachung.
Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an A4-Maschinentypen anhängen.

A3 Ultra-Instanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A3-Ultra-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-Ultra-Maschinentyp verwenden.
Sie können einen A3-Ultra-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
Der A3-Ultra-Maschinentyp ist nur auf der Emerald Rapids-CPU-Plattform verfügbar.
Änderungen des Maschinentyps werden für den A3-Ultra-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf einem A3-Ultra-Maschinentyp ausführen.
A3-Ultra-Maschinentypen unterstützen keine einzelnen Mandanten.
Bei A3 Ultra-Instanzen werden die Zähler für physische Ports, die mit _phy enden, nicht aktualisiert, wenn Sie ethtool -S verwenden, um das GPU-Netzwerk zu überwachen. Dies ist das erwartete Verhalten für Instanzen, die die MRDMA-Architektur für virtuelle Funktionen (VF) verwenden. Weitere Informationen finden Sie unter MRDMA-Funktionen und Tools zur Netzwerküberwachung.

A3 Mega-Instanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A3-Mega-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-Mega-Maschinentyp verwenden.
Sie können einen A3-Mega-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen regionalen nichtflüchtigen Speicher auf einer Instanz verwenden, die einen A3-Mega-Maschinentyp verwendet.
Der Maschinentyp „A3 Mega“ ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
Änderungen des Maschinentyps werden für den A3 Mega-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf einem A3 Mega-Maschinentyp ausführen.

A3 High-Instanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A3-High-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-High-Maschinentyp verwenden.
Sie können einen A3 High-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen regionalen nichtflüchtigen Speicher auf einer Instanz verwenden, die einen A3-High-Maschinentyp verwendet.
Der Maschinentyp „A3 High“ ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
Änderungen des Maschinentyps werden für den A3-High-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf einem A3-High-Maschinentyp ausführen.
Für die Maschinentypen a3-highgpu-1g, a3-highgpu-2g und a3-highgpu-4g müssen Sie Instanzen mit Spot-VMs oder Flex-Start-VMs erstellen. Eine ausführliche Anleitung zu diesen Optionen finden Sie hier:
- Wenn Sie Spot-VMs erstellen möchten, legen Sie das Bereitstellungsmodell auf SPOT fest, wenn Sie eine beschleunigungsoptimierte VM erstellen.
- Sie haben folgende Möglichkeiten, Flex-Start-VMs zu erstellen:
  - Erstellen Sie eine eigenständige VM und legen Sie das Bereitstellungsmodell auf FLEX_START fest, wenn Sie eine beschleunigungsoptimierte VM erstellen.
  - Erstellen Sie eine Anfrage zur Größenanpassung in einer verwalteten Instanzgruppe (MIG). Eine Anleitung finden Sie unter MIG mit GPU-VMs erstellen.
Sie können eine Confidential VM mit einem a3-highgpu-1g-Maschinentyp nur in begrenzten Regionen und Zonen verwenden. Außerdem gelten alle Einschränkungen für Confidential VMs, die auf dem A3 High-Maschinentyp ausgeführt werden.

A3-Edge-Instanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A3-Edge-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-Edge-Maschinentyp verwenden.
Sie können einen A3-Edge-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen regionalen nichtflüchtigen Speicher auf einer Instanz verwenden, die einen A3-Edge-Maschinentyp verwendet.
Der A3-Edge-Maschinentyp ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
Änderungen des Maschinentyps werden für den A3-Edge-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
Sie können Windows-Betriebssysteme nicht auf einem A3-Edge-Maschinentyp ausführen.
A3-Edge-Maschinentypen unterstützen einzelne Mandanten nicht.

A2-Standardinstanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A2-Standardmaschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A2-Standardmaschinentyp verwenden.
Sie können einen A2-Standard-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Die A2-Standardmaschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
Wenn Ihre Instanz einen A2-Standardmaschinentyp verwendet, können Sie nur von einem A2-Standardmaschinentyp zu einem anderen A2-Standardmaschinentyp wechseln. Sie können keinen anderen Maschinentyp ändern. Weitere Informationen finden Sie unter Beschleunigeroptimierte Instanzen ändern.
Sie können das Windows-Betriebssystem nicht mit dem Maschinentyp a2-megagpu-16g verwenden. Wählen Sie einen anderen A2-Standard-Maschinentyp aus, wenn Sie ein Windows-Betriebssystem verwenden.
Sie können die schnelle Formatierung der angehängten lokalen SSDs nicht auf Windows-Instanzen verwenden, die A2-Standard-Maschinentypen verwenden. Um diese lokalen SSDs zu formatieren, müssen Sie eine vollständige Formatierung mit dem diskpart-Dienstprogramm durchführen und format fs=ntfs label=tmpfs angeben.

A2-Ultra-Instanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen A2-Ultra-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A2-Ultra-Maschinentyp verwenden.
Sie können einen A2-Ultra-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Die A2-Ultra-Maschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
Wenn Ihre Instanz einen A2-Ultra-Maschinentyp verwendet, können Sie den Maschinentyp nicht ändern. Wenn Sie einen anderen A2-Ultra-Maschinentyp oder einen anderen Maschinentyp verwenden müssen, müssen Sie eine neue Instanz erstellen.
Sie können keinen anderen Maschinentyp in einen A2-Ultra-Maschinentyp ändern. Wenn Sie eine Instanz benötigen, die einen A2-Ultra-Maschinentyp verwendet, müssen Sie eine neue Instanz erstellen.
Sie können die schnelle Formatierung der angehängten lokalen SSDs nicht auf Windows-Instanzen verwenden, die A2-Ultra-Maschinentypen verwenden. Um diese lokalen SSDs zu formatieren, müssen Sie eine vollständige Formatierung mit dem diskpart-Dienstprogramm durchführen und format fs=ntfs label=tmpfs angeben.

G4-Instanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen G4-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen G4-Maschinentyp verwenden.
Sie können einen G4-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) auf einer Instanz verwenden, die einen G4-Maschinentyp verwendet.
Der G4-Maschinentyp ist nur auf der AMD EPYC Turin-Plattform der 5. Generation verfügbar.
Sie können eine Confidential VM nur mit dem Maschinentyp g4-standard-48 (Vorschau) in begrenzten Regionen und Zonen verwenden. Es gelten alle Einschränkungen für Confidential VMs, die auf dem G4-Maschinentyp ausgeführt werden.
Sie können keine G4-Instanzen auf Knoten für einzelne Mandanten erstellen.
Sie können Windows-Betriebssysteme nicht auf g4-standard-384-Instanzen verwenden.
Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an G4-Maschinentypen anhängen.
Verwenden Sie beim Erstellen von G4-Instanzen, an die weniger als eine GPU angehängt ist (bruchteilige GPUs), nicht die Flags --no-service-account oder --no-scopes. Damit NVIDIA-vGPU-Treiber authentifiziert werden können, muss Compute Engine die Identität der VM bestätigen. Für diesen Vorgang müssen Dienstkonten aktiviert sein.

G2-Instanzen

Sie können Kapazität nur mit den unterstützten Verbrauchsoptionen für einen G2-Maschinentyp anfordern.
Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen G2-Maschinentyp verwenden.
Sie können einen G2-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
Die G2-Maschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
Nichtflüchtige Standardspeicher (pd-standard) werden auf Instanzen, die den G2-Maschinentyp verwenden, nicht unterstützt. Informationen zu unterstützten Laufwerkstypen finden Sie unter Unterstützte Laufwerkstypen für G2.
Sie können keine GPUs mit mehreren Instanzen auf einer Instanz erstellen, die einen G2-Maschinentyp verwendet.
Wenn Sie den Maschinentyp einer G2-Instanz ändern müssen, lesen Sie die Informationen unter Beschleunigeroptimierte Instanzen ändern.
Sie können keine Deep Learning VM Images als Bootlaufwerke für Instanzen verwenden, die den G2-Maschinentyp verwenden.
Der aktuelle Standardtreiber für Container-Optimized OS unterstützt keine L4-GPUs, die auf G2-Maschinentypen ausgeführt werden. Außerdem unterstützt Container-Optimized OS nur bestimmte Treiber. Wenn Sie Container-Optimized OS auf G2-Maschinentypen verwenden möchten, lesen Sie die folgenden Hinweise:
- Verwenden Sie eine Container-Optimized OS-Version, die die mindestens empfohlene NVIDIA-Treiberversion 525.60.13 oder höher unterstützt. Weitere Informationen finden Sie in den Versionshinweisen zu Container-Optimized OS.
- Geben Sie bei der Installation des Treibers die neueste verfügbare Version an, die für die L4-GPUs funktioniert. Beispiel: sudo cos-extensions install gpu -- -version=525.60.13.
In den folgenden Szenarien müssen Sie über die Google Cloud CLI oder REST G2-Instanzen erstellen:
- Sie möchten benutzerdefinierte Speicherwerte angeben.
- Sie möchten die Anzahl der sichtbaren CPU-Kerne anpassen.

N1+GPU-Instanzen

Informationen zu den Einschränkungen für N1-Instanzen mit GPUs finden Sie unter Funktionen für die N1-Maschinenserie und GPUs für die N1-Maschinenserie.

Betriebssystem auswählen

Wenn Sie GPUs für maschinelles Lernen verwenden, nutzen Sie eines der folgenden Betriebssysteme:

Für KI-Arbeitslasten optimierte Images: Sie können Ubuntu- und Rocky-Images verwenden, die in accelerator-optimierten Versionen mit vorinstallierten NVIDIA-Treibern und CUDA-Toolkit verfügbar sind. Weitere Informationen finden Sie unter Betriebssystem-Images in der AI Hypercomputer-Dokumentation.
Deep-Learning-VM-Images. Jede Deep Learning VM hat ein GPU-Treiberinstallationstool und enthält Pakete wie TensorFlow und PyTorch. Sie können eine Deep Learning VM auch für allgemeine GPU-Arbeitslasten verwenden. Weitere Informationen zu den verfügbaren Images und den in diesen Images installierten Paketen finden Sie in der Deep Learning VM-Dokumentation unter Image auswählen.

Achtung: Sie können Deep Learning VM Images nicht auf Bootlaufwerken für Ihre VMs verwenden, die G2-Maschinentypen verwenden. G2-Maschinentypen sind beschleunigungsoptimierte Maschinenserien, an die NVIDIA L4-GPUs angehängt sind.

Alternativ können Sie ein öffentliches oder benutzerdefiniertes Image verwenden. Bei den meisten öffentlichen Images oder benutzerdefinierten Images müssen Sie NVIDIA-Treiber und das CUDA-Toolkit installieren. Informationen dazu, welche Treiber für Ihr GPU-Modell geeignet sind, finden Sie unter GPU-Treiber installieren.

GPU-Kontingent prüfen

Zum Schutz der Systeme und Nutzer von Compute Engine haben neue Projekte ein globales GPU-Kontingent, das die Gesamtzahl der GPUs begrenzt, die Sie in einer unterstützten Zone erstellen können. Informationen zum GPU-Kontingent finden Sie unter GPU-Kontingent.

Fordern Sie eine Kontingentaufstockung an, falls Sie Ihr GPU-Kontingent erhöhen müssen. Wenn Sie ein GPU-Kontingent anfordern, müssen Sie ein Kontingent für die GPU-Typen, die Sie in den einzelnen Regionen erstellen möchten, sowie ein zusätzliches globales Kontingent für die Gesamtzahl der GPUs aller Typen in allen Zonen anfordern.

Wenn Ihr Projekt einen bestehenden Abrechnungsverlauf hat, wird es nach Ihrer Anfrage automatisch Kontingente erhalten.

GPU-Instanzen und Zuweisungskontingente auf Abruf

Für Instanzen, die das Standardbereitstellungsmodell verwenden, können in der Regel keine Kontingente für die Zuweisung auf Abruf verwendet werden. Kontingente auf Abruf sind für temporäre Arbeitslasten vorgesehen und in der Regel besser verfügbar. Wenn Ihr Projekt kein Kontingent auf Abruf hat und Sie es noch nie angefordert haben, verbrauchen alle Instanzen in Ihrem Projekt Standardkontingente.

Wenn Sie ein Kontingent für die Zuweisung auf Abruf anfordern, müssen Instanzen, die das Standardbereitstellungsmodell verwenden, alle folgenden Kriterien erfüllen, um das Kontingent für die Zuweisung auf Abruf zu nutzen:

Den Instanzen sind GPUs zugeordnet.
Die Instanzen sind so konfiguriert, dass sie nach einer vordefinierten Laufzeit über das Feld maxRunDuration oder terminationTime automatisch gelöscht werden. Weitere Informationen finden Sie hier:
- Laufzeit einer Instanz begrenzen
- Laufzeit von Instanzen in einer MIG begrenzen
Die Instanz darf keine Reservierungen nutzen. Weitere Informationen finden Sie unter Verhindern, dass Compute-Instanzen Reservierungen nutzen.

Wenn Sie ein Zuteilungskontingent auf Abruf für zeitgebundene GPU-Arbeitslasten verwenden, profitieren Sie sowohl von der unterbrechungsfreien Laufzeit als auch von der hohen Verfügbarkeit des Zuteilungskontingents auf Abruf. Weitere Informationen finden Sie unter Kontingente auf Abruf.

Instanz mit angehängten GPUs erstellen

So erstellen Sie eine Instanz mit angehängten GPUs:

Erstellen Sie die Instanz. Die zum Erstellen einer Instanz verwendete Methode hängt von der Arbeitslast ab, die Sie ausführen möchten.

GPUMaschinentypen
KI- und ML-Arbeitslasten	Grafiken und Visualisierung	Andere GPU-Arbeitslasten
Beschleunigeroptimierte Maschinentypen der A-Serie sind für Arbeitslasten aus den Bereichen Hochleistungs-Computing (HPC), künstliche Intelligenz (KI) und maschinelles Lernen (ML) konzipiert. Bei diesen Maschinentypen wird das GPU-Modell automatisch an die Instanz angehängt.	Beschleunigungsoptimierte Maschinentypen der G-Serie sind für Arbeitslasten wie NVIDIA Omniverse-Simulationsarbeitslasten, grafikintensive Anwendungen, Videotranscodierung und virtuelle Desktops konzipiert. Diese Maschinentypen unterstützen NVIDIA RTX Virtual Workstations (vWS). Die G-Serie kann auch zum Trainieren kleinerer Modelle und für die Inferenz auf einem einzelnen Host verwendet werden. Bei diesen Maschinentypen wird das GPU-Modell automatisch an die Instanz angehängt. Um die Kosten für Arbeitslasten zu optimieren, für die keine vollständige GPU erforderlich ist, sind G4-Maschinentypen verfügbar, an die weniger als eine GPU angehängt ist. Diese Maschinentypen werden mit 1/2, 1/4 oder 1/8 einer Standard-GPU geliefert.	An N1-Maschinentypen für allgemeine Zwecke, mit Ausnahme des N1-Maschinentyps mit gemeinsam genutztem Kern (`f1-micro` und `g1-small`), können Sie eine ausgewählte Gruppe von GPU-Modellen anhängen. Einige dieser GPU-Modelle unterstützen auch NVIDIA RTX Virtual Workstations (vWS).
Wählen Sie für KI-, ML- und HPC-Arbeitslasten eine der folgenden Optionen aus: Informationen zum Erstellen von A4X Max- (GB300), A4X- (GB200), A4- (B200) oder A3 Ultra-Instanzen (H200) finden Sie in der AI Hypercomputer-Dokumentation unter Bereitstellungsoptionen – Übersicht. Informationen zum Erstellen von A3-Instanzen (H100) mit 8 angehängten GPUs finden Sie unter A3-Mega-, A3-High- oder A3-Edge-Instanz mit aktiviertem GPUDirect erstellen. Informationen zum Erstellen von A3-Instanzen (mit weniger als 8 angehängten GPUs) oder A2-Instanzen (A100) finden Sie unter A3-High- oder A2-Instanz erstellen.	Informationen zum Erstellen einer G2- (L4) oder G4-Instanz (RTX PRO 6000) finden Sie unter G2- oder G4-Instanz erstellen.	Informationen zum Erstellen einer N1-Instanz mit angehängten NVIDIA T4-, P4-, P100- oder V100-GPUs finden Sie unter N1-Instanz mit angehängten GPUs erstellen.

GPUMaschinentypen

KI- und ML-Arbeitslasten Grafiken und Visualisierung Andere GPU-Arbeitslasten

Beschleunigeroptimierte Maschinentypen der A-Serie sind für Arbeitslasten aus den Bereichen Hochleistungs-Computing (HPC), künstliche Intelligenz (KI) und maschinelles Lernen (ML) konzipiert.

Bei diesen Maschinentypen wird das GPU-Modell automatisch an die Instanz angehängt.

Beschleunigungsoptimierte Maschinentypen der G-Serie sind für Arbeitslasten wie NVIDIA Omniverse-Simulationsarbeitslasten, grafikintensive Anwendungen, Videotranscodierung und virtuelle Desktops konzipiert. Diese Maschinentypen unterstützen NVIDIA RTX Virtual Workstations (vWS).

Die G-Serie kann auch zum Trainieren kleinerer Modelle und für die Inferenz auf einem einzelnen Host verwendet werden.

Bei diesen Maschinentypen wird das GPU-Modell automatisch an die Instanz angehängt.

Um die Kosten für Arbeitslasten zu optimieren, für die keine vollständige GPU erforderlich ist, sind G4-Maschinentypen verfügbar, an die weniger als eine GPU angehängt ist. Diese Maschinentypen werden mit 1/2, 1/4 oder 1/8 einer Standard-GPU geliefert.

An N1-Maschinentypen für allgemeine Zwecke, mit Ausnahme des N1-Maschinentyps mit gemeinsam genutztem Kern (f1-micro und g1-small), können Sie eine ausgewählte Gruppe von GPU-Modellen anhängen. Einige dieser GPU-Modelle unterstützen auch NVIDIA RTX Virtual Workstations (vWS).

Wählen Sie für KI-, ML- und HPC-Arbeitslasten eine der folgenden Optionen aus:

Informationen zum Erstellen von A4X Max- (GB300), A4X- (GB200), A4- (B200) oder A3 Ultra-Instanzen (H200) finden Sie in der AI Hypercomputer-Dokumentation unter Bereitstellungsoptionen – Übersicht.
Informationen zum Erstellen von A3-Instanzen (H100) mit 8 angehängten GPUs finden Sie unter A3-Mega-, A3-High- oder A3-Edge-Instanz mit aktiviertem GPUDirect erstellen.
Informationen zum Erstellen von A3-Instanzen (mit weniger als 8 angehängten GPUs) oder A2-Instanzen (A100) finden Sie unter A3-High- oder A2-Instanz erstellen.

Informationen zum Erstellen einer G2- (L4) oder G4-Instanz (RTX PRO 6000) finden Sie unter G2- oder G4-Instanz erstellen.

Informationen zum Erstellen einer N1-Instanz mit angehängten NVIDIA T4-, P4-, P100- oder V100-GPUs finden Sie unter N1-Instanz mit angehängten GPUs erstellen.

Damit die Instanz die GPU verwenden kann, müssen Sie den GPU-Treiber auf Ihrer Instanz installieren. Wenn Sie eine virtuelle NVIDIA RTX-Workstation (früher NVIDIA GRID) aktiviert haben, installieren Sie einen Treiber für eine virtuelle Workstation.

Nächste Schritte

Weitere Informationen zu GPU-Plattformen
Weitere Informationen zu den Funktionen und Einschränkungen der Verwendung von GPUs

So erfahren Sie, wie Sie die tatsächliche und prognostizierte Nutzung Ihrer GPUs aufrufen können.

Übersicht zum Erstellen einer Instanz mit angehängten GPUs Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

GPU-Modell auswählen

Beschränkungen

A4X Max-Instanzen

A4X-Instanzen

A4-Instanzen

A3 Ultra-Instanzen

A3 Mega-Instanzen

A3 High-Instanzen

A3-Edge-Instanzen

A2-Standardinstanzen

A2-Ultra-Instanzen

G4-Instanzen

G2-Instanzen

N1+GPU-Instanzen

Betriebssystem auswählen

GPU-Kontingent prüfen

GPU-Instanzen und Zuweisungskontingente auf Abruf

Instanz mit angehängten GPUs erstellen

Nächste Schritte

Übersicht zum Erstellen einer Instanz mit angehängten GPUs