Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Reservierungstyp auswählen

In diesem Dokument werden die verschiedenen Reservierungstypen beschrieben, mit denen Sie Kapazität für Compute Engine-Instanzen reservieren können. Weitere Informationen zu den Ressourcen, die Sie zum Erstellen von Instanzen verwenden, finden Sie unter Compute Engine-Instanzen.

Mit Reservierungen sorgen Sie dafür, dass die Ressourcen verfügbar sind, die Sie zum Erstellen von Instanzen mit derselben Hardware (Arbeitsspeicher und vCPUs) und optionalen Ressourcen (GPUs, H4D-HPC-Clustern, TPUs oder lokalen SSD-Laufwerken) benötigen. Reservierungen bieten folgende Vorteile:

Hohe Kapazitätsgarantie: Sie reservieren Ressourcen, um zukünftige Anstieg des Bedarfs zu decken, z. B.:
- Wachstum
- Geplante oder ungeplante Nutzungsspitzen
- Große Migrationen
- Sicherung und Notfallwiederherstellung
Exklusiver Zugriff: Reservierungen verhindern, dass andere Ihre reservierten Ressourcen verwenden.
Übernommene Attribute: Reservierungen übernehmen dieselben Attribute wie die ausgewählte Maschinenfamilie.

Nachdem Sie Kapazität reserviert haben, können Sie sie verwenden, um Instanzen zu erstellen, die der Reservierung entsprechen. Für die Erstellung dieser Instanzen fallen keine zusätzlichen Gebühren an. Sie bezahlen nur für Ressourcen, die nicht Teil der Reservierung sind, z. B. Festplatten oder IP-Adressen.

Beschränkungen

Für alle Reservierungstypen gelten die folgenden Einschränkungen:

Reservierungen sind zonenspezifische Ressourcen.
Sie können Ihre reservierte Kapazität nicht verwenden, um die folgenden Compute Engine-Ressourcen zu erstellen:
- Maschinentypen f1-micro und g1-small
- Flex-Start-VMs
- Knoten für einzelne Mandanten
- Spot-VMs oder vorzeitig beendbare Instanzen

Reservierungstyp auswählen

Das folgende Diagramm hilft Ihnen bei der Auswahl des Compute Engine-Reservierungstyps, der am besten zu den Anforderungen Ihrer Arbeitslast passt:

Ein Flussdiagramm mit den verschiedenen Reservierungsmethoden, die in Compute Engine verfügbar sind.

Die Fragen im obigen Diagramm lauten:

Benötigen Sie die Kapazität sofort?
- Ja: Fahren Sie mit der nächsten Frage fort.
- Nein: Fahren Sie mit Frage 3 fort.
Benötigen Sie Flexibilität bei der Dauer der Kapazitätsreservierung?
- Ja: Weitere Informationen finden Sie unter On-demand-Reservierungen verwenden.
- Nein: Fahren Sie mit der nächsten Frage fort.
Benötigen Sie stark nachgefragte Ressourcen wie GPUs?
- Ja: Fahren Sie mit der nächsten Frage fort.
- Nein: Weitere Informationen finden Sie unter Vorausschauende Reservierungen verwenden.
Benötigen Sie Ressourcen für mehr als 90 Tage?
- Ja: Weitere Informationen finden Sie unter Vorausschauende Reservierungen in AI Hypercomputer verwenden. Informationen zu H4D finden Sie unter Kapazität über Ihr Kontoteam reservieren.
- Nein: Weitere Informationen finden Sie unter Vorausschauende Reservierungen im Kalendermodus verwenden.

On‑Demand-Reservierungen verwenden

Mit On-Demand-Reservierungen können Sie Kapazität für Compute-Instanzen reservieren und sie sofort nach der Reservierung nutzen. Nachdem Sie eine On-Demand-Reservierung erstellt haben, können Sie sie jederzeit nutzen, ändern oder löschen.

Weitere Informationen finden Sie unter Reservierungen.

Vorausschauende Reservierungen verwenden

Mit vorausschauenden Reservierungen können Sie Instanzen für einen bestimmten Zeitraum reservieren. Nachdem Sie eine Reservierungsanfrage erstellt haben, müssen Sie sie zur Überprüfung an Google Cloud senden.Google Cloud benötigt in der Regel fünf Tage, um Ihre Anfrage zu prüfen. Wenn Ihre Anfrage genehmigt wird, erstellt Compute Engine On-Demand-Reservierungen mit der von Ihnen angeforderten Kapazität für das von Ihnen ausgewählte Datum und die von Ihnen ausgewählte Uhrzeit. Um diese Reservierungen zu nutzen, erstellen Sie Compute-Instanzen, die die Reservierungen verwenden. Nach Ablauf des Reservierungszeitraums können Sie die Reservierungen ändern oder löschen.

Weitere Informationen zu Anfragen für vorausschauende Reservierungen

Vorausschauende Reservierungen im Kalendermodus verwenden

Wenn Sie GPU-Instanzen, H4D-Instanzen oder TPUs für bis zu 90 Tage reservieren möchten, können Sie vorausschauende Reservierungen im Kalendermodus verwenden. Wenn Sie diese Art von Reservierung erstellen möchten, müssen Sie zuerst prüfen, wann die von Ihnen ausgewählte Anzahl und der Typ von Ressourcen in einer Region verfügbar sind. Erstellen und senden Sie dann eine Reservierungsanfrage mit den Attributen, die Sie als verfügbar bestätigt haben. Wenn Sie die Anfrage erfolgreich erstellen können, genehmigtGoogle Cloud sie innerhalb einer Minute. Nachdem die Anfrage genehmigt wurde, führt Compute Engine die folgenden Schritte aus:

Compute Engine erstellt eine On-Demand-Reservierung.
Compute Engine reserviert die angeforderten Ressourcen so nah wie möglich beieinander, um die Netzwerklatenz zu minimieren.

Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie GPU-, H4D- oder TPU-Instanzen erstellen. Am Ende des Reservierungszeitraums löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen, basierend auf der Beendigungsaktion, die Sie für die Instanzen angegeben haben.

Weitere Informationen finden Sie unter Anfragen für vorausschauende Reservierungen im Kalendermodus.

Vorausschauende Reservierungen mit AI Hypercomputer- oder H4D-HPC-Clustern verwenden

Wenden Sie sich an Ihr Account-Management-Team und fordern Sie an, GPU-Instanzen für KI- und ML-Arbeitslasten (künstliche Intelligenz und maschinelles Lernen) im großen Maßstab oder zum Erstellen eines Clusters von H4D-HPC-Instanzen mit erweiterten Clusterverwaltungsfunktionen zu reservieren. Nachdem Google einen Reservierungsanfrageentwurf für Sie erstellt hat, reichen Sie ihn zur Überprüfung ein, wenn alles korrekt aussieht. Google Cloud genehmigt die Anfrage sofort und Compute Engine führt dann die folgenden Schritte aus:

Compute Engine erstellt On-Demand-Reservierungen.
Compute Engine reserviert die angeforderten Ressourcen so nah wie möglich beieinander, um die Netzwerklatenz zu minimieren.
Compute Engine reserviert Ressourcen mit Topology Aware Scheduling sowie verbessertem Monitoring und verbesserter Wartung.

Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie GPU- oder H4D-Instanzen erstellen. Am Ende des Reservierungszeitraums löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen, basierend auf der Beendigungsaktion, die Sie für die Instanzen angegeben haben.

Weitere Informationen finden Sie unter:

Für GPU-Instanzen:
- Kapazität über Ihr Accountteam reservieren in der AI Hypercomputer-Dokumentation.
- Kapazität über Ihr Accountteam reservieren in der Cluster Director-Dokumentation.
Für H4D-Instanzen:
- Kapazität über Ihr Kontoteam reservieren in der Compute Engine-Dokumentation

Reservierungstyp auswählen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Beschränkungen

Reservierungstyp auswählen

On‑Demand-Reservierungen verwenden

Vorausschauende Reservierungen verwenden

Vorausschauende Reservierungen im Kalendermodus verwenden

Vorausschauende Reservierungen mit AI Hypercomputer- oder H4D-HPC-Clustern verwenden

Reservierungstyp auswählen