Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Eine Option für die Aufnahme auswählen

In diesem Dokument werden die verschiedenen Möglichkeiten zum Abrufen und Verwenden von Rechenressourcen in AI Hypercomputer beschrieben, die als Nutzungsoptionen bezeichnet werden. Wählen Sie die Option aus, die am besten zu Ihrer Arbeitslast, ihrer Dauer und Ihren Kostenanforderungen passt.

Für jede Verbrauchsoption wird Folgendes angegeben:

So greifen Sie auf Kapazität zu, um VMs oder Cluster zu erstellen.
Das zugrunde liegende Bereitstellungsmodell, das die Verfügbarkeit, Lebensdauer und Preise Ihrer VMs bestimmt.

Vergleich der Nutzungsoptionen

In der folgenden Tabelle sind die wichtigsten Unterschiede zwischen den Verbrauchsoptionen zusammengefasst:

Nutzungsoption	Vorausschauende Reservierungen in AI Hypercomputer	Vorausschauende Reservierungen für bis zu 90 Tage (im Kalendermodus)	Flex-Start	Spot
Unterstützte Maschinen	A4X Max, A4X, A4, A3 Ultra, A3 Mega oder A3 High	A4, A3 Ultra, A3 Mega oder A3 High mit 8 GPUs	Beliebige GPU-Maschine außer A4X Max und A4X	Beliebige GPU-Maschine außer A4X Max und A4X
Lebensdauer	Unbegrenzt	Bis zu 90 Tage	bis zu 7 Tage	Unbegrenzt (unterliegt jedoch Unterbrechungen)
Auf Abruf
Kapazitätsgarantie	Sehr hoch: Wenn Google Cloud Ihre Reservierungsanfrage genehmigt, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine die angeforderte Kapazität bereitstellt.	Sehr hoch: Wenn Google Cloud Ihre Reservierungsanfrage genehmigt, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine die angeforderte Kapazität bereitstellt.	Best-Effort: Compute Engine versucht nach Best-Effort-Prinzip, die Bereitstellung der angeforderten Kapazität zu planen.	Best-Effort: Compute Engine versucht nach Best-Effort-Prinzip, die angeforderte Kapazität bereitzustellen.
Kontingent	Google Cloud erhöht das Kontingent automatisch, bevor die Kapazität bereitgestellt wird.	Es wird kein Kontingent verbraucht.	Verbraucht Kontingent auf Abruf.	Verbraucht Kontingent auf Abruf.
Preise	Reduziert (bis zu 53%). Preise für beschleunigungsoptimierte VMs Wenn Sie Ressourcen für ein Jahr oder länger reservieren, müssen Sie eine ressourcenbasierte Zusicherung kaufen und an die reservierten Ressourcen anhängen. Die Abrechnung erfolgt für den Reservierungszeitraum. Weitere Informationen finden Sie unter Reservierungsabrechnung.	Reduziert (bis zu 53%). Preise für den Dynamic Workload Scheduler Die Abrechnung erfolgt für den Reservierungszeitraum. Weitere Informationen finden Sie unter Reservierungsabrechnung.	Reduziert (bis zu 53%). Preise für den Dynamic Workload Scheduler Sie zahlen nach dem Pay-as-you-go-Modell (PAYG).	Stark reduziert (bis zu 91%). Weitere Informationen finden Sie unter Preise für Spot-VMs und Preise für beschleunigungsoptimierte VMs. Sie zahlen nach dem Pay-as-you-go-Modell (PAYG).
Ressourcenzuweisung	Dicht	Dicht	Dicht auf Best-Effort-Basis ( Richtlinien für kompakte Platzierung oder Arbeitslastrichtlinien optional)	Standard (kompakte Richtlinie optional)
Bereitstellungsmodell	Reservierungsgebunden	Reservierungsgebunden	Flex-Start	Spot
Erstellungsmethode	So erstellen Sie VMs: Kapazitäten reservieren, indem Sie sich an Ihr Account-Management-Team wenden Am ausgewählten Datum und zur ausgewählten Uhrzeit können Sie die reservierte Kapazität verwenden, um VMs und Cluster mit einer der unter Bereitstellungsoptionen beschriebenen Methoden zu erstellen.	So erstellen Sie VMs: Vorausschauende Reservierung im Kalendermodus erstellen Am von Ihnen ausgewählten Datum und zur ausgewählten Uhrzeit können Sie die reservierte Kapazität verwenden, um VMs und Cluster mit einer der unter Übersicht über Bereitstellungsoptionen beschriebenen Methoden zu erstellen.	Wenn Sie die Erstellung von Flex-Start-VMs anfordern, plant Compute Engine die VM-Erstellung basierend auf der Verfügbarkeit. Wenn Kapazität verfügbar wird, stellt Compute Engine die Flex-Start-VMs bereit. Verwenden Sie zum Erstellen von VMs mit flexiblem Start eine der unter Übersicht über Bereitstellungsoptionen beschriebenen Methoden.	Sie können VMs sofort mit einer der unter Übersicht über die Bereitstellungsoptionen beschriebenen Methoden erstellen.

Eine Option für die Aufnahme auswählen

Verwenden Sie das folgende Flussdiagramm, um die Nutzungsoption auszuwählen, die am besten zu Ihrer Arbeitslast passt:

Ein Flussdiagramm mit den Nutzungsoptionen für AI Hypercomputer.

Die Fragen im obigen Diagramm lauten:

Benötigen Sie Kapazität für mehr als 90 Tage?
- Ja: Weitere Informationen finden Sie unter Vorausschauende Reservierungen in AI Hypercomputer verwenden.
- Nein: Gehen Sie zu Frage 2.
Möchten Sie reservierte Kapazität?
- Ja: Weitere Informationen finden Sie unter Vorausschauende Reservierungen im Kalendermodus verwenden.
- Nein: Gehen Sie zu Frage 3.
Ist Ihre Arbeitslast fehlertolerant?
- Nein: Weitere Informationen finden Sie unter Flex-Start verwenden.
- Ja: Weitere Informationen finden Sie unter Spot verwenden.

Vorausschauende Reservierungen in AI Hypercomputer verwenden

Wenn Sie lang laufende, große und verteilte Arbeitslasten ausführen möchten, die eng zugewiesene Ressourcen benötigen, können Sie Rechenressourcen für einen bestimmten Zeitpunkt in der Zukunft reservieren. Sie haben für diesen Zeitraum exklusiven Zugriff auf die reservierten Ressourcen und können die Ressourcen zum Erstellen von VMs oder Clustern verwenden. Am Ende des Reservierungszeitraums führt Compute Engine folgende Schritte aus:

Compute Engine löscht die Reservierung.
Je nach der Beendigungsaktion, die Sie für die VMs angeben, werden alle VMs, die die Reservierung verwenden, von Compute Engine beendet oder gelöscht.

Geeignete Arbeitslasten für vorausschauende Reservierungen in AI Hypercomputer

Vorausschauende Reservierungen sind ideal für die folgenden Arbeitslasten:

Foundation Models vortrainieren
Inferenz für Foundation Models mit mehreren Hosts

Wichtige Merkmale von vorausschauenden Reservierungen in AI Hypercomputer

Zukünftige Reservierungen haben folgende Merkmale:

Sie können die Maschinentypen A4X Max, A4X, A4, A3 Ultra, A3 Mega oder A3 High (8 GPUs) reservieren. Die Maschinen sind dicht zugewiesen, um die Netzwerklatenz zu minimieren.
Sie können eine beliebige Anzahl von VMs für einen beliebigen Zeitraum ab einem zukünftigen Datum reservieren. Sie können die reservierten Ressourcen bis zum Ende des Reservierungszeitraums zum Erstellen und Ausführen von VMs verwenden. Wenn Sie Ressourcen für ein Jahr oder länger reservieren, müssen Sie eine ressourcenbasierte Zusicherung kaufen und anhängen.
Nach Beginn des Reservierungszeitraums können Sie die automatisch erstellten Reservierungen so ändern:
- Benachrichtigungen zur Notfallwartung der Hardware aktivieren oder deaktivieren
- Verwendung von Vertex AI-Jobs aktivieren oder deaktivieren
Sie verwenden das reservierungsgebundene Bereitstellungsmodell, das folgende Vorteile bietet:
- Sie haben eine höhere Chance, GPUs zu erhalten.
- Zusätzlich zur Zusicherung, die an Ihre VMs angehängt ist, erhalten Sie einen Rabatt von bis zu 53% für vCPUs und GPUs.

Zukünftige Reservierungen in AI Hypercomputer verwenden

Wenn Sie vorausschauende Reservierungen zum Erstellen von VMs oder Clustern verwenden möchten, müssen Sie die folgenden Schritte ausführen:

Kapazität reservieren Wenden Sie sich an Ihr Account-Management-Team und geben Sie die zu reservierenden Ressourcen an. Google erstellt basierend auf der Verfügbarkeit eine Reservierungsanfrage für Sie. Wenn alles richtig aussieht, können Sie die Reservierungsanfrage einreichen. Google Cloud genehmigt die Reservierungsanfrage sofort.

Eine Anleitung finden Sie unter Kapazität reservieren.
Reservierte Ressourcen nutzen: Zu Beginn des ausgewählten Reservierungszeitraums können Sie die Reservierung verwenden, um VMs oder Cluster zu erstellen.

Informationen zu den verschiedenen Methoden zum Erstellen von VMs oder Clustern finden Sie unter Übersicht über Bereitstellungsoptionen.

Vorausschauende Reservierungen im Kalendermodus verwenden

Wenn Sie kurz laufende verteilte Arbeitslasten ausführen möchten, für die dicht zugewiesene Ressourcen erforderlich sind, können Sie Rechenressourcen für bis zu 90 Tage anfordern. Sie haben während dieser Zeit exklusiven Zugriff auf die reservierten Ressourcen und können sie zum Erstellen von VMs oder Clustern verwenden. Am Ende des Reservierungszeitraums führt Compute Engine folgende Schritte aus:

Compute Engine löscht die Reservierung.
Je nach der Beendigungsaktion, die Sie für die VMs angeben, werden alle VMs, die die Reservierung verwenden, von Compute Engine beendet oder gelöscht.

Ideale Arbeitslasten für vorausschauende Reservierungen im Kalendermodus

Vorausschauende Reservierungen im Kalendermodus eignen sich ideal für die folgenden Arbeitslasten:

Modell-Vortraining
Modellabstimmung
Simulationen
Inferenz

Wichtige Merkmale von vorausschauenden Reservierungen im Kalendermodus

Vorausschauende Reservierungen im Kalendermodus haben die folgenden Merkmale:

Sie können die Maschinentypen A4, A3 Ultra, A3 Mega oder A3 High (8 GPUs) reservieren. Diese Maschinen sind dicht zugewiesen, um die Netzwerklatenz zu minimieren.
Sie können die zukünftige Verfügbarkeit einsehen und bis zu 80 VMs für bis zu 90 Tage reservieren. Anschließend können Sie die reservierten Ressourcen verwenden, um bis zum Ende des Reservierungszeitraums VMs zu erstellen.
Nach Beginn des Reservierungszeitraums können Sie die automatisch erstellten Reservierungen so ändern:
- Benachrichtigungen zur Notfallwartung der Hardware aktivieren oder deaktivieren
- Verwendung von Vertex AI-Jobs aktivieren oder deaktivieren
Sie verwenden das reservierungsgebundene Bereitstellungsmodell, das folgende Vorteile bietet:
- Sie haben eine höhere Chance, GPUs zu erhalten.
- Sie erhalten einen Rabatt von bis zu 53% für vCPUs und GPUs.

Vorausschauende Reservierungen im Kalendermodus verwenden

Wenn Sie vorausschauende Reservierungen im Kalendermodus verwenden möchten, um VMs oder Cluster zu erstellen, müssen Sie die folgenden Schritte ausführen:

Verfügbarkeit von Ressourcen ansehen Sie können die zukünftige Verfügbarkeit der Ressourcen sehen, die Sie reservieren möchten. Wenn Sie eine Reservierungsanfrage erstellen, können Sie die Anzahl, den Typ und die Reservierungsdauer für die Ressourcen angeben, die Sie als verfügbar bestätigt haben. Dadurch steigt die Wahrscheinlichkeit, dass Google Cloud Ihren Antrag genehmigt.

Eine Anleitung dazu finden Sie unter Zukünftige Verfügbarkeit von Ressourcen ansehen.
Kapazität reservieren: Sie erstellen eine Reservierungsanfrage für ein zukünftiges Datum und eine zukünftige Uhrzeit. Google Cloud genehmigt die Reservierungsanfrage innerhalb von zwei Minuten. Wenn die Anfrage genehmigt wird, reserviert Compute Engine die Kapazität. Am gewählten Liefertermin können Sie mit den reservierten Ressourcen VMs oder Cluster erstellen.

Eine Anleitung finden Sie unter Reservierungsanfrage für GPU-VMs oder TPUs erstellen.
Reservierte Ressourcen nutzen: Zu Beginn des ausgewählten Reservierungszeitraums können Sie die Reservierung verwenden, um VMs oder Cluster zu erstellen.

Informationen zu den verschiedenen Methoden zum Erstellen von VMs oder Clustern finden Sie unter:
- Informationen zum Erstellen von A4-, A3 Ultra-, A3 Mega- oder A3 High-VMs (8 GPUs) finden Sie unter Bereitstellungsoptionen – Übersicht.
- Informationen zum Erstellen von A3 Mega- oder A3 High-VMs (8 GPUs) mit aktiviertem GPUDirect-TCPX finden Sie unter A3-VM mit aktiviertem GPUDirect-TCPX erstellen.

Flex-Start verwenden

Wenn Sie Arbeitslasten mit kurzer Laufzeit ausführen möchten, die dicht zugewiesene Ressourcen erfordern, können Sie mit Flex-Start Rechenressourcen für bis zu sieben Tage anfordern. Wenn Ressourcen verfügbar sind, erstellt Compute Engine die angeforderte Anzahl von VMs. Sie können eigenständige Flex-Start-VMs beenden, aber keine Flex-Start-VMs, die von einer verwalteten Instanzgruppe (Managed Instance Group, MIG) über Anfragen zur Größenänderung erstellt werden. Die Flex-Start-VMs sind so lange vorhanden, bis Sie sie löschen oder bis Compute Engine die VMs am Ende ihrer Laufzeit löscht.

Geeignete Arbeitslasten für Flex-Start

Flex-Start ist ideal für Arbeitslasten, die jederzeit gestartet werden können, z. B.:

Vortraining kleiner Modelle
Modellabstimmung
Simulationen
Batchinferenz

Wichtige Merkmale von Flex-Start

Flex-Start hat die folgenden Eigenschaften:

Sie können jeden GPU-Maschinentyp außer A4X Max und A4X anfordern. Compute Engine versucht, Maschinen dicht zu platzieren. Das kann dazu führen, dass Flex-Start-VMs in derselben Zone weit voneinander entfernt sind. So können Sie die Platzierung Ihrer VMs steuern und die Netzwerklatenz minimieren:
- Wenden Sie für eigenständige Flex-Start-VMs eine Richtlinie für kompakte Platzierung auf die VMs an.
- Wenden Sie für verwaltete Instanzgruppen mit einer Zielgröße eine Arbeitslastrichtlinie an.
Sie verwenden das Bereitstellungsmodell „Flex-Start“, das folgende Vorteile bietet:
- Sie haben eine höhere Chance, GPUs zu erhalten.
- Sie erhalten einen Rabatt von bis zu 53% für vCPUs, Arbeitsspeicher und GPUs.

Flex-Start verwenden

Wenn Sie mit Flex-Start VMs oder Cluster erstellen möchten, müssen Sie die folgenden Schritte ausführen:

Optional: Richtlinie für kompakte Platzierung oder Arbeitslastrichtlinie erstellen Sie können eine Richtlinie für kompakte Platzierung (für einzelne VMs oder VMs im Bulk) oder eine Arbeitslastrichtlinie (für verwaltete Instanzgruppen) erstellen, um die VM-Nähe anzugeben. Die von Ihnen gewählte Konfiguration wirkt sich auf die Maschinentypen und die Anzahl der VMs aus, die von der Richtlinie unterstützt werden.
Flex-Start-VMs erstellen Nachdem Sie die Erstellung von VMs angefordert haben, plant Compute Engine die VM-Erstellung basierend auf der Verfügbarkeit. Wenn Kapazität verfügbar wird, stellt Compute Engine die Flex-Start-VMs bereit. VMs werden ausgeführt, bis Sie sie anhalten oder löschen oder bis sie das Ende ihrer Ausführungsdauer erreichen.

Eine Anleitung finden Sie unter Bereitstellungsoptionen – Übersicht.

Spot verwenden

Um fehlertolerante Arbeitslasten auszuführen, können Sie sofort Rechenressourcen basierend auf der Verfügbarkeit abrufen. Sie erhalten Ressourcen zum niedrigstmöglichen Preis. Compute Engine kann VMs jedoch jederzeit vorzeitig beenden, um Kapazitäten freizugeben.

Geeignete Arbeitslasten für Spot

Spot eignet sich ideal für Arbeitslasten, bei denen Unterbrechungen akzeptabel sind, z. B. für:

Batchverarbeitung
Hochleistungs-Computing (HPC)
Continuous Integration und Continuous Deployment (CI/CD)
Datenanalyse
Medien-Codierung
Onlineinferenz

Wichtige Merkmale von Spot

Spot hat die folgenden Eigenschaften:

Sie können jeden GPU-Maschinentyp erstellen, mit Ausnahme von A4X Max und A4X. Die dichte Zuweisung hängt von der Ressourcenverfügbarkeit ab. Um eine engere Zuweisung zu gewährleisten, können Sie eine Richtlinie für kompakte Platzierung auf die VMs anwenden.
Sie können VMs sofort erstellen. Die VMs werden ausgeführt, bis Sie sie stoppen oder löschen oder bis Compute Engine sie vorzeitig beendet, um Kapazität zurückzugewinnen.
Sie verwenden das Spot-Bereitstellungsmodell, das folgende Vorteile bietet:
- Sie haben eine höhere Chance, GPUs zu erhalten.
- Sie erhalten einen Rabatt von bis zu 91% für viele Maschinentypen, GPUs, TPUs und lokale SSDs.

Spot verwenden

Wenn Sie Spot zum Erstellen von VMs oder Clustern verwenden möchten, müssen Sie die folgenden Schritte ausführen:

Ressourcenverfügbarkeit ansehen Sie können die Verfügbarkeit von Ressourcen in der Region oder Zone einsehen, in der Sie Spot-VMs erstellen möchten. So verringern Sie die Wahrscheinlichkeit, dass Fehler in der Ressourcenverfügbarkeit auftreten.

Eine Anleitung finden Sie unter Verfügbarkeit von Spot-VMs ansehen.
Optional: Vorabzugriffspreis und ‑rate ansehen. Sie können sich die bisherige und aktuelle Preemption-Rate sowie die Preise für verschiedene Maschinentypen und Zonen ansehen. Anhand dieser Informationen können Sie den Maschinentyp und den Standort auswählen, die am besten zu Ihrer Arbeitslast und Ihrem Budget passen.

Eine Anleitung finden Sie unter Abrufquote und Preise für Spot-VMs ansehen.
Optional: Richtlinie für kompakte Platzierung oder Arbeitslastrichtlinie erstellen Sie können eine Richtlinie für kompakte Platzierung (für einzelne VMs oder VMs im Bulk) oder eine Arbeitslastrichtlinie (für verwaltete Instanzgruppen) erstellen, um die VM-Nähe anzugeben. Die von Ihnen gewählte Konfiguration wirkt sich auf die Maschinentypen und die Anzahl der VMs aus, die von der Richtlinie unterstützt werden.

Eine Anleitung finden Sie unter Latenz mithilfe von Richtlinien für kompakte Platzierung reduzieren oder Arbeitslastrichtlinien für MIGs erstellen.
Spot-VMs erstellen Sie können beliebig viele VMs erstellen, sofern sie verfügbar sind. Die VMs werden ausgeführt, bis Sie sie beenden oder löschen oder bis Compute Engine sie vorzeitig beendet, um Kapazität zurückzugewinnen.

Eine Anleitung finden Sie unter Übersicht über die Bereitstellungsoptionen.

Eine Option für die Aufnahme auswählen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Vergleich der Nutzungsoptionen

Eine Option für die Aufnahme auswählen

Vorausschauende Reservierungen in AI Hypercomputer verwenden

Geeignete Arbeitslasten für vorausschauende Reservierungen in AI Hypercomputer

Wichtige Merkmale von vorausschauenden Reservierungen in AI Hypercomputer

Zukünftige Reservierungen in AI Hypercomputer verwenden

Vorausschauende Reservierungen im Kalendermodus verwenden

Ideale Arbeitslasten für vorausschauende Reservierungen im Kalendermodus

Wichtige Merkmale von vorausschauenden Reservierungen im Kalendermodus

Vorausschauende Reservierungen im Kalendermodus verwenden

Flex-Start verwenden

Geeignete Arbeitslasten für Flex-Start

Wichtige Merkmale von Flex-Start

Flex-Start verwenden

Spot verwenden

Geeignete Arbeitslasten für Spot

Wichtige Merkmale von Spot

Spot verwenden

Eine Option für die Aufnahme auswählen