Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Bereitstellungsmodelle für Compute Engine-Instanzen

Linux Windows

Wenn Sie eine Compute Engine-Instanz erstellen, müssen Sie die Methode definieren, die Sie zum Abrufen der angeforderten Ressourcen verwenden möchten. Diese Methode wird als Bereitstellungsmodell bezeichnet. Jedes Bereitstellungsmodell bestimmt die Verfügbarkeit, Lebensdauer und Preise Ihrer Compute-Instanzen.

In diesem Dokument werden die verschiedenen Bereitstellungsmodelle beschrieben, die Sie beim Erstellen von Compute-Instanzen angeben können. Wenn Sie diese Modelle kennen, können Sie die beste Option für Ihre Arbeitslast auswählen.

Verfügbare Bereitstellungsmodelle

Wenn Sie eine Compute-Instanz erstellen, können Sie eines der folgenden Bereitstellungsmodelle angeben. Wenn Sie kein Bereitstellungsmodell angeben, verwendet Compute Engine standardmäßig das Standardbereitstellungsmodell.

Standard
Spot
Flex-Start
Reservierungsgebunden

In der folgenden Tabelle finden Sie einen Vergleich der Anwendungsfälle und Preise für die einzelnen Bereitstellungsmodelle:

	Standard	Spot	Flex-Start	Reservierungsgebunden
Zusammenfassung	Je nach Ressourcenverfügbarkeit können Sie sofort Recheninstanzen erstellen. Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen.	Je nach Ressourcenverfügbarkeit können Sie sofort Recheninstanzen erstellen. Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen. Sie erlauben Compute Engine jedoch auch, Compute-Instanzen jederzeit zu beenden oder zu löschen, um Kapazitäten zurückzugewinnen.	Je nach Ressourcenverfügbarkeit können Sie Compute-Instanzen innerhalb einer bestimmten Wartezeit erstellen. Bei einer eigenständigen Flex-Start-VM können Sie eine Wartezeit von bis zu zwei Stunden angeben. Bei einer MIG versucht Compute Engine weiterhin, Compute-Instanzen zu erstellen, bis Ressourcen verfügbar werden oder Sie Ihre Erstellungsanfrage abbrechen. Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen. Sie können sie jedoch nicht sperren oder neu erstellen. Compute-Instanzen werden mindestens 10 Minuten und maximal 7 Tage ausgeführt. Wenn die Laufzeit der Compute-Instanzen abläuft, werden sie entsprechend ihrer Beendigungsaktion von Compute Engine beendet oder gelöscht.	Sie können eine Reservierung von Kapazität für die Erstellung von Compute-Instanzen zu einem zukünftigen Datum anfordern. Wenn Google Cloud Ihre Anfrage genehmigt, erstellt Compute Engine eine Reservierung. Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie Compute-Instanzen erstellen, die der Reservierung entsprechen. Während des genehmigten Reservierungszeitraums können Sie Compute-Instanzen beenden, neu starten, löschen und neu erstellen, um die Reservierung nach Bedarf zu nutzen. Wenn der Reservierungszeitraum endet, löscht Compute Engine die Reservierung und beendet oder löscht alle Compute-Instanzen, die die Reservierung nutzen, entsprechend ihrer Beendigungsaktion.
Anwendungsfälle	Ideal für Arbeitslasten, die Stabilität und kontinuierlichen Betrieb erfordern, z. B. die folgenden Arbeitslasten: Webserver Datenbanken Unternehmensanwendungen Entwicklung und Tests	Ideal für Arbeitslasten, die Unterbrechungen tolerieren können, z. B. die folgenden: Batchverarbeitung Hochleistungs-Computing (HPC) Continuous Integration und Continuous Deployment (CI/CD) Datenanalyse Medien-Codierung Onlineinferenz	Arbeitslasten, die Stabilität erfordern und nicht länger als sieben Tage ausgeführt werden müssen, z. B. die folgenden Arbeitslasten: Vortraining kleiner Modelle Modellabstimmung HPC-Simulation Batchinferenz	Ideal für Arbeitslasten, die Stabilität und eine bestimmte Laufzeit erfordern, z. B.: Für Arbeitslasten mit einer Dauer von bis zu 90 Tagen: Jobs zum Vortrainieren von Modellen Jobs zur Modellabstimmung HPC-Simulationsarbeitslasten Kurzfristig erwartete Steigerungen der Inferenz-Arbeitslast Für Arbeitslasten, die länger als 90 Tage dauern: Trainingsarbeitslasten Inferenzarbeitslasten
Ressourcenzuweisung	Best-Effort: Compute Engine platziert Ressourcen nach Best-Effort-Prinzip physisch nah beieinander. Um die Platzierung zu steuern, können Sie optional Platzierungsrichtlinien verwenden.	Best-Effort: Compute Engine platziert Ressourcen nach Best-Effort-Prinzip physisch nah beieinander. Um die Platzierung zu steuern, können Sie optional Platzierungsrichtlinien verwenden.	Bestmöglich verdichtet: Compute Engine versucht, Ressourcen möglichst nah beieinander zu platzieren. Um die Platzierung Ihrer Flex-Start-VMs zu steuern, können Sie optional eine der folgenden Optionen verwenden: Für eigenständige Flex-Start-VMs: Richtlinien für kompakte Platzierung Für Flex-Start-VMs in einer MIG: Arbeitslastrichtlinien	Dicht In Compute Engine werden Ressourcen physisch auf eng gekoppelten Hosts platziert, die über ein Hochgeschwindigkeitsnetzwerk verbunden sind, um die Netzwerklatenz zu minimieren.
Preise	Für Compute-Instanzen fallen Standardpreise an. Weitere Informationen finden Sie unter Preise für VM-Instanzen. Die Gebühren richten sich nach der Methode, mit der Sie Compute-Instanzen erstellen: Wenn Sie sofort Compute-Instanzen erstellen, zahlen Sie nutzungsabhängig (PAYG). Wenn Sie Compute-Instanzen mit einer On-Demand-Reservierung oder einer automatisch erstellten Reservierung für eine vorausschauende Reservierung erstellen, werden Ihnen Gebühren berechnet, solange die Reservierung vorhanden ist. Weitere Informationen finden Sie unter Reservierungsabrechnung.	Sie erhalten Rabatte von bis zu 60% für die Maschinenserien C3, M3 und A3. Weitere Informationen finden Sie auf der Preisseite. Sie PAYG.	Je nach Maschinenserie, die von Ihren Compute-Instanzen verwendet wird, erhalten Sie einen Rabatt: Für die A4-, A3- und A2-Maschinenserien erhalten Sie einen Rabatt von 53% für vCPUs, Arbeitsspeicher und GPUs. Für die H4D-Maschinenserie erhalten Sie einen Rabatt von 25% auf vCPUs und Arbeitsspeicher. Andere unterstützte Maschinenserien sind nicht für Rabatte berechtigt. Weitere Informationen finden Sie unter Dynamic Workload Scheduler (DWS) – Preise. Sie PAYG.	Die Kosten richten sich danach, wie Sie Kapazität für das Erstellen von Compute-Instanzen reservieren: Wenn Sie Kapazität in AI Hypercomputer reservieren, fallen Gebühren gemäß den Preisen für beschleunigungsoptimierte VMs an. Wenn Sie Ressourcen für ein Jahr oder länger reservieren, müssen Sie eine ressourcenbasierte Zusicherung kaufen und an die reservierten Ressourcen anhängen. Wenn Sie Kapazität mit zukünftigen Reservierungen im Kalendermodus reservieren, fallen Gebühren basierend auf den Preisen für Dynamic Workload Scheduler (DWS) an. Die Abrechnung erfolgt für den Reservierungszeitraum. Weitere Informationen finden Sie unter Reservierungsabrechnung.
Kontingent	Wenn Sie eine Compute-Instanz erstellen, wird das Standardkontingent verwendet.	Wenn Sie eine Spot-VM erstellen, wird Standardkontingent verbraucht.	Wenn Sie eine Flex-Start-VM erstellen, wird Kontingent für VMs auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet.	Die Kontingentnutzung variiert je nach Methode, mit der Sie Ressourcen reservieren: Zukünftige Reservierungen mit AI Hypercomputer- oder HPC-Clustern: Google verwaltet das Kontingent für Ihre reservierten Ressourcen. Sie müssen das Kontingent nicht manuell anfordern. Zu Beginn Ihrer genehmigten zukünftigen Reservierung erhöht Google das Kontingent automatisch, wenn es in Ihrem Projekt nicht ausreicht. Vorausschauende Reservierungen im Kalendermodus: Wenn Sie H4D-Maschinentypen reservieren, wird das CPU-Kontingent verbraucht. Für die Reservierung von GPU- oder TPU-Maschinentypen ist kein Kontingent erforderlich.

Verfügbarkeit und Lebensdauer von Compute-Instanzen

In der folgenden Tabelle sind die Verfügbarkeit und die Lebensdauer von Compute-Instanzen für die einzelnen Bereitstellungsmodelle aufgeführt:

	Standard	Spot	Flex-Start	Reservierungsgebunden
Voraussetzungen für die Erstellung	Keine Voraussetzungen für die Erstellung.	Keine Voraussetzungen für die Erstellung.	Keine Voraussetzungen für die Erstellung.	Wenn Sie Compute-Instanzen erstellen möchten, müssen Sie zuerst Kapazität mit einer der folgenden Methoden reservieren: Wenn Sie Kapazität für lang andauernde Arbeitslasten reservieren möchten, verwenden Sie vorausschauende Reservierungen mit AI Hypercomputer oder vorausschauende Reservierungen mit HPC-Clustern. Wenn Sie Kapazität für Arbeitslasten reservieren möchten, die bis zu 90 Tage lang ausgeführt werden, verwenden Sie vorausschauende Reservierungen im Kalendermodus. Zum von Ihnen ausgewählten Liefertermin und zur ausgewählten Lieferzeit stellt Compute Engine die angeforderte Kapazität bereit. Anschließend können Sie die Kapazität nutzen, indem Sie Compute-Instanzen erstellen.
Unterstützte Maschinenserien	Sie können jede Maschinenreihe verwenden, mit Ausnahme von A4X Max, A4X, A4 und A3 Ultra.	Sie können alle Maschinenserien (C3, M3 und A3) verwenden. Spot für TPU7x ist durch eine Zulassungsliste eingeschränkt. Community-Anmerkung	Sie können nur die folgenden Maschinenserien verwenden: Maschinenserien A4, A3, A2, G4 und G2 TPU7x¹, TPU v6e und TPU v5p N1-VM-Instanzen mit angehängten GPUs H4D-Maschinenserie	Je nachdem, wie Sie Kapazität zum Erstellen von VMs reservieren, können Sie nur die folgenden Maschinenserien verwenden: Wenn Sie Kapazität in AI Hypercomputer reservieren, können Sie nur A4X Max, A4X, A4, A3 Ultra, A3 Mega mit 8 GPUs, A3 High mit 8 GPUs und A3 Edge verwenden. Wenn Sie eine vorausschauende Reservierung im Kalendermodus erstellen, können Sie nur die folgenden Serien verwenden: GPUs: A4, A3 Ultra, A3 Mega mit 8 GPUs, A3 High mit 8 GPUs und H4D-Maschinenserie. TPUs: TPU7x^*, v6e, v5p
Verfügbarkeit von Compute-Instanzen	Sie können jederzeit Compute-Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind. Um die Wahrscheinlichkeit von Fehlern bei der Ressourcenverfügbarkeit zu verringern, können Sie die Verfügbarkeit von Spot-VMs ansehen, bevor Sie sie erstellen.	Sie können jederzeit Compute-Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind.	Sie können Compute-Instanzen so erstellen: Eigenständige Compute-Instanz erstellen Erstellen Sie eine MIG, in der Compute-Instanzen basierend auf der Verfügbarkeit einzeln erstellt werden. MIG erstellen, mit der Compute-Instanzen gleichzeitig erstellt werden. Compute Engine verwendet DWS, um die Bereitstellung der angeforderten Kapazität basierend auf der Ressourcenverfügbarkeit zu planen. DWS hilft Ihnen, stark nachgefragte Ressourcen wie GPUs zu erhalten.	Sie können Compute-Instanzen erst erstellen, nachdem Sie Kapazität für ein zukünftiges Datum reserviert haben. Am gewünschten Datum stellt Compute Engine die angeforderte Kapazität bereit, mit der Sie dann Compute-Instanzen erstellen können. Wenn Sie Ressourcen mit vorausschauenden Reservierungen im Kalendermodus reservieren, verwendet Compute Engine DWS, um die angeforderte Kapazität bereitzustellen. DWS hilft Ihnen, stark nachgefragte Ressourcen wie GPUs zu erhalten.
Kapazitätsgarantie	Basierend auf der Erstellungsmethode Die Kapazitätsgarantie variiert je nach Methode, mit der Sie Compute-Instanzen erstellen, wie folgt: Wenn Sie sofort Compute-Instanzen erstellen, versucht Compute Engine nach Best-Effort-Prinzip, die angeforderte Kapazität bereitzustellen. Wenn Sie Compute-Instanzen erstellen, indem Sie eine On-Demand-Reservierung oder eine automatisch erstellte vorausschauende Reservierung nutzen, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine die angeforderte Kapazität bereitstellt, sofern in der Reservierung reservierte Kapazität verfügbar ist.	Best-Effort: Wenn Sie Spot-VMs erstellen, versucht Compute Engine, die angeforderte Kapazität bereitzustellen.	Best-Effort: Wenn Sie eine Anfrage zur Größenänderung einer MIG erstellen, versucht Compute Engine nach besten Kräften, die Bereitstellung der angeforderten Kapazität zu planen.	Sehr hoch. Wenn Google Cloud Ihre Reservierungsanfrage genehmigt, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine Ihre reservierte Kapazität zum von Ihnen ausgewählten Liefertermin und zur von Ihnen ausgewählten Lieferzeit bereitstellt. Sie haben während der gesamten Reservierungsdauer exklusiven Zugriff auf die reservierte Kapazität.
Lebensdauer von Compute-Instanzen	Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll. Wenn der Maschinentyp, der von der Compute-Instanz verwendet wird, jedoch keine Live-Migration unterstützt, beendet Compute Engine die Compute-Instanz während Host-Wartungsereignissen.	Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen: Compute Engine beendet oder löscht die Compute-Instanz, um Kapazität zurückzugewinnen. Dieser Vorgang wird als Unterbrechung bezeichnet. Wenn der Maschinentyp, der von der Compute-Instanz verwendet wird, keine Live-Migration unterstützt, beendet Compute Engine die Compute-Instanz während Hostwartungsereignissen.	Bevor eine Compute-Instanz das Ende ihrer Laufzeit erreicht, haben Sie folgende Möglichkeiten: Compute-Instanz beenden: Wenn Sie Ihre Flex-Start-VM als eigenständige Compute-Instanz oder einzeln in einer MIG erstellt haben, sobald Kapazität verfügbar wurde, können Sie die Compute-Instanzen jederzeit beenden. Sie können keine Flex-Start-VMs beenden, die in einer MIG-Anfrage zur Größenänderung erstellt wurden. Compute-Instanz löschen: Sie können die Compute-Instanz jederzeit löschen. Wenn eine Compute-Instanz das Ende ihrer Laufzeit erreicht, wird sie entsprechend ihrer Beendigungsaktion von Compute Engine beendet oder gelöscht.	Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen: Compute Engine beendet die Compute-Instanz während Hostwartungsereignissen. Die automatisch erstellte Reservierung zur Bereitstellung der angeforderten Kapazität erreicht das Ende des zugesicherten Reservierungszeitraums. Zu diesem Zeitpunkt löscht Compute Engine die Reservierung und beendet oder löscht alle Compute-Instanzen, die die Reservierung nutzen, basierend auf der in ihrer Konfiguration angegebenen Beendigungsaktion.

¹ Spot-, Flex-Start- und vorausschauende Reservierungen im Kalendermodus für TPU7x sind durch eine Zulassungsliste eingeschränkt. Wenn Sie Zugriff anfordern möchten, wenden Sie sich an Ihr Account-Management-Team oder das Vertriebsteam.

Bereitstellungsmodelle für Compute Engine-Instanzen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Verfügbare Bereitstellungsmodelle

Verfügbarkeit und Lebensdauer von Compute-Instanzen

Nächste Schritte

Bereitstellungsmodelle für Compute Engine-Instanzen