Bereitstellungsmodelle für Compute Engine-Instanzen

Wenn Sie eine Compute Engine-Instanz erstellen, müssen Sie die Methode definieren, die Sie zum Abrufen der angeforderten Ressourcen verwenden möchten. Diese Methode wird als Bereitstellungsmodell bezeichnet. Jedes Bereitstellungsmodell bestimmt die Verfügbarkeit, Lebensdauer und Preise Ihrer Compute-Instanzen.

In diesem Dokument werden die verschiedenen Bereitstellungsmodelle beschrieben, die Sie beim Erstellen von Compute-Instanzen angeben können. Wenn Sie diese Modelle kennen, können Sie die beste Option für Ihre Arbeitslast auswählen.

Verfügbare Bereitstellungsmodelle

Wenn Sie eine Compute-Instanz erstellen, können Sie eines der folgenden Bereitstellungsmodelle angeben. Wenn Sie kein Bereitstellungsmodell angeben, verwendet Compute Engine standardmäßig das Standardbereitstellungsmodell.

  • Standard

  • Spot

  • Flex-Start

  • Reservierungsgebunden

In der folgenden Tabelle finden Sie einen Vergleich der Anwendungsfälle und Preise für die einzelnen Bereitstellungsmodelle:

Standard Spot Flex-Start Reservierungsgebunden
Zusammenfassung
  • Je nach Ressourcenverfügbarkeit können Sie sofort Recheninstanzen erstellen.
  • Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen.
  • Je nach Ressourcenverfügbarkeit können Sie sofort Recheninstanzen erstellen.
  • Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen. Sie erlauben Compute Engine jedoch auch, Compute-Instanzen jederzeit zu beenden oder zu löschen, um Kapazitäten zurückzugewinnen.
  • Je nach Ressourcenverfügbarkeit können Sie Compute-Instanzen innerhalb einer bestimmten Wartezeit erstellen. Bei einer eigenständigen Flex-Start-VM können Sie eine Wartezeit von bis zu zwei Stunden angeben. Bei einer MIG versucht Compute Engine weiterhin, Compute-Instanzen zu erstellen, bis Ressourcen verfügbar werden oder Sie Ihre Erstellungsanfrage abbrechen.
  • Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen. Sie können sie jedoch nicht sperren oder neu erstellen. Compute-Instanzen werden mindestens 10 Minuten und maximal 7 Tage ausgeführt. Wenn die Laufzeit der Compute-Instanzen abläuft, werden sie entsprechend ihrer Beendigungsaktion von Compute Engine beendet oder gelöscht.
  • Sie können eine Reservierung von Kapazität für die Erstellung von Compute-Instanzen zu einem zukünftigen Datum anfordern. Wenn Google Cloud Ihre Anfrage genehmigt, erstellt Compute Engine eine Reservierung. Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie Compute-Instanzen erstellen, die der Reservierung entsprechen.
  • Während des genehmigten Reservierungszeitraums können Sie Compute-Instanzen beenden, neu starten, löschen und neu erstellen, um die Reservierung nach Bedarf zu nutzen. Wenn der Reservierungszeitraum endet, löscht Compute Engine die Reservierung und beendet oder löscht alle Compute-Instanzen, die die Reservierung nutzen, entsprechend ihrer Beendigungsaktion.
Anwendungsfälle

Ideal für Arbeitslasten, die Stabilität und kontinuierlichen Betrieb erfordern, z. B. die folgenden Arbeitslasten:

  • Webserver
  • Datenbanken
  • Unternehmensanwendungen
  • Entwicklung und Tests

Ideal für Arbeitslasten, die Unterbrechungen tolerieren können, z. B. die folgenden:

  • Batchverarbeitung
  • Hochleistungs-Computing (HPC)
  • Continuous Integration und Continuous Deployment (CI/CD)
  • Datenanalyse
  • Medien-Codierung
  • Onlineinferenz

Arbeitslasten, die Stabilität erfordern und nicht länger als sieben Tage ausgeführt werden müssen, z. B. die folgenden Arbeitslasten:

  • Vortraining kleiner Modelle
  • Modellabstimmung
  • HPC-Simulation
  • Batchinferenz

Ideal für Arbeitslasten, die Stabilität und eine bestimmte Laufzeit erfordern, z. B.:

  • Für Arbeitslasten mit einer Dauer von bis zu 90 Tagen:

    • Jobs zum Vortrainieren von Modellen
    • Jobs zur Modellabstimmung
    • HPC-Simulationsarbeitslasten
    • Kurzfristig erwartete Steigerungen der Inferenz-Arbeitslast
  • Für Arbeitslasten, die länger als 90 Tage dauern:

    • Trainingsarbeitslasten
    • Inferenzarbeitslasten
Ressourcenzuweisung Best-Effort: Compute Engine platziert Ressourcen nach Best-Effort-Prinzip physisch nah beieinander. Um die Platzierung zu steuern, können Sie optional Platzierungsrichtlinien verwenden. Best-Effort: Compute Engine platziert Ressourcen nach Best-Effort-Prinzip physisch nah beieinander. Um die Platzierung zu steuern, können Sie optional Platzierungsrichtlinien verwenden. Bestmöglich verdichtet: Compute Engine versucht, Ressourcen möglichst nah beieinander zu platzieren. Um die Platzierung Ihrer Flex-Start-VMs zu steuern, können Sie optional eine der folgenden Optionen verwenden: Dicht Compute Engine platziert Ressourcen physisch auf eng gekoppelten Hosts, die über ein Hochgeschwindigkeitsnetzwerk verbunden sind, um die Netzwerklatenz zu minimieren.
Preise
  • Für Compute-Instanzen fallen Standardpreise an. Weitere Informationen finden Sie unter Preise für VM-Instanzen.
  • Die Gebühren richten sich nach der Methode, mit der Sie Compute-Instanzen erstellen:

    • Wenn Sie sofort Compute-Instanzen erstellen, zahlen Sie nutzungsabhängig (PAYG).
    • Wenn Sie Compute-Instanzen mit einer On-Demand-Reservierung oder einer automatisch erstellten Reservierung für eine vorausschauende Reservierung erstellen, werden Ihnen Gebühren berechnet, solange die Reservierung besteht. Weitere Informationen finden Sie unter Reservierungsabrechnung.
  • Sie erhalten Rabatte von bis zu 60% für die Maschinenserien C3, M3 und A3. Weitere Informationen finden Sie auf der Preisseite.
  • Sie PAYG.
  • Je nach Maschinenserie, die von Ihren Compute-Instanzen verwendet wird, erhalten Sie einen Rabatt:

    • Für die A4-, A3- und A2-Maschinenserien erhalten Sie einen Rabatt von 53% für vCPUs, Arbeitsspeicher und GPUs.
    • Für die H4D-Maschinenserie erhalten Sie einen Rabatt von 25% auf vCPUs und Arbeitsspeicher.
    Andere unterstützte Maschinenserien sind nicht für Rabatte berechtigt. Weitere Informationen finden Sie unter Dynamic Workload Scheduler (DWS) – Preise.
  • Sie PAYG.
Kontingent Wenn Sie eine Compute-Instanz erstellen, wird das Standardkontingent verwendet. Wenn Sie eine Spot-VM erstellen, wird Standardkontingent verbraucht. Wenn Sie eine Flex-Start-VM erstellen, wird Kontingent für VMs auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet.

Die Kontingentnutzung variiert je nach Methode, mit der Sie Ressourcen reservieren:

  • Zukünftige Reservierungen mit AI Hypercomputer- oder HPC-Clustern: Google verwaltet das Kontingent für Ihre reservierten Ressourcen. Sie müssen das Kontingent nicht manuell anfordern. Zu Beginn Ihrer genehmigten zukünftigen Reservierung erhöht Google das Kontingent automatisch, wenn es in Ihrem Projekt nicht ausreicht.
  • Vorausschauende Reservierungen im Kalendermodus: Wenn Sie H4D-Maschinentypen reservieren, wird das CPU-Kontingent verbraucht. Für die Reservierung von GPU- oder TPU-Maschinentypen ist kein Kontingent erforderlich.

Verfügbarkeit und Lebensdauer von Compute-Instanzen

In der folgenden Tabelle sind die Verfügbarkeit und die Lebensdauer von Compute-Instanzen für die einzelnen Bereitstellungsmodelle aufgeführt:

Standard Spot Flex-Start Reservierungsgebunden
Voraussetzungen für die Erstellung Keine Voraussetzungen für die Erstellung. Keine Voraussetzungen für die Erstellung. Keine Voraussetzungen für die Erstellung.

Wenn Sie Compute-Instanzen erstellen möchten, müssen Sie zuerst Kapazität mit einer der folgenden Methoden reservieren:

Zum von Ihnen ausgewählten Liefertermin und zur ausgewählten Lieferzeit stellt Compute Engine die angeforderte Kapazität bereit. Anschließend können Sie die Kapazität nutzen, indem Sie Compute-Instanzen erstellen.

Unterstützte Maschinenserien Sie können jede Maschinenreihe verwenden, mit Ausnahme von A4X Max, A4X, A4 und A3 Ultra. Sie können alle Maschinenserien (C3, M3 und A3) verwenden.

Sie können nur die folgenden Maschinenserien verwenden:

Je nachdem, wie Sie Kapazität zum Erstellen von VMs reservieren, können Sie nur die folgenden Maschinenserien verwenden:

Verfügbarkeit von Compute-Instanzen Sie können jederzeit Compute-Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind. Sie können jederzeit Compute-Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind.

Sie können Compute-Instanzen so erstellen:

Compute Engine verwendet DWS, um die Bereitstellung der angeforderten Kapazität basierend auf der Ressourcenverfügbarkeit zu planen. DWS hilft Ihnen, stark nachgefragte Ressourcen wie GPUs zu erhalten.

Sie können Compute-Instanzen erst erstellen, nachdem Sie Kapazität für ein zukünftiges Datum reserviert haben. Am gewünschten Datum stellt Compute Engine die angeforderte Kapazität bereit, mit der Sie dann Compute-Instanzen erstellen können. Wenn Sie Ressourcen mit vorausschauenden Reservierungen im Kalendermodus reservieren, verwendet Compute Engine DWS, um die angeforderte Kapazität bereitzustellen. DWS hilft Ihnen, stark nachgefragte Ressourcen wie GPUs zu erhalten.
Kapazitätsgarantie Basierend auf der Erstellungsmethode Die Kapazitätsgarantie variiert je nach Methode, mit der Sie Compute-Instanzen erstellen, wie folgt:
  • Wenn Sie sofort Compute-Instanzen erstellen, versucht Compute Engine nach Best-Effort-Prinzip, die angeforderte Kapazität bereitzustellen.
  • Wenn Sie Compute-Instanzen erstellen, indem Sie eine On-Demand-Reservierung oder eine automatisch erstellte vorausschauende Reservierung nutzen, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine die angeforderte Kapazität bereitstellt, sofern in der Reservierung reservierte Kapazität verfügbar ist.
Best-Effort: Wenn Sie Spot-VMs erstellen, versucht Compute Engine, die angeforderte Kapazität bereitzustellen. Best-Effort: Wenn Sie eine Anfrage zur Größenänderung einer MIG erstellen, versucht Compute Engine nach besten Kräften, die Bereitstellung der angeforderten Kapazität zu planen. Sehr hoch Wenn Google Cloud Ihre Reservierungsanfrage genehmigt, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine Ihre reservierte Kapazität zum von Ihnen ausgewählten Liefertermin und zur von Ihnen ausgewählten Lieferzeit bereitstellt. Sie haben während der gesamten Reservierungsdauer exklusiven Zugriff auf die reservierte Kapazität.
Lebensdauer von Compute-Instanzen Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll. Wenn der Maschinentyp, der von der Compute-Instanz verwendet wird, jedoch keine Live-Migration unterstützt, beendet Compute Engine die Compute-Instanz während Host-Wartungsereignissen.

Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:

  • Compute Engine beendet oder löscht die Compute-Instanz, um Kapazität zurückzugewinnen. Dieser Vorgang wird als Unterbrechung bezeichnet.
  • Wenn der Maschinentyp, der von der Compute-Instanz verwendet wird, keine Live-Migration unterstützt, beendet Compute Engine die Compute-Instanz während Hostwartungsereignissen.

Bevor eine Compute-Instanz das Ende ihrer Laufzeit erreicht, haben Sie folgende Möglichkeiten:

  • Compute-Instanz beenden: Wenn Sie Ihre Flex-Start-VM als eigenständige Compute-Instanz oder einzeln in einer MIG erstellt haben, sobald Kapazität verfügbar wurde, können Sie die Compute-Instanzen jederzeit beenden. Sie können keine Flex-Start-VMs beenden, die in einer MIG-Anfrage zur Größenänderung erstellt wurden.
  • Compute-Instanz löschen: Sie können die Compute-Instanz jederzeit löschen.

Wenn eine Compute-Instanz das Ende ihrer Laufzeit erreicht, wird sie entsprechend ihrer Beendigungsaktion von Compute Engine beendet oder gelöscht.

Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:

  • Compute Engine beendet die Compute-Instanz während Hostwartungsereignissen.
  • Die automatisch erstellte Reservierung zur Bereitstellung der angeforderten Kapazität erreicht das Ende des zugesicherten Reservierungszeitraums. Zu diesem Zeitpunkt löscht Compute Engine die Reservierung und beendet oder löscht alle Compute-Instanzen, die die Reservierung nutzen, basierend auf der in ihrer Konfiguration angegebenen Beendigungsaktion.

Nächste Schritte