Bereitstellungsmodelle für Compute Engine-Instanzen

Wenn Sie eine Compute Engine-Instanz erstellen, müssen Sie die Methode definieren, die Sie zum Abrufen der angeforderten Ressourcen verwenden möchten. Diese Methode wird als Bereitstellungsmodell bezeichnet. Jedes Bereitstellungsmodell bestimmt die Verfügbarkeit, Lebensdauer und Preise Ihrer Compute-Instanzen.

In diesem Dokument werden die verschiedenen Bereitstellungsmodelle beschrieben, die Sie beim Erstellen von Compute-Instanzen angeben können. Wenn Sie diese Modelle kennen, können Sie die beste Option für Ihre Arbeitslast auswählen.

Verfügbare Bereitstellungsmodelle

Wenn Sie eine Compute-Instanz erstellen, können Sie eines der folgenden Bereitstellungsmodelle angeben. Wenn Sie kein Bereitstellungsmodell angeben, verwendet Compute Engine standardmäßig das Standardbereitstellungsmodell.

  • Standard

  • Spot

  • Flex-Start

  • Reservierungsgebunden

In der folgenden Tabelle finden Sie einen Vergleich der Anwendungsfälle und Preise für die einzelnen Bereitstellungsmodelle:

Standard Spot Flex-Start Reservierungsgebunden
Zusammenfassung
  • Je nach Ressourcenverfügbarkeit können Sie sofort Recheninstanzen erstellen.
  • Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen.
  • Je nach Ressourcenverfügbarkeit können Sie sofort Recheninstanzen erstellen.
  • Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen. Sie erlauben Compute Engine jedoch auch, Compute-Instanzen jederzeit zu beenden oder zu löschen, um Kapazitäten zurückzugewinnen.
  • Je nach Ressourcenverfügbarkeit können Sie Compute-Instanzen innerhalb einer bestimmten Wartezeit erstellen. Bei einer eigenständigen Flex-Start-VM können Sie eine Wartezeit von bis zu zwei Stunden angeben. Bei einer Anfrage zur Größenänderung einer MIG ist die Wartezeit unbegrenzt.
  • Sie können festlegen, wann Compute-Instanzen beendet oder gelöscht werden sollen. Sie können sie jedoch nicht sperren oder neu erstellen. Compute-Instanzen werden mindestens 10 Minuten und maximal 7 Tage ausgeführt. Wenn die Compute-Instanzen das Ende ihrer Laufzeit erreichen, werden sie entsprechend ihrer Beendigungsaktion von Compute Engine beendet oder gelöscht.
  • Sie können eine Reservierung von Kapazität für ein zukünftiges Datum anfordern, um Compute-Instanzen zu erstellen. Wenn Google Cloud Ihre Anfrage genehmigt, erstellt Compute Engine eine Reservierung. Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie Compute-Instanzen erstellen, die der Reservierung entsprechen.
  • Während des genehmigten Reservierungszeitraums können Sie Compute-Instanzen beenden, neu starten, löschen und neu erstellen, um die Reservierung nach Bedarf zu nutzen. Wenn der Reservierungszeitraum endet, löscht Compute Engine die Reservierung und beendet oder löscht alle Compute-Instanzen, die die Reservierung nutzen, entsprechend ihrer Beendigungsaktion.
Anwendungsfälle

Ideal für Arbeitslasten, die Stabilität und kontinuierlichen Betrieb erfordern, z. B. die folgenden Arbeitslasten:

  • Webserver
  • Datenbanken
  • Unternehmensanwendungen
  • Entwicklung und Tests

Ideal für Arbeitslasten, die Unterbrechungen tolerieren können, z. B. die folgenden:

  • Batchverarbeitung
  • Hochleistungs-Computing (HPC)
  • Continuous Integration und Continuous Deployment (CI/CD)
  • Datenanalyse
  • Medien-Codierung
  • Onlineinferenz

Arbeitslasten, die Stabilität erfordern und nicht länger als sieben Tage ausgeführt werden müssen, z. B. die folgenden Arbeitslasten:

  • Vortraining kleiner Modelle
  • Modellabstimmung
  • HPC-Simulation
  • Batchinferenz

Ideal für Arbeitslasten, die Stabilität und eine bestimmte Laufzeit erfordern, z. B.:

  • Für Arbeitslasten, die bis zu 90 Tage dauern:

    • Jobs zum Vortrainieren von Modellen
    • Jobs zur Modellabstimmung
    • HPC-Simulationsarbeitslasten
    • Kurzfristig erwartete Steigerungen der Inferenz-Arbeitslast
  • Für Arbeitslasten, die länger als 90 Tage dauern:

    • Trainingsarbeitslasten
    • Inferenzarbeitslasten
Ressourcenzuweisung Best-Effort Compute Engine platziert Ressourcen nach Best-Effort-Prinzip physisch nah beieinander. Um die Platzierung zu steuern, können Sie optional Platzierungsrichtlinien verwenden. Best-Effort Compute Engine platziert Ressourcen nach Best-Effort-Prinzip physisch nah beieinander. Um die Platzierung zu steuern, können Sie optional Platzierungsrichtlinien verwenden.

Die Ressourcenzuweisung hängt davon ab, wie Sie Compute-Instanzen erstellen:

  • Best-Effort Wenn Sie eigenständige Flex-Start-VMs erstellen, platziert Compute Engine die Ressourcen nach Möglichkeit physisch nahe beieinander. Um die Platzierung zu steuern, können Sie optional Platzierungsrichtlinien verwenden.
  • Dicht: Wenn Sie Flex-Start-VMs über Anfragen zum Ändern der Größe von MIGs erstellen, platziert Compute Engine Ressourcen physisch auf eng gekoppelten Hosts, die über ein Hochgeschwindigkeitsnetzwerk verbunden sind, um die Netzwerklatenz zu minimieren.
Dicht: In Compute Engine werden Ressourcen physisch auf eng gekoppelten Hosts platziert, die über ein Hochgeschwindigkeitsnetzwerk verbunden sind, um die Netzwerklatenz zu minimieren.
Preise
  • Für Compute-Instanzen fallen Standardpreise an. Weitere Informationen finden Sie unter Preise für VM-Instanzen.
  • Die Gebühren richten sich nach der Methode, mit der Sie Compute-Instanzen erstellen:

    • Wenn Sie sofort Compute-Instanzen erstellen, zahlen Sie nutzungsabhängig (Pay-as-you-go, PAYG).
    • Wenn Sie Compute-Instanzen mit einer On-Demand-Reservierung oder einer automatisch erstellten Reservierung für eine vorausschauende Reservierung erstellen, werden Ihnen Gebühren berechnet, solange die Reservierung besteht. Weitere Informationen finden Sie unter Reservierungsabrechnung.
  • Sie erhalten Rabatte von bis zu 91% für viele Maschinentypen, GPUs, TPUs und lokale SSDs. Weitere Informationen finden Sie unter Preise für Spot-VMs.
  • Sie zahlen nach dem PAYG-Modell.
  • Je nach Maschinenserie, die von Ihren Compute-Instanzen verwendet wird, erhalten Sie einen Rabatt:

    • Für die Maschinenreihen A4, A3 und A2 erhalten Sie einen Rabatt von 53% für vCPUs, Arbeitsspeicher und GPUs.
    • Für die H4D-Maschinenserie erhalten Sie einen Rabatt von 25% für vCPUs und Arbeitsspeicher.
    Andere unterstützte Maschinenserien sind nicht für Rabatte berechtigt. Weitere Informationen finden Sie unter Dynamic Workload Scheduler (DWS) – Preise.
  • Sie zahlen nach dem PAYG-Modell.
Kontingent Wenn Sie eine Compute-Instanz erstellen, wird das Standardkontingent verwendet. Wenn Sie eine Compute-Instanz erstellen, wird Kontingent für Instanzen auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet. Google Cloud Guthaben für die kostenlose Stufe gilt nicht für Spot-VMs. Wenn der MIG Recheninstanzen zur Gruppe hinzufügt, wird das Kontingent für Instanzen auf Abruf genutzt. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet. Das Kontingent gilt nicht für das reservierungsgebundene Bereitstellungsmodell. Sie benötigen jedoch weiterhin Kontingent für die Ressourcen, die nicht Teil Ihrer reservierten Kapazität sind, z. B. für Laufwerke und IP-Adressen.

Verfügbarkeit und Lebensdauer von Compute-Instanzen

In der folgenden Tabelle sehen Sie die Verfügbarkeit und Lebensdauer von Compute-Instanzen für die einzelnen Bereitstellungsmodelle:

Standard Spot Flex-Start Reservierungsgebunden
Voraussetzungen für die Erstellung Keine Voraussetzungen für die Erstellung. Keine Voraussetzungen für die Erstellung. Keine Voraussetzungen für die Erstellung.

Wenn Sie Compute-Instanzen erstellen möchten, müssen Sie zuerst Kapazität mit einer der folgenden Methoden reservieren:

Zum von Ihnen ausgewählten Lieferdatum und zur ausgewählten Lieferzeit stellt Compute Engine die angeforderte Kapazität bereit. Anschließend können Sie die Kapazität nutzen, indem Sie Compute-Instanzen erstellen.

Unterstützte Maschinenserien Sie können jede Maschinenreihe verwenden, mit Ausnahme von A4X Max, A4X, A4 und A3 Ultra. Sie können jede Maschinenserie verwenden, mit Ausnahme von A4X-Instanzen und Bare-Metal-Instanzen (A4X Max, C4D, C4, C3, X4 und Z3).

Sie können nur die folgenden Maschinenserien verwenden:

Je nachdem, wie Sie Kapazität zum Erstellen von VMs reservieren, können Sie nur die folgenden Maschinenserien verwenden:

Verfügbarkeit von Compute-Instanzen Sie können jederzeit Compute-Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind. Sie können jederzeit Compute-Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind.

Sie können Compute-Instanzen so erstellen:

Compute Engine verwendet DWS, um die Bereitstellung der angeforderten Kapazität basierend auf der Ressourcenverfügbarkeit zu planen. DWS hilft Ihnen, stark nachgefragte Ressourcen wie GPUs zu erhalten.

Sie können Compute-Instanzen erst erstellen, nachdem Sie Kapazität für ein zukünftiges Datum reserviert haben. Am gewünschten Datum stellt Compute Engine die angeforderte Kapazität bereit, mit der Sie dann Compute-Instanzen erstellen können. Wenn Sie Ressourcen mit vorausschauenden Reservierungen im Kalendermodus reservieren, verwendet Compute Engine DWS, um die angeforderte Kapazität bereitzustellen. DWS hilft Ihnen, stark nachgefragte Ressourcen wie GPUs zu erhalten.
Kapazitätsgarantie Basierend auf der Erstellungsmethode Die Kapazitätsgarantie variiert je nach Methode, mit der Sie Compute-Instanzen erstellen, wie folgt:
  • Wenn Sie sofort Compute-Instanzen erstellen, versucht Compute Engine nach Best-Effort-Prinzip, die angeforderte Kapazität bereitzustellen.
  • Wenn Sie Compute-Instanzen erstellen, indem Sie eine On-Demand-Reservierung oder eine automatisch erstellte Reservierung für eine vorausschauende Reservierung nutzen, ist es sehr wahrscheinlich, dass Compute Engine die angeforderte Kapazität bereitstellt, sofern in der Reservierung reservierte Kapazität verfügbar ist.
Best-Effort Wenn Sie Spot-VMs erstellen, versucht Compute Engine, die angeforderte Kapazität bereitzustellen. Best-Effort Wenn Sie eine Anfrage zur Größenänderung einer MIG erstellen, versucht Compute Engine, die Bereitstellung der angeforderten Kapazität zu planen. Sehr hoch Wenn Google Cloud Ihre Reservierungsanfrage genehmigt, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine Ihre reservierte Kapazität zum von Ihnen ausgewählten Lieferdatum und zur von Ihnen ausgewählten Lieferzeit bereitstellt. Sie haben während des Reservierungszeitraums exklusiven Zugriff auf die reservierte Kapazität.
Lebensdauer von Compute-Instanzen Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll. Wenn der Maschinentyp, der von der Compute-Instanz verwendet wird, die Live-Migration nicht unterstützt, wird die Compute-Instanz von Compute Engine während Host-Wartungsereignissen beendet.

Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:

  • Compute Engine beendet oder löscht die Compute-Instanz, um Kapazität zurückzugewinnen. Dieser Vorgang wird als Unterbrechung bezeichnet.
  • Wenn der Maschinentyp, der von der Compute-Instanz verwendet wird, keine Live-Migration unterstützt, beendet Compute Engine die Compute-Instanz während Hostwartungsereignissen.

Bevor eine Compute-Instanz das Ende ihrer Laufzeit erreicht, haben Sie folgende Möglichkeiten:

  • Compute-Instanz beenden: Sie können die Compute-Instanz jederzeit beenden, sofern sie als eigenständige Compute-Instanz erstellt wurde.
  • Compute-Instanz löschen: Sie können die Compute-Instanz jederzeit löschen.

Wenn eine Compute-Instanz das Ende ihrer Laufzeit erreicht, wird sie von Compute Engine gelöscht.

Sie können festlegen, wann eine Compute-Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:

  • Compute Engine beendet die Compute-Instanz während Hostwartungsereignissen.
  • Die automatisch erstellte Reservierung zur Bereitstellung der angeforderten Kapazität erreicht das Ende des zugesicherten Reservierungszeitraums. Zu diesem Zeitpunkt löscht Compute Engine die Reservierung und beendet oder löscht alle Compute-Instanzen, die die Reservierung nutzen, basierend auf der in ihrer Konfiguration angegebenen Beendigungsaktion.

Nächste Schritte