Bereitstellungsmodelle für Compute Engine-Instanzen

In diesem Dokument werden die Bereitstellungsmodelle für Compute Engine-Instanzen beschrieben.

Wenn Sie eine Instanz erstellen, müssen Sie die Methode definieren, die Sie zum Abrufen der angeforderten Ressourcen verwenden möchten. Diese Methode wird als Bereitstellungsmodell bezeichnet. Jedes Bereitstellungsmodell bestimmt die Verfügbarkeit, Lebensdauer und Preise Ihrer Instanzen. Wenn Sie diese Modelle kennen, können Sie die beste Option für Ihre Arbeitslast auswählen.

Verfügbare Bereitstellungsmodelle

Wenn Sie eine Compute-Instanz erstellen, können Sie eines der folgenden Bereitstellungsmodelle angeben. Wenn Sie kein Bereitstellungsmodell angeben, verwendet Compute Engine standardmäßig das Standardbereitstellungsmodell.

  • Standard

  • Spot

  • Flex-Start

  • Reservierungsgebunden

In der folgenden Tabelle finden Sie einen Vergleich der Anwendungsfälle und Preise für die einzelnen Bereitstellungsmodelle:

Standard Spot Flex-Start Reservierungsgebunden
Zusammenfassung
  • Je nach Ressourcenverfügbarkeit können Sie sofort Instanzen erstellen.
  • Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen.
  • Je nach Ressourcenverfügbarkeit können Sie sofort Instanzen erstellen.
  • Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen. Sie erlauben Compute Engine jedoch auch, Instanzen jederzeit zu beenden oder zu löschen, um Kapazität zurückzugewinnen.
  • Je nach Ressourcenverfügbarkeit können Sie Instanzen innerhalb einer bestimmten Wartezeit erstellen. Bei einer eigenständigen Instanz können Sie eine Wartezeit von bis zu zwei Stunden angeben. Bei einer Anfrage zur Größenänderung einer MIG ist die Wartezeit unbegrenzt.
  • Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen. Sie können sie jedoch nicht sperren oder neu erstellen. Instanzen werden mindestens 10 Minuten und maximal 7 Tage ausgeführt. Wenn die Instanzen das Ende ihrer Laufzeit erreichen, werden sie entsprechend ihrer Beendigungsaktion von Compute Engine beendet oder gelöscht.
  • Sie können eine Reservierung von Kapazität für ein zukünftiges Datum anfordern, um Instanzen mit angehängten GPUs zu erstellen. Wenn Google Cloud Ihre Anfrage genehmigt, erstellt Compute Engine eine Reservierung. Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie GPU-Instanzen erstellen, die der Reservierung entsprechen.
  • Während des genehmigten Reservierungszeitraums können Sie Instanzen nach Bedarf beenden, neu starten, löschen und neu erstellen, um die Reservierung zu nutzen. Wenn der Reservierungszeitraum endet, löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen, entsprechend ihrer Beendigungsaktion.
Anwendungsfälle

Ideal für Arbeitslasten, die Stabilität und kontinuierlichen Betrieb erfordern, z. B. die folgenden Arbeitslasten:

  • Webserver
  • Datenbanken
  • Unternehmensanwendungen
  • Entwicklung und Tests

Ideal für Arbeitslasten, die Unterbrechungen tolerieren können, z. B. die folgenden:

  • Batchverarbeitung
  • Hochleistungs-Computing (HPC)
  • Continuous Integration und Continuous Deployment (CI/CD)
  • Datenanalyse
  • Medien-Codierung
  • Onlineinferenz

Arbeitslasten, die Stabilität erfordern und nicht länger als sieben Tage ausgeführt werden müssen, z. B. die folgenden Arbeitslasten:

  • Vortraining kleiner Modelle
  • Modellabstimmung
  • HPC-Simulation
  • Batchinferenz

Ideal für Arbeitslasten, die Stabilität und eine bestimmte Laufzeit erfordern, z. B.:

  • Für Arbeitslasten, die bis zu 90 Tage dauern:

    • Jobs zum Vortrainieren von Modellen
    • Jobs zur Modellabstimmung
    • HPC-Simulationsarbeitslasten
    • Kurzfristig erwartete Steigerungen der Inferenz-Arbeitslast
  • Für Arbeitslasten, die länger als 90 Tage dauern:

    • Trainingsarbeitslasten
    • Inferenzarbeitslasten
Preise
  • Für Instanzen fallen Standardpreise an. Weitere Informationen finden Sie unter Preise für VM-Instanzen.
  • Die Kosten richten sich nach der Methode, die Sie zum Erstellen von Instanzen verwenden:

    • Wenn Sie sofort Instanzen erstellen, zahlen Sie nutzungsbasiert (Pay as you go, PAYG).
    • Wenn Sie Instanzen mit einer On-Demand-Reservierung oder einer automatisch erstellten Reservierung für eine vorausschauende Reservierung erstellen, werden Ihnen Gebühren berechnet, solange die Reservierung besteht. Weitere Informationen finden Sie unter Reservierungsabrechnung.
  • Sie erhalten Rabatte von bis zu 91% für viele Maschinentypen, GPUs, TPUs und lokale SSDs. Weitere Informationen finden Sie unter Preise für Spot-VMs.
  • Sie zahlen nach dem PAYG-Modell.
  • Je nach Maschinenserie, die Ihre Instanzen verwenden, erhalten Sie einen Rabatt:

    • Für die Maschinenreihen A4, A3 und A2 erhalten Sie 53% Rabatt auf vCPUs, Arbeitsspeicher und GPUs.
    • Für die H4D-Maschinenserie erhalten Sie einen Rabatt von 25% auf vCPUs und Arbeitsspeicher.
    Andere unterstützte Maschinenserien sind nicht für Rabatte berechtigt. Weitere Informationen finden Sie unter Preise für den Dynamic Workload Scheduler (DWS).
  • Sie zahlen nach dem PAYG-Modell.
Kontingent Wenn Sie eine Instanz erstellen, wird das Standardkontingent verbraucht. Wenn Sie eine Instanz erstellen, wird Kontingent für Instanzen auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet. Google Cloud Guthaben für die kostenlose Stufe gilt nicht für Spot-VMs. Wenn die MIG der Gruppe Instanzen hinzufügt, wird das Kontingent für Instanzen auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet. Das Kontingent gilt nicht für das reservierungsgebundene Bereitstellungsmodell.

Verfügbarkeit und Lebensdauer von Instanzen

In der folgenden Tabelle sehen Sie die Verfügbarkeit und Lebensdauer von Compute-Instanzen für die einzelnen Bereitstellungsmodelle:

Standard Spot Flex-Start Reservierungsgebunden
Voraussetzungen für die Erstellung Es gibt keine Voraussetzungen für die Erstellung. Es gibt keine Voraussetzungen für die Erstellung. Es gibt keine Voraussetzungen für die Erstellung.

Wenn Sie Instanzen erstellen möchten, müssen Sie zuerst Kapazität mit einer der folgenden Methoden reservieren:

Zum von Ihnen ausgewählten Lieferdatum und zur ausgewählten Lieferzeit stellt Compute Engine die angeforderte Kapazität bereit. Anschließend können Sie die Kapazität nutzen, indem Sie Instanzen erstellen.

Unterstützte Maschinenserien Sie können jede Maschinenreihe verwenden, mit Ausnahme von A4X, A4 und A3 Ultra. Sie können jede Maschinenserie verwenden, mit Ausnahme von A4X-, X4- und Bare-Metal-Instanzen.

Sie können nur die folgenden Maschinenserien verwenden:

Je nachdem, wie Sie Kapazität zum Erstellen von VMs reservieren, können Sie nur die folgenden Maschinenserien verwenden:

Instanzverfügbarkeit Sie können jederzeit Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind. Sie können jederzeit Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind.

So erstellen Sie Instanzen:

Compute Engine verwendet DWS, um die Bereitstellung der angeforderten Kapazität basierend auf der Ressourcenverfügbarkeit zu planen. Mit DWS können Sie stark nachgefragte Ressourcen wie GPUs erhalten.

Sie können Instanzen erst erstellen, nachdem Sie Kapazität für ein zukünftiges Datum reserviert haben. Am gewünschten Datum stellt Compute Engine die angeforderte Kapazität bereit, mit der Sie dann Instanzen erstellen können. Wenn Sie Ressourcen mit vorausschauenden Reservierungen im Kalendermodus reservieren, verwendet Compute Engine DWS, um die angeforderte Kapazität bereitzustellen. Mit DWS können Sie stark nachgefragte Ressourcen wie GPUs erhalten.
Kapazitätsgarantie Basierend auf der Erstellungsmethode Die Kapazitätsgarantie variiert je nach Methode, mit der Sie Instanzen erstellen, wie folgt:
  • Wenn Sie sofort Instanzen erstellen, versucht Compute Engine nach besten Kräften, die angeforderte Kapazität bereitzustellen.
  • Wenn Sie Instanzen erstellen, indem Sie eine On-Demand-Reservierung oder eine automatisch erstellte Reservierung für eine zukünftige Reservierung nutzen, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine die angeforderte Kapazität bereitstellt, sofern in der Reservierung reservierte Kapazität verfügbar ist.
Best-Effort Wenn Sie Spot-VMs erstellen, versucht Compute Engine, die angeforderte Kapazität bereitzustellen. Best-Effort Wenn Sie eine Anfrage zur Größenänderung einer MIG erstellen, versucht Compute Engine, die Bereitstellung der angeforderten Kapazität zu planen. Sehr hoch. Wenn Google Cloud Ihre Reservierungsanfrage genehmigt, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine Ihre reservierte Kapazität zum von Ihnen ausgewählten Lieferdatum und zur von Ihnen ausgewählten Lieferzeit bereitstellt. Sie haben während des Reservierungszeitraums exklusiven Zugriff auf die reservierte Kapazität.
Lebensdauer von Instanzen Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll. Wenn der Maschinentyp, den die Instanz verwendet, die Live-Migration nicht unterstützt, beendet Compute Engine die Instanz während Hostwartungsereignissen.

Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:

  • Compute Engine beendet oder löscht die Instanz, um Kapazität zurückzugewinnen. Dieser Vorgang wird als Unterbrechung bezeichnet.
  • Wenn der Maschinentyp, den die Instanz verwendet, die Live-Migration nicht unterstützt, beendet Compute Engine die Instanz während Hostwartungsereignissen.

Bevor eine Instanz das Ende ihrer Laufzeit erreicht, können Sie Folgendes tun:

  • Instanz beenden: Sie können die Instanz jederzeit beenden, wenn sie als eigenständige Instanz erstellt wurde.
  • Instanz löschen: Sie können die Instanz jederzeit löschen.

Wenn eine Instanz das Ende ihrer Laufzeit erreicht, wird sie von Compute Engine gelöscht.

Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:

  • Compute Engine beendet die Instanz während Hostwartungsereignissen.
  • Die automatisch erstellte Reservierung zur Bereitstellung der angeforderten Kapazität erreicht das Ende des zugesicherten Reservierungszeitraums. Zu diesem Zeitpunkt löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen, basierend auf der in ihrer Konfiguration angegebenen Beendigungsaktion.

Modelle für dichte Bereitstellungen bereitstellen

Wenn Sie Arbeitslasten aus den Bereichen Hochleistungs-Computing (HPC), künstliche Intelligenz (KI) und maschinelles Lernen (ML) auf Google Cloudbereitstellen möchten, müssen die Rechenressourcen physisch nah beieinander sein, um die Anzahl der Netzwerk-Hops zu minimieren und die niedrigste Latenz zu optimieren. Compute Engine bietet Bereitstellungsmethoden, mit denen Sie eng gekoppelte Gruppen von Hosts reservieren können, die über ein Hochgeschwindigkeitsnetzwerk in einem einzelnen Rechenzentrum miteinander verbunden sind.

Weitere Informationen zu Bereitstellungsmethoden für dichte Bereitstellungen finden Sie hier:

Nächste Schritte