Flex-Start-VMs

In diesem Dokument erhalten Sie einen Überblick über Flex-Start-VMs. Es werden die wichtigsten Merkmale sowie die Anforderungen und Einschränkungen beschrieben, die beim Erstellen von Flex-Start-VMs gelten.

Flex-Start-VMs sind Instanzen virtueller Maschinen (VMs), die Sie mit dem Bereitstellungsmodell „Flex-Start“ erstellen. Bei diesem Modell wird der Dynamic Workload Scheduler (DWS) verwendet, um Compute-Ressourcen mit Rabatt aus einem sicheren Kapazitätspool bereitzustellen. So erhöhen sich Ihre Chancen, stark nachgefragte Ressourcen wie GPUs zu erhalten. Nachdem Sie Flex-Start-VMs erstellt haben, versucht Compute Engine, die angeforderten Ressourcen innerhalb eines bestimmten Zeitrahmens zuzuweisen. Wenn die Anfrage erfolgreich ist, werden Ihre Flex-Start-VMs gestartet und bis zu sieben Tage lang ausgeführt.

Für Arbeitslasten, die Ressourcen für länger als sieben Tage oder mit einer höheren Kapazitätsgarantie erfordern, können Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus erstellen, um weiterhin von DWS-Rabatten zu profitieren.

Anwendungsfälle für Flex-Start-VMs

Flex-Start-VMs eignen sich ideal für die Ausführung von Arbeitslasten, die jederzeit gestartet werden können, z. B.:

  • Vortraining kleiner Modelle

  • Modellabstimmung

  • Simulation per Hochleistungs-Computing (HPC)

  • Batchinferenz

Wichtige Merkmale von Flex-Start-VMs

Im Vergleich zu anderen Arten von Compute Engine-Instanzen haben Flex-Start-VMs die folgenden Merkmale:

  • Wartezeit für die Zuweisung von Ressourcen: Sie können Flex-Start-VMs erstellen, bevor Compute Engine die angeforderten Ressourcen zuweisen kann. VMs werden jedoch nur gestartet, wenn Ressourcen innerhalb des angegebenen Zeitraums verfügbar werden. Wenn keine Ressourcen verfügbar sind, schlägt die Anfrage zum Erstellen der VM fehl.

    Weitere Informationen finden Sie in diesem Dokument unter Wartezeit für Flex-Start-VMs.

  • Begrenzte Ausführungsdauer: Flex-Start-VMs werden bis zu sieben Tage lang ohne Unterbrechung ausgeführt. Danach beendet oder löscht Compute Engine die VMs automatisch, je nach der in den VM-Eigenschaften angegebenen Beendigungsaktion.

    Weitere Informationen finden Sie in diesem Dokument unter Begrenzte Laufzeit von Flex-Start-VMs.

  • Zuweisung von VMs durch Compute Engine: Compute Engine versucht, Flex-Start-VMs möglichst nah beieinander zu erstellen, um die Netzwerklatenz zu minimieren. Um die Platzierung Ihrer Flex-Start-VMs zu steuern, können Sie optional Richtlinien für kompakte Platzierung oder Arbeitslastrichtlinien verwenden.

    Weitere Informationen finden Sie in diesem Dokument unter Zuweisung von Flex-Start-VMs.

  • Bereitstellungsmodell „Flex-Start“: Sie erstellen Flex-Start-VMs mit dem Bereitstellungsmodell „Flex-Start“. Dieses Bereitstellungsmodell bietet eine bessere Ressourcenverfügbarkeit und günstigere Preise im Vergleich zu VMs, die Sie mit dem Standardbereitstellungsmodell erstellen.

    Weitere Informationen zu den einzelnen Bereitstellungsmodellen finden Sie unter Bereitstellungsmodelle für Compute Engine-Instanzen.

Wartezeit für Flex-Start-VMs

Wenn Sie eine Flex-Start-VM erstellen, wird sie nicht sofort gestartet. Compute Engine versucht, die angeforderten Ressourcen zuzuweisen und die VM innerhalb eines bestimmten Zeitrahmens zu starten. Wenn Sie über ausreichend Kontingent für die angeforderten Ressourcen verfügen und Compute Engine diese bis zum Ende der Wartezeit zuweist, wird die Flex-Start-VM innerhalb von zwei Minuten nach Verfügbarkeit der Kapazität gestartet. Andernfalls schlägt die Anfrage zur VM-Erstellung fehl.

Die Wartezeit variiert je nach Methode, die Sie zum Erstellen von VMs verwenden:

Wartezeit für eigenständige Flex-Start-VMs

Wenn Sie eine eigenständige Flex-Start-VM erstellen möchten, müssen Sie mit dem Feld requestValidForDuration eine Wartezeit angeben. Sie können eine Wartezeit von 0 Sekunden oder zwischen 90 Sekunden und 7.200 Sekunden (2 Stunden) festlegen.

Basierend auf den zonalen Anforderungen Ihrer Arbeitslast empfehlen wir die folgenden Wartezeiten, um die Wahrscheinlichkeit zu erhöhen, dass Ihre Anfrage zum Erstellen einer Flex-Start-VM erfolgreich ist:

  • Strenge zonale Anforderungen: Wenn für Ihre Arbeitslast eine Flex-Start-VM in einer bestimmten Zone erstellt werden muss, empfehlen wir, das Feld requestValidForDuration auf 90 Sekunden oder mehr (bis zu zwei Stunden) festzulegen. Längere Wartezeiten erhöhen die Wahrscheinlichkeit, dass Sie Ressourcen erhalten. Die VM bleibt während dieser Zeit im Status PENDING.

  • Keine zonalen Anforderungen: Wenn die Flex-Start-VM in einer beliebigen Zone der Region ausgeführt werden kann, empfehlen wir, das Feld requestValidForDuration auf null Sekunden zu setzen. Dieser Wert gibt an, dass Compute Engine Ressourcen nur zuweist, wenn sie sofort verfügbar sind. Wenn Ihre Anfrage fehlschlägt, weil Ressourcen nicht verfügbar sind, versuchen Sie, die Flex-Start-VM in einer anderen Zone zu erstellen.

Wenn Sie eine Anfrage zum Erstellen einer VM stoppen möchten, während Compute Engine versucht, Ressourcen zuzuweisen, löschen Sie die Flex-Start-VM.

MIGs mit Wartezeit für Flex-Start-VMs

Wenn Sie einer verwalteten Instanzgruppe (Managed Instance Group, MIG) VMs mit flexiblem Start hinzufügen, versucht Compute Engine weiterhin, die angeforderten Ressourcen bereitzustellen, bis dies gelingt oder Sie die Anfrage abbrechen. Die Art und Weise, wie Compute Engine VMs zu Ihrer MIG hinzufügt, hängt von der Erstellungsmethode ab:

  • Anfragen zur Größenänderung von MIGs: Compute Engine fügt die angeforderten VMs der MIG auf einmal hinzu, wenn alle Ressourcen verfügbar sind. Wenn Sie VMs nicht vor dem Ende ihrer Laufzeit löschen, werden sie von Compute Engine gleichzeitig gelöscht. Weitere Informationen finden Sie unter Anfragen zur Größenänderung von MIGs.

  • MIGs mit einer Zielgröße: Compute Engine erstellt jede VM einzeln, wenn Kapazität verfügbar wird. Daher kann es sein, dass die MIG anfangs nur einen Teil der angeforderten VMs erstellt und die restlichen VMs später hinzufügt, wenn die Kapazität dies zulässt. Wenn Sie die VMs nicht vor dem Ende ihrer Ausführungsdauer löschen, löscht Compute Engine jede VM relativ zu ihrer eigenen Erstellungszeit. Weitere Informationen finden Sie unter MIG mit Flex-Start-VMs erstellen.

Begrenzte Laufzeit von Flex-Start-VMs

Wenn Sie eine Flex-Start-VM erstellen, müssen Sie Folgendes angeben:

  • Laufzeit der VM: Sie müssen angeben, wie lange die VMs ausgeführt werden dürfen. Die Laufzeit kann bis zu sieben Tage betragen. Wenn Ihre Arbeitslast vor Ablauf der Ausführungsdauer der VMs abgeschlossen ist, können Sie die Standalone-VMs stoppen oder löschen oder die VMs in einer MIG löschen, um unnötige Kosten zu vermeiden.

  • Aktion zum Beenden der VM: Sie müssen auswählen, ob Compute Engine die VMs am Ende ihrer Laufzeit automatisch beendet oder löscht. Für Flex-Start-VMs in einer MIG können Sie nur angeben, dass VMs am Ende ihrer Ausführungsdauer gelöscht werden sollen.

Zuweisung von Flex-Start-VMs

Compute Engine versucht, Ihre Flex-Start-VMs basierend auf der Verfügbarkeit dicht zu erstellen. Diese dichte Platzierung minimiert Netzwerk-Hops und optimiert für niedrige Latenz. Sie ist ideal für Arbeitslasten, die eine ständige VM-Kommunikation erfordern, z. B. KI- oder ML-Arbeitslasten. Wenn Sie die Platzierung Ihrer Flex-Start-VMs steuern möchten, um zu vermeiden, dass sie unerwartet weit voneinander entfernt erstellt werden, gehen Sie so vor:

Kontingent

Wenn Sie eine Flex-Start-VM erstellen oder neu starten möchten, benötigen Sie ein ausreichendes Kontingent für auf Abruf verfügbare Ressourcen für die angeforderten vCPUs, den Arbeitsspeicher und alle angehängten GPUs oder lokalen SSD-Laufwerke.

Wenn Sie versuchen, eine Flex-Start-VM ohne ausreichendes Kontingent zu erstellen oder neu zu starten, passiert Folgendes:

  • Anfragen zur VM-Erstellung: Ihre Anfrage bleibt ausstehend, bis Sie ausreichend Kontingent erhalten. Wenn Sie das erforderliche Kontingent nicht vor Ablauf der Wartezeit erhalten, schlägt Ihre Anfrage fehl.

  • Anfragen zum Neustart von VMs: Ihre Anfrage schlägt sofort fehl.

Preise

Für Flex-Start-VMs fallen Kosten wie folgt an:

  • Sie zahlen nach dem Pay-as-you-go-Modell (PAYG). Weitere Informationen zu den Preisen einer VM während ihres Lebenszyklus finden Sie unter Preise.

  • Für die Maschinentypen A4, A3, A2, G4 und H4D erhalten Sie vCPUs, Arbeitsspeicher und alle angehängten GPUs zu einem reduzierten Preis. Für andere unterstützte beschleunigungsoptimierte Maschinentypen sind keine Rabatte verfügbar. Weitere Informationen finden Sie unter DWS-Preise.

Beschränkungen

In den folgenden Abschnitten werden die Einschränkungen für VMs mit flexiblem Start beschrieben.

Einschränkungen für alle Flex-Start-VMs

Für alle Flex-Start-VMs gelten die folgenden Einschränkungen:

  • Für Flex-Start-VMs können nur die folgenden Maschinentypen verwendet werden:

    • Alle beschleunigungsoptimierten Maschinentypen, mit Ausnahme von A4X Max und A4X

    • H4D-Maschinentypen

  • Sie müssen Flex-Start-VMs mit dem Bereitstellungsmodell „Flex-Start“ erstellen.

  • Sie müssen mit den Feldern instanceTerminationAction und maxRunDuration angeben, ob Flex-Start-VMs am Ende ihrer Ausführungsdauer beendet oder gelöscht werden sollen. Bei MIGs können Sie nur Flex-Start-VMs löschen.

  • Sie müssen Flex-Start-VMs während Hostwartungsereignissen beenden.

  • Sie können Richtlinien für kompakte Platzierung nur auf eigenständige Flex-Start-VMs anwenden.

  • Sie können keine Richtlinien für gestreute Platzierung auf Flex-Start-VMs anwenden.

  • Sie können keine Reservierungen verwenden.

Einschränkungen für verwaltete Instanzgruppen mit Flex-Start-VMs

Für alle MIGs mit Flex-Start-VMs gelten die folgenden Einschränkungen:

Wenn Sie Flex-Start-VMs mithilfe von MIG-Anfragen zur Größenänderung erstellen möchten, lesen Sie die Einschränkungen für MIG-Anfragen zur Größenänderung.

Nächste Schritte

Überzeugen Sie sich selbst

Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie einfach ein Konto, um die Leistungsfähigkeit von Compute Engine in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Compute Engine kostenlos testen