Nichtflüchtige Ressourcen

Eine nichtflüchtige Vertex AI-Ressource ist ein lang andauernder Cluster, den Sie zum Ausführen serverloser Vertex AI-Trainingsjobs erstellen können. Nach Abschluss eines Trainingsjobs bleibt die nichtflüchtige Ressource verfügbar, um andere Trainingsjobs auszuführen, bis Sie sie löschen. Sie können nichtflüchtige Ressourcen verwenden, um die Verfügbarkeit der Computing-Ressource zu sichern und die Startzeit des Jobs zu reduzieren, die andernfalls für die Erstellung von Computing-Ressourcen erforderlich ist. Dauerhafte Ressourcen unterstützen alle VMs und GPUs, die von serverlosen Trainingsjobs unterstützt werden. Auf dieser Seite wird erläutert, wann Sie eine dauerhafte Ressource verwenden sollten. Außerdem finden Sie hier Informationen zur Abrechnung und zum Kontingent.

Wann eine nichtflüchtige Ressource verwendet werden sollte

Wir empfehlen in folgenden Szenarien nichtflüchtige Ressourcen:

  • Sie möchten die Kapazitätsverfügbarkeit für kritische ML-Arbeitslasten oder während Spitzenzeiten sichern. Im Gegensatz zu benutzerdefinierten Jobs, bei denen der Trainingsdienst die Ressource nach Abschluss des Jobs freigibt, bleibt eine nichtflüchtige Ressource bis zum Löschen verfügbar.
  • Sie senden denselben Job mehrmals und können von Daten- und Bild-Caching profitieren, indem Sie die Jobs auf derselben persistenten Ressource ausführen.
  • Sie führen viele kurzlebige Trainingsjobs aus, bei denen die tatsächliche Trainingszeit kürzer als die Startzeit des Jobs ist.

Weitere Informationen dazu, wann und warum eine persistente Ressource verwendet werden sollte, finden Sie im Blogpost Für Kapazitätszusicherung und schnellere Startzeiten in Vertex AI Training sorgen.

Zahlungsinformationen

Ihnen wird die gesamte Dauer, in der sich eine nichtflüchtige Ressource im Ausführungsmodus befindet, in Rechnung gestellt, unabhängig davon, ob in der nichtflüchtigen Ressource ein Job ausgeführt wird oder nicht. Die einzelnen Instanzen im Pool nichtflüchtiger Ressourcen werden nach Kernstunde abgerechnet. Jobs, die auf einer persistenten Ressource ausgeführt werden, werden nicht separat in Rechnung gestellt. Ihnen wird nur die dauerhafte Ressource in Rechnung gestellt.

Wenn Sie Autoscaling für Ihre dauerhafte Ressource einrichten, zahlen Sie nur für die bereitgestellten Instanzen. Wenn min-replica-count beispielsweise auf 4 festgelegt ist, werden immer 4-Instanzen bereitgestellt. Dies ist dann der Mindestbetrag, der Ihnen in Rechnung gestellt wird. Wenn Ihre Arbeitslast zunimmt, kann der Ressourcenpool auf bis zu 6 skaliert werden, um der erhöhten Nachfrage gerecht zu werden. Ihnen werden dann die 6 bereitgestellten Instanzen in Rechnung gestellt, bis Ihr Ressourcenpool wieder verkleinert wird. Verwenden Sie das Autoscaling für Ihre nichtflüchtige Ressource oder löschen Sie sie, wenn Sie sie nicht mehr benötigen, um nicht für inaktive Knoten zu zahlen. Weitere Informationen zu den Preisen finden Sie im Abschnitt Benutzerdefinierte Modelle auf der Vertex AI-Preisseite.

Kontingente

Für persistente Ressourcen wird Ihr Trainingskontingent verwendet. Prüfen Sie daher, ob Sie genügend Kontingent für die Erstellung persistenter Ressourcen haben. Weitere Informationen zu Kontingenten finden Sie unter Trainingskontingente und -limits.

Nächste Schritte