Kapazität – Übersicht

AI Hypercomputer unterstützt mehrere Nutzungsoptionen , mit denen Sie Rechenressourcen erhalten und verwenden können. In diesem Dokument finden Sie eine Übersicht darüber, wie Sie für jede Nutzungsoption Kapazität erhalten.

Kapazität erhalten

In der folgenden Tabelle wird beschrieben, wie Sie für jede Nutzungsoption Kapazität erhalten.

Nutzungsoption Prozess zum Erhalten von Kapazität Auswirkungen auf den Preis
Vorausschauende Reservierungen in AI Hypercomputer

So erhalten Sie Ressourcen für vorausschauende Reservierungen:

  1. Reservieren Sie Kapazität indem Sie sich an Ihr Accountteam wenden.
  2. Das Kontingent wird automatisch erhöht, bevor die Kapazität bereitgestellt wird. Sie müssen deshalb nichts unternehmen.
  3. Wenn Sie eine Compute Engine-Instanz oder einen Cluster erstellen, geben Sie das an die Reservierung gebundene Bereitstellungsmodell an. Compute-Instanzen und -Cluster werden aus Ihrer reservierten Kapazität bereitgestellt.
Ihnen werden die Kosten für den gesamten Reservierungszeitraum in Rechnung gestellt, unabhängig davon, ob Sie die reservierten Ressourcen für den gesamten Zeitraum nutzen. Weitere Informationen finden Sie im Abschnitt zur Abrechnung von Reservierungen in der Dokumentation zu Compute Engine-Reservierungen.
Vorausschauende Reservierungen für weniger als 90 Tage (im Kalendermodus)

So erhalten Sie Ressourcen für vorausschauende Reservierungen:

  1. Suchen Sie nach verfügbarer Kapazität und reservieren Sie Ressourcen über die Google Cloud Console, die gcloud CLI oder die Compute Engine API.
  2. Es wird kein Kontingent in Rechnung gestellt und Sie müssen nichts unternehmen.
  3. Wenn Sie eine Compute-Instanz oder einen Cluster erstellen, müssen Sie das an die Reservierung gebundene Bereitstellungsmodell angeben. Compute-Instanzen und -Cluster werden aus Ihrer reservierten Kapazität bereitgestellt.
Ihnen werden die Kosten für den gesamten Reservierungszeitraum in Rechnung gestellt, unabhängig davon, ob Sie die reservierten Ressourcen für den gesamten Zeitraum nutzen. Weitere Informationen finden Sie unter Preise für Dynamic Workload Scheduler.
Flex-Start

Für diese Nutzungsoption ist keine Reservierung erforderlich. So erhalten Sie Flex-Start-Ressourcen:

  1. Sie müssen ein Kontingent auf Abruf für den GPU Maschinentyp anfordern, den Sie verwenden möchten.
  2. Wenn Sie Compute-Instanzen oder -Cluster mit einer der folgenden Optionen erstellen, geben Sie das Bereitstellungsmodell „Flex-Start“ an:

    Wenn die angeforderte Kapazität verfügbar wird, stellt Compute Engine sie bereit. Sie erhalten Ressourcen für bis zu sieben Tage.

Ihnen werden die Kosten in Rechnung gestellt, wenn die Ressourcen verwendet werden. Für Ressourcen, die mit Flex-Start bereitgestellt werden, werden automatisch Rabatte über die Preise für Dynamic Workload Scheduler gewährt.
Spot

Für diese Nutzungsoption ist keine Reservierung erforderlich. So erhalten Sie Spot-Ressourcen:

  1. Sie müssen ein Kontingent auf Abruf für den GPU Maschinentyp anfordern, den Sie verwenden möchten.
  2. Wenn Sie eine Compute-Instanz oder einen Cluster erstellen, geben Sie das Bereitstellungsmodell „Spot“ an. Ressourcen werden für Sie bereitgestellt, sobald Kapazität verfügbar ist. Sie können jedoch jederzeit vorzeitig beendet werden.
Ihnen werden die Kosten in Rechnung gestellt, wenn die Ressourcen verwendet werden. Für Spot-VMs werden automatisch Rabatte über die Preise für Spot-VMs gewährt.