TPU-Kapazität im Modus „Alle Kapazitäten“ anfordern

Wenden Sie sich an Ihr Google Cloud Accountteam, um eine Reservierung im Modus „Alle Kapazitäten“ anzufordern.

TPU-Kapazität im Modus „Alle Kapazitäten“ mit optionaler Projektfreigabe anfordern

Wenden Sie sich mit den erforderlichen Informationen an Ihr Accountteam. Ihr Account team erstellt eine zukünftige Reservierung im Entwurfsstatus, die Sie in der Google Cloud Console überprüfen können.

Sie können eine Reservierung anfordern, die für andere Google Cloud Projekte in Ihrer Organisation freigegeben werden kann. Sie können auch eine Reservierung anfordern, die für einen anderen Google Cloud Dienst wie Vertex AI freigegeben werden kann. Geben Sie Ihre Präferenz für die Reservierungsfreigabe als Teil der Informationen an, die Sie Ihrem Accountteam zur Verfügung stellen:

Attribut Beschreibung
Projektnummer Die Nummer (nicht die ID) des Projekts, in dem Ihr Accountteam die Anfrage erstellt und Compute Engine die Kapazität bereitstellt.
TPU-Generation Trillium oder Ironwood
Zone Die Zone, in der Sie Kapazität reservieren möchten.
Anzahl der Chips Die Gesamtzahl der zu reservierenden TPU-Chips.
Beginn Die Startzeit des Reservierungszeitraums.
Ende Die Endzeit des Reservierungszeitraums.
Name der Reservierung Der Name der Reservierung, die Compute Engine erstellt, um die reservierte Kapazität bereitzustellen.
Automatische Löschung der Reservierung Gibt an, ob Compute Engine die automatisch erstellte Reservierung am Ende des Reservierungszeitraums automatisch löschen soll. Wenn Sie die Reservierung manuell löschen möchten, müssen Sie sich an Ihr Accountteam wenden.
Freigabetyp Gibt an, ob nur Ihr Projekt die automatisch erstellte Reservierung verwenden kann (LOCAL) oder ob auch andere Projekte die Reservierung verwenden können (SPECIFIC_PROJECTS). Diese Einstellung kann nach dem Senden der Anfrage nicht mehr geändert werden. So geben Sie reservierte Kapazität für andere Projekte in Ihrer Organisation frei:
  1. Prüfen Sie, ob das Projekt, in dem Google die Anfrage erstellt, freigegebene Reservierungen erstellen darf.
  2. Geben Sie die IDs der Projekte an, für die die reservierte Kapazität freigegeben werden soll. Sie können bis zu 100 Projekte in Ihrer Organisation angeben.
Zusicherungsname Wenn der Reservierungszeitraum ein Jahr oder länger ist, müssen Sie eine ressourcenbasierte Zusicherung kaufen und an die reservierten Ressourcen anhängen. Sie können eine Zusicherung mit einem 1-Jahres oder 3-Jahres-Plan kaufen. Wenn Sie die reservierte Kapazität für andere Projekte freigeben, erhalten diese Projekte nur dann Rabatte, wenn sie dasselbe Cloud-Rechnungskonto wie das Projekt verwenden, in dem Sie Kapazität reservieren. Weitere Informationen finden Sie unter Ressourcenbasierte CUDs projektübergreifend freigeben.

Die folgenden Attribute sind für Ihre Reservierung im Modus „Alle Kapazitäten“ voreingestellt:

Attribut Beschreibung
Typ der Wartungsplanung Gibt an, wie Compute Engine die Hostwartung für die VMs in Ihrem Cluster plant. TPU Cluster Director unterstützt nur die Option GROUPED. Das bedeutet, dass die Wartung für alle TPU-VMs in einem Unterblock Ihrer Reservierung synchronisiert wird.
Betriebsmodus der Reservierung Gibt an, wie der VM-Wiederherstellungsprozess nach einem Hostfehler oder fehlerhaften Hostbericht verwaltet. Google Cloud TPU Cluster Director unterstützt nur die Option `ALL_CAPACITY` . Das bedeutet, dass Sie den Wartungs- und Wiederherstellungsprozess für eine VM selbst verwalten müssen. Sie haben jedoch vollen Zugriff auf alle Maschinen in Ihrer Reservierung sowie eine detailliertere Kontrolle über Ihre VM-Topologie und Wartung.
Art der Bereitstellung Typ der Kapazitätsbereitstellung. TPU Cluster Director unterstützt nur `DENSE`.

Entwurf der Kapazitätsreservierung bestätigen

Sie müssen den Entwurf der Reservierung bestätigen, den Ihr Accountteam für Sie erstellt hat, um die TPU Cluster Director-Kapazität in Ihrem Google Cloud Projekt zu erhalten. Folgen Sie der Anleitung unter Entwurf einer Reservierungsanfrage überprüfen und senden, um die Reservierung zu bestätigen.

Status einer Kapazitätsanfrage prüfen

Sie können den Status Ihrer TPU Cluster Director-Kapazitätsanfrage ermitteln. Wenn die Anfrage genehmigt wird, wird die Kapazität zum angeforderten Startzeitpunkt für die angeforderte Dauer zugewiesen. Die Abrechnung beginnt mit dem Startzeitpunkt der Reservierung.

Weitere Informationen finden Sie unter Zukünftige Reservierungen ansehen.

Führen Sie den folgenden Befehl mit der Google Cloud CLI aus, um die Details einer zukünftigen Reservierungsanfrage aufzurufen:

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

Ersetzen Sie Folgendes:

  • RESERVATION_NAME: der Name Ihrer Reservierungsanfrage.
  • ZONE: die Zone, in der Google die Anfrage erstellt hat.

Die Ausgabe sieht etwa so aus:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Vorhandene Kapazitätsanfrage erweitern

Sie können über eine vorhandene Reservierung zusätzliche Kapazität erhalten. Wenn zusätzliche Kapazität hinzugefügt wird, werden alle Reservierungseigenschaften wie Richtlinien zur Reservierungsfreigabe übernommen. Sie können eine CUD mit der zusätzlichen Kapazität anfordern. Die neue CUD verweist auf dieselbe Reservierung. Ihr Accountteam schließt den Vorgang zur Erweiterung der Reservierung für Sie ab.

Reservierungsdetails in der Google Cloud Console ansehen

Sobald Ihre zukünftige Reservierung erfüllt ist, finden Sie sie auf der Google Cloud Console Seite Reservierung und können die Details ansehen. Eine TPU-Reservierung mit dem Bereitstellungstyp Dense gibt an, dass es sich um eine TPU Cluster Director-Reservierung handelt.