TPU-Kapazität im Modus „All Capacity“ anfordern

Wenden Sie sich an Ihr Google Cloud Account-Management-Team, um eine Reservierung im Modus „Alle Kapazitäten“ anzufordern.

TPU-Kapazität im Modus „Alle Kapazitäten“ mit optionaler Projektfreigabe anfordern

Wenden Sie sich mit den erforderlichen Informationen an Ihr Account-Management-Team. Ihr Kontoteam erstellt eine vorausschauende Reservierung im Entwurfsstatus, die Sie über die Google Cloud -Konsole prüfen können.

Sie können eine Reservierung anfordern, die für andere Google CloudProjekte in Ihrer Organisation freigegeben werden kann. Sie können auch eine Reservierung anfordern, die für einen anderen Google Cloud -Dienst wie Vertex AI freigegeben werden kann. Geben Sie Ihre bevorzugte Aufteilung der Reservierungen im Rahmen der Aufnahmeinformationen an, die Sie Ihrem Kontoteam zur Verfügung stellen:

Attribut Beschreibung
Projektnummer Die Nummer (nicht die ID) des Projekts, in dem Ihr Account-Management-Team die Anfrage erstellt und Compute Engine die Kapazität bereitstellt.
TPU-Generation Trillium oder Ironwood
Zone Die Zone, in der Sie Kapazität reservieren möchten.
Anzahl der Chips Die Gesamtzahl der zu reservierenden TPU-Chips.
Beginn Die Startzeit des Reservierungszeitraums
Ende Endzeit des Reservierungszeitraums
Name der Reservierung Der Name der Reservierung, die von Compute Engine erstellt wird, um die reservierte Kapazität bereitzustellen.
Automatisches Löschen von Reservierungen Gibt an, ob Compute Engine die automatisch erstellte Reservierung am Ende des Reservierungszeitraums automatisch löschen soll. Wenn Sie die Reservierung manuell löschen möchten, müssen Sie sich an Ihr Kontoteam wenden.
Freigabetyp Gibt an, ob nur Ihr Projekt die automatisch erstellte Reservierung verwenden kann (LOCAL) oder ob auch andere Projekte die Reservierung verwenden können (SPECIFIC_PROJECTS). Diese Einstellung kann nach dem Einreichen der Anfrage nicht mehr geändert werden. So geben Sie reservierte Kapazitäten für andere Projekte in Ihrer Organisation frei:
  1. Prüfen Sie, ob das Projekt, in dem Google die Anfrage erstellt, freigegebene Reservierungen erstellen darf.
  2. Geben Sie die IDs der Projekte an, für die Sie die reservierte Kapazität freigeben möchten. Sie können bis zu 100 Projekte in Ihrer Organisation angeben.
Zusicherungsname Wenn Ihr Reservierungszeitraum ein Jahr oder länger ist, müssen Sie eine ressourcenbasierte Zusicherung erwerben und an Ihre reservierten Ressourcen anhängen. Sie können eine Zusicherung mit einem 1-Jahres- oder 3-Jahres-Plan erwerben. Wenn Sie die reservierte Kapazität für andere Projekte freigeben, erhalten diese Projekte nur dann Rabatte, wenn sie dasselbe Cloud-Rechnungskonto wie das Projekt verwenden, in dem Sie die Kapazität reservieren. Weitere Informationen finden Sie unter Ressourcenbasierte CUDs projektübergreifend freigeben.

Die folgenden Attribute sind für Ihre Reservierung im Modus „Alle Kapazitäten“ voreingestellt:

Attribut Beschreibung
Typ der Wartungsplanung Wie Compute Engine die Hostwartung für die VMs in Ihrem Cluster plant. TPU Cluster Director unterstützt nur die Option GROUPED. Das bedeutet, dass die Wartung für alle TPU-VMs in einem Unterblock Ihrer Reservierung synchronisiert wird.
Betriebsmodus für Reservierungen Wie Google Cloud den VM-Wiederherstellungsprozess nach einem Hostfehler oder einem Bericht über einen fehlerhaften Host verwaltet. TPU Cluster Director unterstützt nur die Option `ALL_CAPACITY`. Das bedeutet, dass Sie den Wartungs- und Wiederherstellungsprozess für eine VM selbst verwalten müssen. Sie haben jedoch vollen Zugriff auf alle Maschinen in Ihrer Reservierung sowie eine detailliertere Kontrolle über Ihre VM-Topologie und Wartung.
Art der Bereitstellung Typ der Kapazitätsbereitstellung. TPU Cluster Director unterstützt nur `DENSE`.

Entwurf für Kapazitätsreservierung bestätigen

Sie müssen die Reservierung bestätigen, die Ihr Kontoteam für Sie erstellt, damit Sie die TPU Cluster Director-Kapazität in Ihrem Google Cloud -Projekt erhalten. Folgen Sie der Anleitung unter Entwurf einer Reservierungsanfrage prüfen und senden, um die Reservierung zu bestätigen.

Status einer Kapazitätsanfrage prüfen

Sie können den Status Ihrer Kapazitätsanfrage für TPU Cluster Director ermitteln. Wenn die Anfrage genehmigt wird, wird die Kapazität zum angeforderten Startzeitpunkt für die angeforderte Dauer zugewiesen. Die Abrechnung beginnt mit der Startzeit der Reservierung.

Weitere Informationen finden Sie unter Vorausschauende Reservierungen ansehen.

Führen Sie den folgenden Befehl mit der Google Cloud CLI aus, um die Details einer zukünftigen Reservierungsanfrage aufzurufen:

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

Ersetzen Sie Folgendes:

  • RESERVATION_NAME: der Name Ihrer Reservierungsanfrage.
  • ZONE: die Zone, in der Google die Anfrage erstellt hat.

Die Ausgabe sieht etwa so aus:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Vorhandene Kapazitätsanfrage erweitern

Sie können zusätzliche Kapazität über eine vorhandene Reservierung erhalten. Wenn zusätzliche Kapazität hinzugefügt wird, werden alle Reservierungseigenschaften wie die Richtlinien für die gemeinsame Nutzung von Reservierungen übernommen. Sie können eine CUD mit der zusätzlichen Kapazität anfordern. Die neue CUD verweist auf dieselbe Reservierung. Ihr Kontoteam übernimmt die Erweiterung der Reservierung für Sie.

Reservierungsdetails in der Google Cloud Console ansehen

Sobald Ihre zukünftige Reservierung ausgeführt wurde, finden Sie sie in der Google Cloud Konsole auf der Reservierungsseite und können die Details ansehen. Eine TPU-Reservierung mit dem Bereitstellungstyp Dense gibt an, dass es sich um eine TPU Cluster Director-Reservierung handelt.