TPU-Kapazität im Modus „Alle Kapazitäten“ anfordern
Wenden Sie sich an Ihr Google Cloud Accountteam, um eine Reservierung im Modus „Alle Kapazitäten“ anzufordern.
TPU-Kapazität im Modus „Alle Kapazitäten“ mit optionaler Projektfreigabe anfordern
Wenden Sie sich mit den erforderlichen Informationen an Ihr Accountteam. Ihr Account team erstellt eine zukünftige Reservierung im Entwurfsstatus, die Sie in der Google Cloud Console überprüfen können.
Sie können eine Reservierung anfordern, die für andere Google Cloud Projekte in Ihrer Organisation freigegeben werden kann. Sie können auch eine Reservierung anfordern, die für einen anderen Google Cloud Dienst wie Vertex AI freigegeben werden kann. Geben Sie Ihre Präferenz für die Reservierungsfreigabe als Teil der Informationen an, die Sie Ihrem Accountteam zur Verfügung stellen:
| Attribut | Beschreibung |
|---|---|
| Projektnummer | Die Nummer (nicht die ID) des Projekts, in dem Ihr Accountteam die Anfrage erstellt und Compute Engine die Kapazität bereitstellt. |
| TPU-Generation | Trillium oder Ironwood |
| Zone | Die Zone, in der Sie Kapazität reservieren möchten. |
| Anzahl der Chips | Die Gesamtzahl der zu reservierenden TPU-Chips. |
| Beginn | Die Startzeit des Reservierungszeitraums. |
| Ende | Die Endzeit des Reservierungszeitraums. |
| Name der Reservierung | Der Name der Reservierung, die Compute Engine erstellt, um die reservierte Kapazität bereitzustellen. |
| Automatische Löschung der Reservierung | Gibt an, ob Compute Engine die automatisch erstellte Reservierung am Ende des Reservierungszeitraums automatisch löschen soll. Wenn Sie die Reservierung manuell löschen möchten, müssen Sie sich an Ihr Accountteam wenden. |
| Freigabetyp | Gibt an, ob nur Ihr Projekt die automatisch erstellte Reservierung verwenden kann (LOCAL) oder ob auch andere Projekte die Reservierung verwenden können (SPECIFIC_PROJECTS). Diese Einstellung kann nach dem Senden der Anfrage nicht mehr geändert werden. So geben Sie reservierte
Kapazität für andere Projekte in Ihrer Organisation frei:
|
| Zusicherungsname | Wenn der Reservierungszeitraum ein Jahr oder länger ist, müssen Sie eine ressourcenbasierte Zusicherung kaufen und an die reservierten Ressourcen anhängen. Sie können eine Zusicherung mit einem 1-Jahres oder 3-Jahres-Plan kaufen. Wenn Sie die reservierte Kapazität für andere Projekte freigeben, erhalten diese Projekte nur dann Rabatte, wenn sie dasselbe Cloud-Rechnungskonto wie das Projekt verwenden, in dem Sie Kapazität reservieren. Weitere Informationen finden Sie unter Ressourcenbasierte CUDs projektübergreifend freigeben. |
Die folgenden Attribute sind für Ihre Reservierung im Modus „Alle Kapazitäten“ voreingestellt:
| Attribut | Beschreibung |
|---|---|
| Typ der Wartungsplanung | Gibt an, wie Compute Engine die Hostwartung für die VMs in Ihrem
Cluster plant. TPU Cluster Director unterstützt nur die Option GROUPED. Das bedeutet, dass die Wartung für alle TPU-VMs in einem Unterblock Ihrer Reservierung synchronisiert wird. |
| Betriebsmodus der Reservierung | Gibt an, wie der VM-Wiederherstellungsprozess nach einem Hostfehler oder fehlerhaften Hostbericht verwaltet. Google Cloud TPU Cluster Director unterstützt nur die Option `ALL_CAPACITY` . Das bedeutet, dass Sie den Wartungs- und Wiederherstellungsprozess für eine VM selbst verwalten müssen. Sie haben jedoch vollen Zugriff auf alle Maschinen in Ihrer Reservierung sowie eine detailliertere Kontrolle über Ihre VM-Topologie und Wartung. |
| Art der Bereitstellung | Typ der Kapazitätsbereitstellung. TPU Cluster Director unterstützt nur `DENSE`. |
Entwurf der Kapazitätsreservierung bestätigen
Sie müssen den Entwurf der Reservierung bestätigen, den Ihr Accountteam für Sie erstellt hat, um die TPU Cluster Director-Kapazität in Ihrem Google Cloud Projekt zu erhalten. Folgen Sie der Anleitung unter Entwurf einer Reservierungsanfrage überprüfen und senden, um die Reservierung zu bestätigen.
Status einer Kapazitätsanfrage prüfen
Sie können den Status Ihrer TPU Cluster Director-Kapazitätsanfrage ermitteln. Wenn die Anfrage genehmigt wird, wird die Kapazität zum angeforderten Startzeitpunkt für die angeforderte Dauer zugewiesen. Die Abrechnung beginnt mit dem Startzeitpunkt der Reservierung.
Weitere Informationen finden Sie unter Zukünftige Reservierungen ansehen.
Führen Sie den folgenden Befehl mit der Google Cloud CLI aus, um die Details einer zukünftigen Reservierungsanfrage aufzurufen:
gcloud compute future-reservations describe RESERVATION_NAME \ --zone=ZONE
Ersetzen Sie Folgendes:
- RESERVATION_NAME: der Name Ihrer Reservierungsanfrage.
- ZONE: die Zone, in der Google die Anfrage erstellt hat.
Die Ausgabe sieht etwa so aus:
creationTimestamp: '2025-04-01' kind: compute#FutureReservation name: 'RESERVATION_NAME' aggregateReservations: vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L status: lockTime: 2024-03-01T17:00:00Z procurementStatus: APPROVED timeWindow: endTime: 2025-06-01T17:00:00Z startTime: 2024-05-01T17:00:00Z ...
Vorhandene Kapazitätsanfrage erweitern
Sie können über eine vorhandene Reservierung zusätzliche Kapazität erhalten. Wenn zusätzliche Kapazität hinzugefügt wird, werden alle Reservierungseigenschaften wie Richtlinien zur Reservierungsfreigabe übernommen. Sie können eine CUD mit der zusätzlichen Kapazität anfordern. Die neue CUD verweist auf dieselbe Reservierung. Ihr Accountteam schließt den Vorgang zur Erweiterung der Reservierung für Sie ab.
Reservierungsdetails in der Google Cloud Console ansehen
Sobald Ihre zukünftige Reservierung erfüllt ist, finden Sie sie auf der Google Cloud Console
Seite Reservierung
und können die Details ansehen. Eine TPU-Reservierung mit dem Bereitstellungstyp Dense gibt an, dass es sich um eine TPU Cluster Director-Reservierung handelt.