Visualizza la topologia e lo stato di integrità di tutte le prenotazioni in modalità All Capacity

Puoi recuperare informazioni sulla topologia e sullo stato della capacità in modalità All Capacity utilizzando la console Google Cloud o Google Cloud CLI prima o dopo il provisioning delle sezioni TPU. Puoi anche recuperare la posizione fisica di un'istanza VM TPU tramite l'API Compute Engine Instance o tramite un comando curl dal sistema operativo guest della VM TPU. Le informazioni sulla topologia e sullo stato di integrità a livello di cluster, blocco, blocco secondario, host e VM ti consentono di prendere decisioni di posizionamento in base alla topologia per i tuoi carichi di lavoro, scegliere blocchi o blocchi secondari specifici per il deployment e comprendere la prossimità relativa tra le istanze VM TPU.

Visualizzare la topologia della capacità nella console Google Cloud

Per utilizzare la console Google Cloud per visualizzare i dettagli della prenotazione:

  1. Nella console Google Cloud , utilizza la barra di ricerca per cercare "prenotazioni" e vai alla pagina delle prenotazioni.
  2. Seleziona la scheda Prenotazioni on demand e trova la prenotazione della TPU in modalità All Capacity. Il team dedicato al tuo account ti comunicherà il nome della prenotazione.
  3. Seleziona la prenotazione per visualizzare la pagina dei dettagli.

Per una prenotazione in modalità Tutta la capacità, la modalità operativa è impostata su Tutta la capacità. Viene visualizzato un elenco di blocchi insieme a un riepilogo del loro utilizzo e stato di integrità.

Seleziona un blocco dall'elenco per visualizzare la pagina dei dettagli del blocco. La topologia del blocco viene visualizzata nella sezione Posizione cluster. Questa sezione mostra il nome del cluster, l'ID con hash di un blocco e l'ID con hash di un blocco secondario.

I nomi dei cluster sono univoci a livello globale in tutte le organizzazioni Google. In altre parole, due clienti diversi potrebbero vedere lo stesso nome del cluster. A differenza dei nomi dei cluster, l'ID con hash di blocchi o sottoblocchi è univoco all'interno dei progetti della tua organizzazioneGoogle Cloud .

Puoi selezionare un sottoblocco per visualizzare la pagina dei dettagli del sottoblocco che mostra solo gli host fisici con istanze VM TPU attive. Gli host fisici inutilizzati non vengono visualizzati.

Visualizza la topologia della capacità utilizzando Google Cloud CLI

Puoi utilizzare i comandi Google Cloud CLI list e describe su prenotazioni, blocchi e sottoblocchi per trovare informazioni su topologia e stato della tua capacità.

Puoi utilizzare le informazioni visualizzate dai comandi in questa sezione per determinare la gerarchia della topologia della capacità fisica nella prenotazione.

Descrivere una prenotazione

Puoi utilizzare gcloud compute reservations describe per visualizzare una panoramica della capacità nella prenotazione. Il seguente comando mostra un riepilogo di una prenotazione:

gcloud compute reservations describe RESERVATION_NAME \
   --project=PROJECT_ID \
   --zone=ZONE

Sostituisci quanto segue:

  • RESERVATION_NAME: il nome della prenotazione.
  • PROJECT_ID: il tuo ID progetto.
  • ZONE: la zona in cui si trova la prenotazione.

L'output è simile al seguente:

advancedDeploymentControl:
  reservationOperationalMode: ALL_CAPACITY
aggregateReservation:
  inUseResources:
  - accelerator:
      acceleratorCount: 48
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  reservedResources:
  - accelerator:
      acceleratorCount: 128
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
  workloadType: UNSPECIFIED
creationTimestamp: '2025-11-05T14:16:30.571-08:00'
deleteAtTime: '2026-11-06T08:00:00Z'
deploymentType: DENSE 
enableEmergentMaintenance: false
id: '8873145979824927313'
kind: compute#reservation
linkedCommitments:
- https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud
name: example-reservation
protectionTier: STANDARD
reservationSharingPolicy:
  serviceShareType: ALLOW_ALL
resourceStatus:
  healthInfo:
    degradedBlockCount: 0
    healthStatus: HEALTHY
    healthyBlockCount: 1
  reservationBlockCount: 1
  reservationMaintenance:
    schedulingType: 
schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation
shareSettings:
  projectMap:
    '111111111111':
      projectId: '111111111111'
  shareType: SPECIFIC_PROJECTS
specificReservationRequired: true
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

I seguenti valori dell'output descrivono la prenotazione:

  • advancedDeploymentControl.reservationOperationalMode: la modalità di capacità per la prenotazione
  • aggregateReservation.inUseResources.accelerator.acceleratorCount: il numero di chip TPU in uso
  • aggregateReservation.inUseResources.accelerator.acceleratorType: la versione della TPU
  • reservedResources.accelerator.acceleratorCount: il numero di chip TPU nella prenotazione
  • deploymentType: il tipo di deployment (sarà sempre DENSE per le TPU)
  • reservationSharingPolicy.serviceShareType: il tipo di condivisione del servizio
  • resourceStatus.healthInfo.healthStatus: stato generale della capacità
  • resourceStatus.healthInfo.healthyBlockCount: il numero di blocchi integri nella prenotazione
  • resourceStatus.reservationBlockCount: il numero di blocchi nella prenotazione

Elenco di tutti i blocchi di prenotazioni

Puoi utilizzare il comando gcloud compute reservations blocks list per visualizzare le informazioni su capacità, topologia e stato di tutti i blocchi di una prenotazione.

Ogni blocco, sottoblocco e oggetto host è identificato da un ID hash. L'ID dell'oggetto principale viene visualizzato nei campi della topologia fisica degli oggetti secondari. Puoi utilizzare gli ID hash per creare una visualizzazione gerarchica della topologia della capacità.

gcloud compute reservations blocks list RESERVATION_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Sostituisci quanto segue:

  • RESERVATION_NAME: il nome della prenotazione.
  • PROJECT_ID: il tuo ID progetto.
  • ZONE: la zona in cui si trova la prenotazione.

Il comando mostra il seguente output:

count: 32
creationTimestamp: '2025-11-05T15:00:15.223-08:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 2
  id: '2996501069483632657'
inUseCount: 12
kind: compute#reservationBlock
name: example-reservation-block-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c


count: 128
creationTimestamp: '2025-08-19T18:23:32.825-07:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 4
id: '9a0e671424e45fd480ca172ad7a4e25d'
inUseCount: 64
kind: compute#reservationBlock
name: example-reservation-block-0002
physicalTopology:
  block: 3feffcdeb6434d68bb818a836f75c1b8
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

I seguenti valori dell'output descrivono i blocchi nella prenotazione:

  • count: il numero di host fisici
  • healthInfo.healthStatus: lo stato generale del blocco
  • healthInfo.healthySubblockCount: il numero di blocchi secondari integri nel blocco
  • id: l'ID del blocco
  • inUseCount: il numero di host fisici in uso
  • kind: il tipo di oggetto descritto
  • name: il nome del blocco
  • physicalTopology.block: l'ID blocco
  • physicalTopology.cluster: il cluster in cui si trova il blocco
  • reservationSubBlockCount: il numero di sottoblocchi in questo blocco
  • reservationSubBlockInUseCount: il numero di sottoblocchi in uso

Descrivere un blocco di prenotazioni

Puoi utilizzare il comando gcloud compute reservations blocks describe su un blocco specifico per visualizzare le informazioni relative al blocco specificato.

gcloud compute reservations blocks describe RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Sostituisci quanto segue:

  • RESERVATION_NAME: il nome della prenotazione.
  • BLOCK_NAME: il nome del blocco di prenotazione.
  • PROJECT_ID: il tuo ID progetto.
  • ZONE: la zona in cui si trova la prenotazione.

Questo comando mostra il seguente output:

resource:
  count: 32
  creationTimestamp: '2025-11-05T15:00:15.223-08:00'
  healthInfo:
    degradedSubBlockCount: 0
    healthStatus: HEALTHY
    healthySubBlockCount: 2
  id: '2996501069483632657'
  inUseCount: 12
  kind: compute#reservationBlock
  name: example-reservation-block-0001
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
  reservationMaintenance:
    schedulingType: GROUPED
  reservationSubBlockCount: 2
  reservationSubBlockInUseCount: 1
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

I seguenti valori dell'output descrivono i blocchi nella prenotazione:

  • count: il numero di host nel blocco
  • healthInfo.healthStatus: lo stato generale del blocco
  • healthInfo.healthySubblockCount: il numero di blocchi secondari integri nel blocco
  • id: l'ID del blocco
  • inUseCount: il numero di host in uso
  • kind: il tipo di oggetto descritto
  • name: il nome del blocco
  • physicalTopology.block: l'ID blocco
  • physicalTopology.cluster: il cluster in cui si trova il blocco
  • reservationSubBlockCount: il numero di sottoblocchi in questo blocco
  • reservationSubBlockInUseCount: il numero di sottoblocchi in uso

Elenco di tutti i blocchi secondari di un blocco

Puoi elencare i sottoblocchi in un blocco per visualizzare le informazioni per ogni sottoblocco:

gcloud compute reservations sub-blocks list RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Sostituisci quanto segue:

  • RESERVATION_NAME: il nome della prenotazione.
  • BLOCK_NAME: il nome del blocco di prenotazione.
  • PROJECT_ID: il tuo ID progetto.
  • ZONE: la zona in cui si trova la prenotazione.

Questo comando mostra le seguenti informazioni:

count: 16
creationTimestamp: '2025-11-05T15:00:16.738-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '8309376980435233263'
inUseCount: 0
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: a0122935eb54d02750b65eef2d4f0366
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
---
count: 16
creationTimestamp: '2025-11-05T15:00:16.736-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '5629213080155482607'
inUseCount: 12
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0002
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: 7aca49831e54d32970631524bc060d9c
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

I seguenti valori dell'output descrivono i sottoblocchi nella prenotazione:

  • count: il numero di host
  • healthInfo.degradedInfraCount: lo stato integro dell'Optical Circuit Switch (OCS) di un cubo Ironwood. Se questo valore è 1, indica che l'OCS del cubo Ironwood è degradato. Questo valore non si applica a Trillium
  • healthInfo.healthStatus: lo stato generale del sottoblocco
  • healthInfo.healthyHostCount: il numero di host integri nel sottoblocco
  • id: l'ID del blocco
  • inUseCount: il numero di host in uso
  • kind: il tipo di oggetto descritto
  • name: il nome del sottoblocco
  • physicalTopology.block: l'ID del blocco che contiene questo blocco secondario
  • physicalTopology.cluster: il cluster in cui si trova il blocco
  • physicalTopology.subblock: l'ID del blocco secondario

Descrivere un blocco secondario di prenotazioni

Puoi utilizzare gcloud compute sub-blocks describe per visualizzare informazioni su un sotto-blocco:

gcloud compute reservations sub-blocks describe RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --sub-block-name=SUB_BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Sostituisci quanto segue:

  • RESERVATION_NAME: il nome della prenotazione.
  • BLOCK_NAME: il nome del blocco di prenotazione.
  • SUB_BLOCK_NAME: Il nome del sottoblocco della prenotazione.
  • PROJECT_ID: il tuo ID progetto.
  • ZONE: la zona in cui si trova la prenotazione.

Questo comando mostra le seguenti informazioni:

resource:
  count: 16
  creationTimestamp: '2025-11-05T15:00:16.736-08:00'
  healthInfo:
    degradedHostCount: 0
    degradedInfraCount: 0
    healthStatus: HEALTHY
    healthyHostCount: 16
    healthyInfraCount: 1
  id: '5629213080155482607'
  inUseCount: 12
  kind: compute#reservationSubBlock
  name: example-reservation-block-0001-subblock-0002
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
    subBlock: 7aca49831e54d32970631524bc060d9c
  reservationSubBlockMaintenance:
    schedulingType: GROUPED
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

I seguenti valori dell'output descrivono i sottoblocchi nella prenotazione:

  • count: il numero di host
  • healthInfo.degradedInfraCount: lo stato integro dell'Optical Circuit Switch (OCS) di un cubo Ironwood. Se questo valore è 1, indica che l'OCS del cubo Ironwood è degradato. Questo valore non si applica a Trillium
  • healthInfo.healthStatus: lo stato generale del sottoblocco
  • healthInfo.healthyHostCount: il numero di host integri nel sottoblocco
  • id: l'ID del blocco
  • inUseCount: il numero di host in uso
  • kind: il tipo di oggetto descritto
  • name: il nome del sottoblocco
  • physicalTopology.block: l'ID del blocco che contiene questo blocco secondario
  • physicalTopology.cluster: il cluster in cui si trova il blocco
  • physicalTopology.subblock: l'ID del blocco secondario

Trovare la posizione fisica di un'istanza VM TPU

Una volta eseguito il provisioning degli slice TPU, puoi recuperare la posizione fisica delle tue istanze VM TPU. In questo modo puoi comprendere le distanze relative tra le istanze VM TPU per l'ottimizzazione della pianificazione dei workload.

Puoi trovare la posizione fisica di un'istanza VM TPU utilizzando curl o Google Cloud CLI:

curl

curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology

gcloud

gcloud compute instances describe VM_NAME \
    --format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \
    --zone=ZONE

Sostituisci quanto segue:

  • VM_NAME: il nome della VM TPU.
  • ZONE: la zona in cui si trova la VM TPU.

Entrambi questi comandi mostrano informazioni sul cluster, sul blocco, sul sottoblocco e sull'host della VM TPU specificata:

block: 3feffcdeb6434d68bb818a836f75c1b8
cluster: southamerica-west1-cluster-njga
subblock: cbee689cb721abdb0c7f80a4f2d0c1c7
host: 36b2d9731c1e1cf8594a759c8c4178f0