Visualiza la topología y el estado de las reservas en el modo All Capacity

Puedes recuperar información sobre la topología y el estado de tu capacidad del modo All Capacity con la consola de Google Cloud o Google Cloud CLI antes o después de aprovisionar porciones de TPU. También puedes recuperar la ubicación física de una instancia de VM de TPU a través de la API de instancias de Compute Engine o con un comando curl desde el SO invitado de la VM de TPU. La información de la topología y el estado en los niveles de clúster, bloque, subbloque, host y VM te permite tomar decisiones de ubicación basadas en la topología para tus cargas de trabajo, segmentar bloques o subbloques específicos para la implementación, y comprender la proximidad relativa entre las instancias de VM de TPU.

Consulta la topología de capacidad en la consola de Google Cloud

Para usar la consola de Google Cloud y ver los detalles de tu reserva, haz lo siguiente:

  1. En la consola de Google Cloud , usa la barra de búsqueda para buscar "reservas" y navega a la página de las reservas.
  2. Selecciona la pestaña Reservas según demanda y busca tu reserva de TPU en el modo All Capacity. Tu equipo de cuentas te indicará el nombre de tu reserva.
  3. Selecciona tu reserva. Se mostrará una página con los detalles de la reserva.

En el caso de una reserva en el modo All Capacity, el Modo operativo se establece en All capacity. Se muestra una lista de los bloques junto con un resumen de su utilización y estado.

Selecciona un bloque de la lista para ver la página de detalles del bloque. La topología del bloque se muestra en la sección Ubicación del clúster. En esta sección, se muestra el nombre del clúster, el ID hash de un bloque y el ID con hash de un subbloque.

Los nombres de los clústeres son únicos a nivel global en todas las organizaciones de Google. En otras palabras, dos clientes diferentes pueden ver el mismo nombre de clúster. A diferencia de los nombres de clústeres, el ID con hash de los bloques o subbloques es único dentro de los proyectos de tu organización deGoogle Cloud .

Puedes seleccionar un subbloque para mostrar la página de detalles del subbloque, que solo muestra los hosts físicos con instancias de VM de TPU activas. No se muestran los hosts físicos sin usar.

Consulta la topología de capacidad con Google Cloud CLI

Puedes usar los comandos list y describe de Google Cloud CLI en las reservas, los bloques y los subbloques para encontrar información sobre la topología y el estado de tu capacidad.

Puedes usar la información que muestran los comandos de esta sección para determinar la jerarquía de la topología de la capacidad física en tu reserva.

Describe una reserva

Puedes usar gcloud compute reservations describe para ver una descripción general de la capacidad de tu reserva. El siguiente comando muestra un resumen de una reserva llamada "example-reservation":

gcloud compute reservations describe example-reservation \
   --project=example-project \
   --zone=us-central1-c

Este comando muestra un resultado similar al siguiente:

advancedDeploymentControl:
  reservationOperationalMode: ALL_CAPACITY
aggregateReservation:
  inUseResources:
  - accelerator:
      acceleratorCount: 48
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  reservedResources:
  - accelerator:
      acceleratorCount: 128
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
  workloadType: UNSPECIFIED
creationTimestamp: '2025-11-05T14:16:30.571-08:00'
deleteAtTime: '2026-11-06T08:00:00Z'
deploymentType: DENSE 
enableEmergentMaintenance: false
id: '8873145979824927313'
kind: compute#reservation
linkedCommitments:
- https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud
name: example-reservation
protectionTier: STANDARD
reservationSharingPolicy:
  serviceShareType: ALLOW_ALL
resourceStatus:
  healthInfo:
    degradedBlockCount: 0
    healthStatus: HEALTHY
    healthyBlockCount: 1
  reservationBlockCount: 1
  reservationMaintenance:
    schedulingType: 
schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation
shareSettings:
  projectMap:
    '111111111111':
      projectId: '111111111111'
  shareType: SPECIFIC_PROJECTS
specificReservationRequired: true
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Los siguientes valores del resultado describen la reserva:

  • advancedDeploymentControl.reservationOperationalMode: el modo de capacidad de la reserva
  • aggregateReservation.inUseResources.accelerator.acceleratorCount: la cantidad de chips TPU en uso
  • aggregateReservation.inUseResources.accelerator.acceleratorType: la versión de la TPU
  • reservedResources.accelerator.acceleratorCount: la cantidad de chips TPU en la reserva
  • deploymentType: el tipo de implementación (siempre será DENSE para las TPU)
  • reservationSharingPolicy.serviceShareType: el tipo de uso compartido del servicio
  • resourceStatus.healthInfo.healthStatus: el estado general de la capacidad
  • resourceStatus.healthInfo.healthyBlockCount: la cantidad de bloques en buen estado en la reserva
  • resourceStatus.reservationBlockCount: la cantidad de bloques en la reserva

Enumera todos los bloques de reserva

Puedes usar el comando gcloud compute reservations blocks list para mostrar información sobre la capacidad, la topología y el estado de todos los bloques en una reserva. En el siguiente ejemplo, la reserva "example-reservation" tiene 2 bloques: "example-reservation-block-0001" y "example-reservation-block-0002". Ambos bloques residen en el clúster "example-cluster".

Cada bloque, subbloque y objeto de host se identifica con un ID de hash. El ID del objeto principal se muestra en los campos de topología física de los objetos secundarios. Puedes usar los IDs de hash para construir una vista de jerarquía de la topología de la capacidad.

gcloud compute reservations blocks list example-reservation \
  --project=example-project \
  --zone=us-central1-c

El comando muestra el siguiente resultado:

count: 32
creationTimestamp: '2025-11-05T15:00:15.223-08:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 2
  id: '2996501069483632657'
inUseCount: 12
kind: compute#reservationBlock
name: example-reservation-block-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c


count: 128
creationTimestamp: '2025-08-19T18:23:32.825-07:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 4
id: '9a0e671424e45fd480ca172ad7a4e25d'
inUseCount: 64
kind: compute#reservationBlock
name: example-reservation-block-0002
physicalTopology:
  block: 3feffcdeb6434d68bb818a836f75c1b8
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Los siguientes valores del resultado describen los bloques de la reserva:

  • count: la cantidad de hosts físicos
  • healthInfo.healthStatus: el estado general del bloque
  • healthInfo.healthySubblockCount: la cantidad de subbloques en buen estado del bloque
  • id: ID del bloque
  • inUseCount: la cantidad de hosts físicos en uso
  • kind: el tipo de objeto que se describe
  • name: el nombre del bloque
  • physicalTopology.block: ID del bloque
  • physicalTopology.cluster: el clúster en el que se encuentra el bloque
  • reservationSubBlockCount: la cantidad de subbloques en este bloque
  • reservationSubBlockInUseCount: la cantidad de subbloques en uso

Describe un bloque de reserva

Puedes usar el comando gcloud compute reservations blocks describe en un bloque específico para mostrar información sobre el bloque que especifiques.

gcloud compute reservations blocks describe example-reservation \
  --block-name=example-reservation-block-0001 \
  --project=example-project \
  --zone=us-central1-c

Este comando muestra el siguiente resultado:

resource:
  count: 32
  creationTimestamp: '2025-11-05T15:00:15.223-08:00'
  healthInfo:
    degradedSubBlockCount: 0
    healthStatus: HEALTHY
    healthySubBlockCount: 2
  id: '2996501069483632657'
  inUseCount: 12
  kind: compute#reservationBlock
  name: example-reservation-block-0001
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
  reservationMaintenance:
    schedulingType: GROUPED
  reservationSubBlockCount: 2
  reservationSubBlockInUseCount: 1
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Los siguientes valores del resultado describen los bloques de la reserva:

  • count: la cantidad de hosts en el bloque
  • healthInfo.healthStatus: el estado general del bloque
  • healthInfo.healthySubblockCount: la cantidad de subbloques en buen estado del bloque
  • id: ID del bloque
  • inUseCount: la cantidad de hosts en uso
  • kind: el tipo de objeto que se describe
  • name: el nombre del bloque
  • physicalTopology.block: ID del bloque
  • physicalTopology.cluster: el clúster en el que se encuentra el bloque
  • reservationSubBlockCount: la cantidad de subbloques en este bloque
  • reservationSubBlockInUseCount: la cantidad de subbloques en uso

Enumera todos los subbloques de un bloque

Puedes enumerar los subbloques de un bloque para mostrar información de cada uno:

gcloud compute reservations sub-blocks list example-reservation \
  --block-name=example-reservation-block-0001 \
  --project=example-project \
  --zone=us-central1-c

Este comando muestra la siguiente información:

count: 16
creationTimestamp: '2025-11-05T15:00:16.738-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '8309376980435233263'
inUseCount: 0
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: a0122935eb54d02750b65eef2d4f0366
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
---
count: 16
creationTimestamp: '2025-11-05T15:00:16.736-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '5629213080155482607'
inUseCount: 12
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0002
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: 7aca49831e54d32970631524bc060d9c
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Los siguientes valores del resultado describen los subbloques de la reserva:

  • count: la cantidad de hosts
  • healthInfo.degradedInfraCount: el estado correcto de un interruptor de circuito óptico (OCS) de un cubo de Ironwood. Si este valor es 1, indica que el OCS del cubo de Ironwood se degradó. Este valor no se aplica a Trillium
  • healthInfo.healthStatus: el estado general del subbloque
  • healthInfo.healthyHostCount: la cantidad de hosts en buen estado en el subbloque
  • id: ID del bloque
  • inUseCount: la cantidad de hosts en uso
  • kind: el tipo de objeto que se describe
  • name: el nombre del subbloque
  • physicalTopology.block: el ID del bloque que contiene este subbloque
  • physicalTopology.cluster: el clúster en el que se encuentra el bloque
  • physicalTopology.subblock: ID del subbloque

Describe un subbloque de reserva

Puedes usar gcloud compute sub-blocks describe para ver información sobre un subbloque:

gcloud compute reservations sub-blocks describe example-reservation \
  --block-name=example-reservation-block-0001 \
  --sub-block-name=example-reservation-block-0001-subblock-0002 \
  --project=example-project \
  --zone=us-central1-c

Este comando muestra la siguiente información:

resource:
  count: 16
  creationTimestamp: '2025-11-05T15:00:16.736-08:00'
  healthInfo:
    degradedHostCount: 0
    degradedInfraCount: 0
    healthStatus: HEALTHY
    healthyHostCount: 16
    healthyInfraCount: 1
  id: '5629213080155482607'
  inUseCount: 12
  kind: compute#reservationSubBlock
  name: example-reservation-block-0001-subblock-0002
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
    subBlock: 7aca49831e54d32970631524bc060d9c
  reservationSubBlockMaintenance:
    schedulingType: GROUPED
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Los siguientes valores del resultado describen los subbloques de la reserva:

  • count: la cantidad de hosts
  • healthInfo.degradedInfraCount: el estado correcto de un interruptor de circuito óptico (OCS) de un cubo de Ironwood. Si este valor es 1, indica que el OCS del cubo de Ironwood se degradó. Este valor no se aplica a Trillium
  • healthInfo.healthStatus: el estado general del subbloque
  • healthInfo.healthyHostCount: la cantidad de hosts en buen estado en el subbloque
  • id: ID del bloque
  • inUseCount: la cantidad de hosts en uso
  • kind: el tipo de objeto que se describe
  • name: el nombre del subbloque
  • physicalTopology.block: el ID del bloque que contiene este subbloque
  • physicalTopology.cluster: el clúster en el que se encuentra el bloque
  • physicalTopology.subblock: ID del subbloque

Encuentra la ubicación física de una instancia de VM de TPU

Una vez que aprovisiones segmentos de TPU, podrás recuperar la ubicación física de tus instancias de VM de TPU. Esto te permite comprender las distancias relativas entre las instancias de VM de TPU para la optimización de la planificación de cargas de trabajo.

Puedes encontrar la ubicación física de una instancia de VM de TPU con curl o Google Cloud CLI. En el siguiente ejemplo, se muestra la ubicación física de las instancias de VM de TPU en la reserva de ejemplo "example-reservation".

curl

curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology

gcloud

gcloud compute instances describe vm-1 \
--format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \
  --zone=ZONE

Ambos comandos muestran información sobre el clúster, el bloque, el subbloque y el host de la VM de TPU que especifiques:

block: 3feffcdeb6434d68bb818a836f75c1b8
cluster: southamerica-west1-cluster-njga
subblock: cbee689cb721abdb0c7f80a4f2d0c1c7
host: 36b2d9731c1e1cf8594a759c8c4178f0