Veja a topologia e o estado de funcionamento de todas as reservas no modo de capacidade

Pode obter informações de topologia e estado de funcionamento sobre a capacidade do modo de capacidade total através da Google Cloud consola ou da CLI Google Cloud antes ou depois de aprovisionar fatias de TPU. Também pode obter a localização física de uma instância de VM de TPU através da API Compute Engine Instance ou através de um comando curl a partir do SO convidado da VM de TPU. As informações de topologia e estado de saúde ao nível do cluster, do bloco, do sub-bloco, do anfitrião e da VM permitem-lhe tomar decisões de posicionamento com base na topologia para as suas cargas de trabalho, segmentar blocos ou sub-blocos específicos para implementação e compreender a proximidade relativa entre instâncias de VM de TPU.

Veja a topologia da capacidade na Google Cloud consola

Para usar a Google Cloud consola para ver os detalhes da sua reserva:

  1. Na Google Cloud consola, use a barra de pesquisa para pesquisar "reservas" e navegue para a página de reservas.
  2. Selecione o separador Reservas a pedido e encontre a sua reserva de modo de capacidade total da TPU. A equipa da conta indica-lhe o nome da sua reserva.
  3. Selecione a sua reserva para ver a página de detalhes.

Para uma reserva no modo de capacidade total, o Modo operacional está definido como Capacidade total. É apresentada uma lista de blocos juntamente com um resumo da respetiva utilização e estado de funcionamento.

Selecione um bloqueio na lista para ver a página de detalhes do bloqueio. A topologia do bloco é apresentada na secção Localização do cluster. Esta secção apresenta o nome do cluster, o ID com hash de um bloco e o ID com hash de um sub-bloco.

Os nomes dos clusters são globalmente únicos em todas as organizações Google. Por outras palavras, dois clientes diferentes podem ver o mesmo nome do cluster. Ao contrário dos nomes dos clusters, o ID com hash dos blocos ou sub-blocos é exclusivo nos projetos da sua organização.Google Cloud

Pode selecionar um sub-bloco para apresentar a página de detalhes do sub-bloco, que apenas mostra hosts físicos com instâncias de VMs de TPUs ativas. Os anfitriões físicos não usados não são apresentados.

Veja a topologia de capacidade através da CLI do Google Cloud

Pode usar os comandos list e describe da CLI Google Cloud em reservas, blocos e sub-blocos para encontrar informações de topologia e estado sobre a sua capacidade.

Pode usar as informações apresentadas pelos comandos nesta secção para determinar a hierarquia da topologia da capacidade física na sua reserva.

Descreva uma reserva

Pode usar o ícone gcloud compute reservations describe para ver uma vista geral da capacidade na sua reserva. O comando seguinte apresenta um resumo de uma reserva:

gcloud compute reservations describe RESERVATION_NAME \
   --project=PROJECT_ID \
   --zone=ZONE

Substitua o seguinte:

  • RESERVATION_NAME: o nome da sua reserva.
  • PROJECT_ID: o ID do projeto.
  • ZONE: a zona onde se encontra a sua reserva.

O resultado é semelhante ao seguinte:

advancedDeploymentControl:
  reservationOperationalMode: ALL_CAPACITY
aggregateReservation:
  inUseResources:
  - accelerator:
      acceleratorCount: 48
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  reservedResources:
  - accelerator:
      acceleratorCount: 128
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
  workloadType: UNSPECIFIED
creationTimestamp: '2025-11-05T14:16:30.571-08:00'
deleteAtTime: '2026-11-06T08:00:00Z'
deploymentType: DENSE 
enableEmergentMaintenance: false
id: '8873145979824927313'
kind: compute#reservation
linkedCommitments:
- https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud
name: example-reservation
protectionTier: STANDARD
reservationSharingPolicy:
  serviceShareType: ALLOW_ALL
resourceStatus:
  healthInfo:
    degradedBlockCount: 0
    healthStatus: HEALTHY
    healthyBlockCount: 1
  reservationBlockCount: 1
  reservationMaintenance:
    schedulingType: 
schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation
shareSettings:
  projectMap:
    '111111111111':
      projectId: '111111111111'
  shareType: SPECIFIC_PROJECTS
specificReservationRequired: true
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Os seguintes valores da saída descrevem a reserva:

  • advancedDeploymentControl.reservationOperationalMode: o modo de capacidade da reserva
  • aggregateReservation.inUseResources.accelerator.acceleratorCount: o número de chips de TPU em utilização
  • aggregateReservation.inUseResources.accelerator.acceleratorType: a versão da TPU
  • reservedResources.accelerator.acceleratorCount: o número de chips da TPU na reserva
  • deploymentType: o tipo de implementação (será sempre DENSE para TPUs)
  • reservationSharingPolicy.serviceShareType: o tipo de partilha de serviços
  • resourceStatus.healthInfo.healthStatus: estado geral da capacidade
  • resourceStatus.healthInfo.healthyBlockCount: o número de blocos em bom estado na reserva
  • resourceStatus.reservationBlockCount: o número de blocos na reserva

Apresentar todos os bloqueios de reservas

Pode usar o comando gcloud compute reservations blocks list para apresentar informações de capacidade, topologia e estado de funcionamento de todos os blocos numa reserva.

Cada objeto de bloco, sub-bloco e anfitrião é identificado por um ID hash. O ID do objeto principal é apresentado nos campos de topologia física dos objetos secundários. Pode usar os IDs hash para criar uma vista hierárquica da topologia da capacidade.

gcloud compute reservations blocks list RESERVATION_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Substitua o seguinte:

  • RESERVATION_NAME: o nome da sua reserva.
  • PROJECT_ID: o ID do projeto.
  • ZONE: a zona onde se encontra a sua reserva.

O comando apresenta o seguinte resultado:

count: 32
creationTimestamp: '2025-11-05T15:00:15.223-08:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 2
  id: '2996501069483632657'
inUseCount: 12
kind: compute#reservationBlock
name: example-reservation-block-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c


count: 128
creationTimestamp: '2025-08-19T18:23:32.825-07:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 4
id: '9a0e671424e45fd480ca172ad7a4e25d'
inUseCount: 64
kind: compute#reservationBlock
name: example-reservation-block-0002
physicalTopology:
  block: 3feffcdeb6434d68bb818a836f75c1b8
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Os seguintes valores da saída descrevem os blocos na reserva:

  • count: o número de anfitriões físicos
  • healthInfo.healthStatus: o estado geral do bloco
  • healthInfo.healthySubblockCount: o número de sub-blocos em bom estado no bloco
  • id: o ID do bloco
  • inUseCount: o número de anfitriões físicos em utilização
  • kind: o tipo de objeto descrito
  • name: o nome do bloco
  • physicalTopology.block: o ID do bloqueio
  • physicalTopology.cluster: o cluster onde o bloqueio está localizado
  • reservationSubBlockCount: o número de sub-blocos neste bloco
  • reservationSubBlockInUseCount: o número de sub-blocos em utilização

Descreva um bloco de reservas

Pode usar o comando gcloud compute reservations blocks describe num bloco específico para apresentar informações sobre o bloco que especificar.

gcloud compute reservations blocks describe RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Substitua o seguinte:

  • RESERVATION_NAME: o nome da sua reserva.
  • BLOCK_NAME: o nome do bloco de reservas.
  • PROJECT_ID: o ID do projeto.
  • ZONE: a zona onde se encontra a sua reserva.

Este comando apresenta o seguinte resultado:

resource:
  count: 32
  creationTimestamp: '2025-11-05T15:00:15.223-08:00'
  healthInfo:
    degradedSubBlockCount: 0
    healthStatus: HEALTHY
    healthySubBlockCount: 2
  id: '2996501069483632657'
  inUseCount: 12
  kind: compute#reservationBlock
  name: example-reservation-block-0001
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
  reservationMaintenance:
    schedulingType: GROUPED
  reservationSubBlockCount: 2
  reservationSubBlockInUseCount: 1
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Os seguintes valores da saída descrevem os blocos na reserva:

  • count: o número de anfitriões no bloqueio
  • healthInfo.healthStatus: o estado geral do bloco
  • healthInfo.healthySubblockCount: o número de sub-blocos em bom estado no bloco
  • id: o ID do bloco
  • inUseCount: o número de anfitriões em utilização
  • kind: o tipo de objeto descrito
  • name: o nome do bloco
  • physicalTopology.block: o ID do bloqueio
  • physicalTopology.cluster: o cluster onde o bloqueio está localizado
  • reservationSubBlockCount: o número de sub-blocos neste bloco
  • reservationSubBlockInUseCount: o número de sub-blocos em utilização

Apresenta todos os sub-blocos de um bloco.

Pode listar os sub-blocos num bloco para apresentar informações de cada sub-bloco:

gcloud compute reservations sub-blocks list RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Substitua o seguinte:

  • RESERVATION_NAME: o nome da sua reserva.
  • BLOCK_NAME: o nome do bloco de reservas.
  • PROJECT_ID: o ID do projeto.
  • ZONE: a zona onde se encontra a sua reserva.

Este comando apresenta as seguintes informações:

count: 16
creationTimestamp: '2025-11-05T15:00:16.738-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '8309376980435233263'
inUseCount: 0
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: a0122935eb54d02750b65eef2d4f0366
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
---
count: 16
creationTimestamp: '2025-11-05T15:00:16.736-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '5629213080155482607'
inUseCount: 12
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0002
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: 7aca49831e54d32970631524bc060d9c
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Os seguintes valores da saída descrevem os sub-blocos na reserva:

  • count: o número de anfitriões
  • healthInfo.degradedInfraCount: o estado de funcionamento de um cubo Ironwood Optical Circuit Switch (OCS). Se este valor for 1, indica que o OCS do cubo Ironwood foi degradado. Este valor não se aplica ao Trillium
  • healthInfo.healthStatus: o estado geral do sub-bloco
  • healthInfo.healthyHostCount: o número de anfitriões em bom estado no sub-bloco
  • id: o ID do bloco
  • inUseCount: o número de anfitriões em utilização
  • kind: o tipo de objeto descrito
  • name: o nome do sub-bloco
  • physicalTopology.block: o ID do bloco que contém este sub-bloco
  • physicalTopology.cluster: o cluster onde o bloqueio está localizado
  • physicalTopology.subblock: o ID do sub-bloco

Descreva um sub-bloco de reserva

Pode usar o gcloud compute sub-blocks describe para ver informações sobre um sub-bloco:

gcloud compute reservations sub-blocks describe RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --sub-block-name=SUB_BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Substitua o seguinte:

  • RESERVATION_NAME: o nome da sua reserva.
  • BLOCK_NAME: o nome do bloco de reservas.
  • SUB_BLOCK_NAME: o nome do sub-bloco de reserva.
  • PROJECT_ID: o ID do projeto.
  • ZONE: a zona onde se encontra a sua reserva.

Este comando apresenta as seguintes informações:

resource:
  count: 16
  creationTimestamp: '2025-11-05T15:00:16.736-08:00'
  healthInfo:
    degradedHostCount: 0
    degradedInfraCount: 0
    healthStatus: HEALTHY
    healthyHostCount: 16
    healthyInfraCount: 1
  id: '5629213080155482607'
  inUseCount: 12
  kind: compute#reservationSubBlock
  name: example-reservation-block-0001-subblock-0002
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
    subBlock: 7aca49831e54d32970631524bc060d9c
  reservationSubBlockMaintenance:
    schedulingType: GROUPED
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Os seguintes valores da saída descrevem os sub-blocos na reserva:

  • count: o número de anfitriões
  • healthInfo.degradedInfraCount: o estado de funcionamento de um cubo Ironwood Optical Circuit Switch (OCS). Se este valor for 1, indica que o OCS do cubo Ironwood foi degradado. Este valor não se aplica ao Trillium
  • healthInfo.healthStatus: o estado geral do sub-bloco
  • healthInfo.healthyHostCount: o número de anfitriões em bom estado no sub-bloco
  • id: o ID do bloco
  • inUseCount: o número de anfitriões em utilização
  • kind: o tipo de objeto descrito
  • name: o nome do sub-bloco
  • physicalTopology.block: o ID do bloco que contém este sub-bloco
  • physicalTopology.cluster: o cluster onde o bloqueio está localizado
  • physicalTopology.subblock: o ID do sub-bloco

Encontre a localização física de uma instância de VM da TPU

Depois de aprovisionar fatias de TPUs, pode aceder à localização física das suas instâncias de VMs de TPUs. Isto permite-lhe compreender as distâncias relativas entre instâncias de VMs de TPUs para otimização do agendamento de cargas de trabalho.

Pode encontrar a localização física de uma instância de VM de TPU através de curl ou da CLI do Google Cloud:

curl

curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology

gcloud

gcloud compute instances describe VM_NAME \
    --format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \
    --zone=ZONE

Substitua o seguinte:

  • VM_NAME: o nome da VM da TPU.
  • ZONE: a zona onde a VM da TPU está localizada.

Ambos os comandos apresentam informações sobre o cluster, o bloco, o sub-bloco e o anfitrião da VM de TPU que especificar:

block: 3feffcdeb6434d68bb818a836f75c1b8
cluster: southamerica-west1-cluster-njga
subblock: cbee689cb721abdb0c7f80a4f2d0c1c7
host: 36b2d9731c1e1cf8594a759c8c4178f0