Veja a topologia e o estado de funcionamento de todas as reservas no modo de capacidade
Pode obter informações de topologia e estado de funcionamento sobre a capacidade do modo de capacidade total através da Google Cloud consola ou da CLI Google Cloud antes ou depois de aprovisionar fatias de TPU. Também pode obter a localização física de uma instância de VM de TPU através da API Compute Engine Instance ou através de um comandocurl a partir do SO convidado da VM de TPU. As informações de topologia e estado de saúde ao nível do cluster, do bloco, do sub-bloco, do anfitrião e da VM permitem-lhe tomar decisões de posicionamento
com base na topologia para as suas cargas de trabalho, segmentar blocos ou sub-blocos específicos para
implementação e compreender a proximidade relativa entre instâncias de VM de TPU.
Veja a topologia da capacidade na Google Cloud consola
Para usar a Google Cloud consola para ver os detalhes da sua reserva:
- Na Google Cloud consola, use a barra de pesquisa para pesquisar "reservas" e navegue para a página de reservas.
- Selecione o separador Reservas a pedido e encontre a sua reserva de modo de capacidade total da TPU. A equipa da conta indica-lhe o nome da sua reserva.
- Selecione a sua reserva para ver a página de detalhes.
Para uma reserva no modo de capacidade total, o Modo operacional está definido como Capacidade total. É apresentada uma lista de blocos juntamente com um resumo da respetiva utilização e estado de funcionamento.
Selecione um bloqueio na lista para ver a página de detalhes do bloqueio. A topologia do bloco é apresentada na secção Localização do cluster. Esta secção apresenta o nome do cluster, o ID com hash de um bloco e o ID com hash de um sub-bloco.
Os nomes dos clusters são globalmente únicos em todas as organizações Google. Por outras palavras, dois clientes diferentes podem ver o mesmo nome do cluster. Ao contrário dos nomes dos clusters, o ID com hash dos blocos ou sub-blocos é exclusivo nos projetos da sua organização.Google Cloud
Pode selecionar um sub-bloco para apresentar a página de detalhes do sub-bloco, que apenas mostra hosts físicos com instâncias de VMs de TPUs ativas. Os anfitriões físicos não usados não são apresentados.
Veja a topologia de capacidade através da CLI do Google Cloud
Pode usar os comandos list e describe da CLI Google Cloud em reservas, blocos e sub-blocos para encontrar informações de topologia e estado sobre a sua capacidade.
Pode usar as informações apresentadas pelos comandos nesta secção para determinar a hierarquia da topologia da capacidade física na sua reserva.
Descreva uma reserva
Pode usar o ícone gcloud compute reservations describe para ver uma vista geral da capacidade na sua reserva. O comando seguinte apresenta um resumo de uma reserva:
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID \ --zone=ZONE
Substitua o seguinte:
- RESERVATION_NAME: o nome da sua reserva.
- PROJECT_ID: o ID do projeto.
- ZONE: a zona onde se encontra a sua reserva.
O resultado é semelhante ao seguinte:
advancedDeploymentControl: reservationOperationalMode: ALL_CAPACITY aggregateReservation: inUseResources: - accelerator: acceleratorCount: 48 acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x reservedResources: - accelerator: acceleratorCount: 128 acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X workloadType: UNSPECIFIED creationTimestamp: '2025-11-05T14:16:30.571-08:00' deleteAtTime: '2026-11-06T08:00:00Z' deploymentType: DENSE enableEmergentMaintenance: false id: '8873145979824927313' kind: compute#reservation linkedCommitments: - https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud name: example-reservation protectionTier: STANDARD reservationSharingPolicy: serviceShareType: ALLOW_ALL resourceStatus: healthInfo: degradedBlockCount: 0 healthStatus: HEALTHY healthyBlockCount: 1 reservationBlockCount: 1 reservationMaintenance: schedulingType: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation shareSettings: projectMap: '111111111111': projectId: '111111111111' shareType: SPECIFIC_PROJECTS specificReservationRequired: true status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Os seguintes valores da saída descrevem a reserva:
advancedDeploymentControl.reservationOperationalMode: o modo de capacidade da reservaaggregateReservation.inUseResources.accelerator.acceleratorCount: o número de chips de TPU em utilizaçãoaggregateReservation.inUseResources.accelerator.acceleratorType: a versão da TPUreservedResources.accelerator.acceleratorCount: o número de chips da TPU na reservadeploymentType: o tipo de implementação (será sempreDENSEpara TPUs)reservationSharingPolicy.serviceShareType: o tipo de partilha de serviçosresourceStatus.healthInfo.healthStatus: estado geral da capacidaderesourceStatus.healthInfo.healthyBlockCount: o número de blocos em bom estado na reservaresourceStatus.reservationBlockCount: o número de blocos na reserva
Apresentar todos os bloqueios de reservas
Pode usar o comando gcloud compute reservations blocks list para apresentar informações de capacidade, topologia e estado de funcionamento de todos os blocos numa reserva.
Cada objeto de bloco, sub-bloco e anfitrião é identificado por um ID hash. O ID do objeto principal é apresentado nos campos de topologia física dos objetos secundários. Pode usar os IDs hash para criar uma vista hierárquica da topologia da capacidade.
gcloud compute reservations blocks list RESERVATION_NAME \ --project=PROJECT_ID \ --zone=ZONE
Substitua o seguinte:
- RESERVATION_NAME: o nome da sua reserva.
- PROJECT_ID: o ID do projeto.
- ZONE: a zona onde se encontra a sua reserva.
O comando apresenta o seguinte resultado:
count: 32 creationTimestamp: '2025-11-05T15:00:15.223-08:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 2 id: '2996501069483632657' inUseCount: 12 kind: compute#reservationBlock name: example-reservation-block-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c count: 128 creationTimestamp: '2025-08-19T18:23:32.825-07:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 4 id: '9a0e671424e45fd480ca172ad7a4e25d' inUseCount: 64 kind: compute#reservationBlock name: example-reservation-block-0002 physicalTopology: block: 3feffcdeb6434d68bb818a836f75c1b8 cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Os seguintes valores da saída descrevem os blocos na reserva:
count: o número de anfitriões físicoshealthInfo.healthStatus: o estado geral do blocohealthInfo.healthySubblockCount: o número de sub-blocos em bom estado no blocoid: o ID do blocoinUseCount: o número de anfitriões físicos em utilizaçãokind: o tipo de objeto descritoname: o nome do blocophysicalTopology.block: o ID do bloqueiophysicalTopology.cluster: o cluster onde o bloqueio está localizadoreservationSubBlockCount: o número de sub-blocos neste blocoreservationSubBlockInUseCount: o número de sub-blocos em utilização
Descreva um bloco de reservas
Pode usar o comando gcloud compute reservations blocks describe num bloco específico para apresentar informações sobre o bloco que especificar.
gcloud compute reservations blocks describe RESERVATION_NAME \ --block-name=BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Substitua o seguinte:
- RESERVATION_NAME: o nome da sua reserva.
- BLOCK_NAME: o nome do bloco de reservas.
- PROJECT_ID: o ID do projeto.
- ZONE: a zona onde se encontra a sua reserva.
Este comando apresenta o seguinte resultado:
resource: count: 32 creationTimestamp: '2025-11-05T15:00:15.223-08:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 2 id: '2996501069483632657' inUseCount: 12 kind: compute#reservationBlock name: example-reservation-block-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Os seguintes valores da saída descrevem os blocos na reserva:
count: o número de anfitriões no bloqueiohealthInfo.healthStatus: o estado geral do blocohealthInfo.healthySubblockCount: o número de sub-blocos em bom estado no blocoid: o ID do blocoinUseCount: o número de anfitriões em utilizaçãokind: o tipo de objeto descritoname: o nome do blocophysicalTopology.block: o ID do bloqueiophysicalTopology.cluster: o cluster onde o bloqueio está localizadoreservationSubBlockCount: o número de sub-blocos neste blocoreservationSubBlockInUseCount: o número de sub-blocos em utilização
Apresenta todos os sub-blocos de um bloco.
Pode listar os sub-blocos num bloco para apresentar informações de cada sub-bloco:
gcloud compute reservations sub-blocks list RESERVATION_NAME \ --block-name=BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Substitua o seguinte:
- RESERVATION_NAME: o nome da sua reserva.
- BLOCK_NAME: o nome do bloco de reservas.
- PROJECT_ID: o ID do projeto.
- ZONE: a zona onde se encontra a sua reserva.
Este comando apresenta as seguintes informações:
count: 16 creationTimestamp: '2025-11-05T15:00:16.738-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '8309376980435233263' inUseCount: 0 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: a0122935eb54d02750b65eef2d4f0366 reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c --- count: 16 creationTimestamp: '2025-11-05T15:00:16.736-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '5629213080155482607' inUseCount: 12 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0002 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: 7aca49831e54d32970631524bc060d9c reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Os seguintes valores da saída descrevem os sub-blocos na reserva:
count: o número de anfitriõeshealthInfo.degradedInfraCount: o estado de funcionamento de um cubo Ironwood Optical Circuit Switch (OCS). Se este valor for 1, indica que o OCS do cubo Ironwood foi degradado. Este valor não se aplica ao TrilliumhealthInfo.healthStatus: o estado geral do sub-blocohealthInfo.healthyHostCount: o número de anfitriões em bom estado no sub-blocoid: o ID do blocoinUseCount: o número de anfitriões em utilizaçãokind: o tipo de objeto descritoname: o nome do sub-blocophysicalTopology.block: o ID do bloco que contém este sub-blocophysicalTopology.cluster: o cluster onde o bloqueio está localizadophysicalTopology.subblock: o ID do sub-bloco
Descreva um sub-bloco de reserva
Pode usar o gcloud compute sub-blocks describe para ver informações sobre um sub-bloco:
gcloud compute reservations sub-blocks describe RESERVATION_NAME \ --block-name=BLOCK_NAME \ --sub-block-name=SUB_BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Substitua o seguinte:
- RESERVATION_NAME: o nome da sua reserva.
- BLOCK_NAME: o nome do bloco de reservas.
- SUB_BLOCK_NAME: o nome do sub-bloco de reserva.
- PROJECT_ID: o ID do projeto.
- ZONE: a zona onde se encontra a sua reserva.
Este comando apresenta as seguintes informações:
resource: count: 16 creationTimestamp: '2025-11-05T15:00:16.736-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '5629213080155482607' inUseCount: 12 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0002 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: 7aca49831e54d32970631524bc060d9c reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Os seguintes valores da saída descrevem os sub-blocos na reserva:
count: o número de anfitriõeshealthInfo.degradedInfraCount: o estado de funcionamento de um cubo Ironwood Optical Circuit Switch (OCS). Se este valor for 1, indica que o OCS do cubo Ironwood foi degradado. Este valor não se aplica ao TrilliumhealthInfo.healthStatus: o estado geral do sub-blocohealthInfo.healthyHostCount: o número de anfitriões em bom estado no sub-blocoid: o ID do blocoinUseCount: o número de anfitriões em utilizaçãokind: o tipo de objeto descritoname: o nome do sub-blocophysicalTopology.block: o ID do bloco que contém este sub-blocophysicalTopology.cluster: o cluster onde o bloqueio está localizadophysicalTopology.subblock: o ID do sub-bloco
Encontre a localização física de uma instância de VM da TPU
Depois de aprovisionar fatias de TPUs, pode aceder à localização física das suas instâncias de VMs de TPUs. Isto permite-lhe compreender as distâncias relativas entre instâncias de VMs de TPUs para otimização do agendamento de cargas de trabalho.
Pode encontrar a localização física de uma instância de VM de TPU através de curl ou da CLI do Google Cloud:
curl
curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology
gcloud
gcloud compute instances describe VM_NAME \ --format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \ --zone=ZONE
Substitua o seguinte:
- VM_NAME: o nome da VM da TPU.
- ZONE: a zona onde a VM da TPU está localizada.
Ambos os comandos apresentam informações sobre o cluster, o bloco, o sub-bloco e o anfitrião da VM de TPU que especificar:
block: 3feffcdeb6434d68bb818a836f75c1b8 cluster: southamerica-west1-cluster-njga subblock: cbee689cb721abdb0c7f80a4f2d0c1c7 host: 36b2d9731c1e1cf8594a759c8c4178f0