Afficher la topologie et l'état des réservations en mode Toute capacité
Vous pouvez récupérer des informations sur la topologie et l'état de votre capacité en mode "Toute la capacité" à l'aide de la console Google Cloud ou de Google Cloud CLI avant ou après avoir provisionné des tranches de TPU. Vous pouvez également récupérer l'emplacement physique d'une instance de VM TPU via l'API Compute Engine Instance ou via une commandecurl à partir de l'OS invité de la VM TPU. Les informations sur la topologie et l'état de santé au niveau du cluster, du bloc, du sous-bloc, de l'hôte et de la VM vous permettent de prendre des décisions d'emplacement tenant compte de la topologie pour vos charges de travail, de cibler des blocs ou des sous-blocs spécifiques pour le déploiement et de comprendre la proximité relative entre les instances de VM TPU.
Afficher la topologie de capacité dans la console Google Cloud
Pour afficher les détails de votre réservation à l'aide de la console Google Cloud :
- Dans la console Google Cloud , utilisez la barre de recherche pour rechercher "réservations" et accédez à la page des réservations.
- Sélectionnez l'onglet Réservations à la demande et recherchez votre réservation de TPU en mode "Toute capacité". L'équipe chargée de votre compte vous indiquera le nom de votre réservation.
- Sélectionnez votre réservation pour afficher la page d'informations.
Pour une réservation en mode "Toute capacité", le mode opérationnel est défini sur Toute capacité. Une liste de blocs s'affiche, ainsi qu'un récapitulatif de leur utilisation et de leur état.
Sélectionnez un bloc dans la liste pour afficher la page d'informations détaillées. La topologie du bloc s'affiche dans la section Emplacement du cluster. Cette section affiche le nom du cluster, l'ID haché d'un bloc et l'ID haché d'un sous-bloc.
Les noms de cluster sont uniques au niveau mondial dans toutes les organisations Google. En d'autres termes, deux clients différents peuvent voir le même nom de cluster. Contrairement aux noms de clusters, l'ID haché des blocs ou sous-blocs est unique dans les projets de votre organisationGoogle Cloud .
Vous pouvez sélectionner un sous-bloc pour afficher la page d'informations correspondante, qui ne présente que les hôtes physiques avec des instances de VM TPU actives. Les hôtes physiques inutilisés ne sont pas affichés.
Afficher la topologie de capacité à l'aide de Google Cloud CLI
Vous pouvez utiliser les commandes Google Cloud CLI list et describe sur les réservations, les blocs et les sous-blocs pour trouver des informations sur la topologie et l'état de votre capacité.
Vous pouvez utiliser les informations affichées par les commandes de cette section pour déterminer la hiérarchie de la topologie de la capacité physique de votre réservation.
Décrire une réservation
Vous pouvez utiliser gcloud compute reservations describe pour obtenir un aperçu de la capacité de votre réservation. La commande suivante affiche le récapitulatif d'une réservation :
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID \ --zone=ZONE
Remplacez les éléments suivants :
- RESERVATION_NAME : nom de votre réservation.
- PROJECT_ID : ID de votre projet
- ZONE : zone où se trouve votre réservation.
Le résultat ressemble à ce qui suit :
advancedDeploymentControl: reservationOperationalMode: ALL_CAPACITY aggregateReservation: inUseResources: - accelerator: acceleratorCount: 48 acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x reservedResources: - accelerator: acceleratorCount: 128 acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X workloadType: UNSPECIFIED creationTimestamp: '2025-11-05T14:16:30.571-08:00' deleteAtTime: '2026-11-06T08:00:00Z' deploymentType: DENSE enableEmergentMaintenance: false id: '8873145979824927313' kind: compute#reservation linkedCommitments: - https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud name: example-reservation protectionTier: STANDARD reservationSharingPolicy: serviceShareType: ALLOW_ALL resourceStatus: healthInfo: degradedBlockCount: 0 healthStatus: HEALTHY healthyBlockCount: 1 reservationBlockCount: 1 reservationMaintenance: schedulingType: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation shareSettings: projectMap: '111111111111': projectId: '111111111111' shareType: SPECIFIC_PROJECTS specificReservationRequired: true status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Les valeurs suivantes du résultat décrivent la réservation :
advancedDeploymentControl.reservationOperationalMode: mode de capacité de la réservationaggregateReservation.inUseResources.accelerator.acceleratorCount: nombre de puces TPU utiliséesaggregateReservation.inUseResources.accelerator.acceleratorType: version du TPUreservedResources.accelerator.acceleratorCount: nombre de puces TPU dans la réservationdeploymentType: type de déploiement (sera toujoursDENSEpour les TPU)reservationSharingPolicy.serviceShareType: type de partage de serviceresourceStatus.healthInfo.healthStatus: état général de la capacitéresourceStatus.healthInfo.healthyBlockCount: nombre de blocs sains dans la réservationresourceStatus.reservationBlockCount: nombre de blocs dans la réservation
Lister tous les blocs de réservation
Vous pouvez utiliser la commande gcloud compute reservations blocks list pour afficher des informations sur la capacité, la topologie et l'état de tous les blocs d'une réservation.
Chaque bloc, sous-bloc et objet hôte est identifié par un ID de hachage. L'ID de l'objet parent s'affiche dans les champs de topologie physique des objets enfants. Vous pouvez utiliser les ID de hachage pour créer une vue hiérarchique de la capacité.
gcloud compute reservations blocks list RESERVATION_NAME \ --project=PROJECT_ID \ --zone=ZONE
Remplacez les éléments suivants :
- RESERVATION_NAME : nom de votre réservation.
- PROJECT_ID : ID de votre projet
- ZONE : zone où se trouve votre réservation.
La commande affiche le résultat suivant :
count: 32 creationTimestamp: '2025-11-05T15:00:15.223-08:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 2 id: '2996501069483632657' inUseCount: 12 kind: compute#reservationBlock name: example-reservation-block-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c count: 128 creationTimestamp: '2025-08-19T18:23:32.825-07:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 4 id: '9a0e671424e45fd480ca172ad7a4e25d' inUseCount: 64 kind: compute#reservationBlock name: example-reservation-block-0002 physicalTopology: block: 3feffcdeb6434d68bb818a836f75c1b8 cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Les valeurs suivantes du résultat décrivent les blocs de la réservation :
count: nombre d'hôtes physiqueshealthInfo.healthStatus: état général du blochealthInfo.healthySubblockCount: nombre de sous-blocs sains dans le blocid: ID du blocinUseCount: nombre d'hôtes physiques utiliséskind: type d'objet décritname: nom du blocphysicalTopology.block: ID du blocphysicalTopology.cluster: cluster dans lequel se trouve le blocreservationSubBlockCount: nombre de sous-blocs dans ce blocreservationSubBlockInUseCount: nombre de sous-blocs utilisés
Décrire un bloc de réservation
Vous pouvez utiliser la commande gcloud compute reservations blocks describe sur un bloc spécifique pour afficher des informations sur le bloc que vous spécifiez.
gcloud compute reservations blocks describe RESERVATION_NAME \ --block-name=BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Remplacez les éléments suivants :
- RESERVATION_NAME : nom de votre réservation.
- BLOCK_NAME : nom du bloc de réservation.
- PROJECT_ID : ID de votre projet
- ZONE : zone où se trouve votre réservation.
Cette commande affiche le résultat suivant :
resource: count: 32 creationTimestamp: '2025-11-05T15:00:15.223-08:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 2 id: '2996501069483632657' inUseCount: 12 kind: compute#reservationBlock name: example-reservation-block-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Les valeurs suivantes du résultat décrivent les blocs de la réservation :
count: nombre d'hôtes dans le blochealthInfo.healthStatus: état général du blochealthInfo.healthySubblockCount: nombre de sous-blocs sains dans le blocid: ID du blocinUseCount: nombre d'hôtes utiliséskind: type d'objet décritname: nom du blocphysicalTopology.block: ID du blocphysicalTopology.cluster: cluster dans lequel se trouve le blocreservationSubBlockCount: nombre de sous-blocs dans ce blocreservationSubBlockInUseCount: nombre de sous-blocs utilisés
Lister tous les sous-blocs d'un bloc
Vous pouvez lister les sous-blocs d'un bloc pour afficher des informations sur chacun d'eux :
gcloud compute reservations sub-blocks list RESERVATION_NAME \ --block-name=BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Remplacez les éléments suivants :
- RESERVATION_NAME : nom de votre réservation.
- BLOCK_NAME : nom du bloc de réservation.
- PROJECT_ID : ID de votre projet
- ZONE : zone où se trouve votre réservation.
Cette commande affiche les informations suivantes :
count: 16 creationTimestamp: '2025-11-05T15:00:16.738-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '8309376980435233263' inUseCount: 0 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: a0122935eb54d02750b65eef2d4f0366 reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c --- count: 16 creationTimestamp: '2025-11-05T15:00:16.736-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '5629213080155482607' inUseCount: 12 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0002 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: 7aca49831e54d32970631524bc060d9c reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Les valeurs suivantes de la sortie décrivent les sous-blocs de la réservation :
count: nombre d'hôteshealthInfo.degradedInfraCount: état sain du commutateur de circuit optique (OCS, Optical Circuit Switch) d'un cube Ironwood. Si cette valeur est égale à 1, cela indique que l'OCS du cube Ironwood s'est dégradé. Cette valeur ne s'applique pas à Trillium.healthInfo.healthStatus: état général du sous-blochealthInfo.healthyHostCount: nombre d'hôtes en bon état dans le sous-blocid: ID du blocinUseCount: nombre d'hôtes utiliséskind: type d'objet décritname: nom du sous-bloc.physicalTopology.block: ID du bloc contenant ce sous-blocphysicalTopology.cluster: cluster dans lequel se trouve le blocphysicalTopology.subblock: ID du sous-bloc
Décrire un sous-bloc de réservation
Vous pouvez utiliser gcloud compute sub-blocks describe pour afficher des informations sur un sous-bloc :
gcloud compute reservations sub-blocks describe RESERVATION_NAME \ --block-name=BLOCK_NAME \ --sub-block-name=SUB_BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Remplacez les éléments suivants :
- RESERVATION_NAME : nom de votre réservation.
- BLOCK_NAME : nom du bloc de réservation.
- SUB_BLOCK_NAME : nom du sous-bloc de réservation.
- PROJECT_ID : ID de votre projet
- ZONE : zone où se trouve votre réservation.
Cette commande affiche les informations suivantes :
resource: count: 16 creationTimestamp: '2025-11-05T15:00:16.736-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '5629213080155482607' inUseCount: 12 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0002 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: 7aca49831e54d32970631524bc060d9c reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Les valeurs suivantes de la sortie décrivent les sous-blocs de la réservation :
count: nombre d'hôteshealthInfo.degradedInfraCount: état sain du commutateur de circuit optique (OCS, Optical Circuit Switch) d'un cube Ironwood. Si cette valeur est égale à 1, cela indique que l'OCS du cube Ironwood s'est dégradé. Cette valeur ne s'applique pas à Trillium.healthInfo.healthStatus: état général du sous-blochealthInfo.healthyHostCount: nombre d'hôtes en bon état dans le sous-blocid: ID du blocinUseCount: nombre d'hôtes utiliséskind: type d'objet décritname: nom du sous-bloc.physicalTopology.block: ID du bloc contenant ce sous-blocphysicalTopology.cluster: cluster dans lequel se trouve le blocphysicalTopology.subblock: ID du sous-bloc
Trouver l'emplacement physique d'une instance de VM TPU
Une fois que vous avez provisionné des tranches de TPU, vous pouvez récupérer l'emplacement physique de vos instances de VM TPU. Cela vous permet de comprendre les distances relatives entre les instances de VM TPU pour optimiser la planification des charges de travail.
Vous pouvez trouver l'emplacement physique d'une instance de VM TPU à l'aide de curl ou de la Google Cloud CLI :
curl
curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology
gcloud
gcloud compute instances describe VM_NAME \ --format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \ --zone=ZONE
Remplacez les éléments suivants :
- VM_NAME : nom de votre VM TPU.
- ZONE : zone où se trouve votre VM TPU.
Ces deux commandes affichent des informations sur le cluster, le bloc, le sous-bloc et l'hôte de la VM TPU que vous spécifiez :
block: 3feffcdeb6434d68bb818a836f75c1b8 cluster: southamerica-west1-cluster-njga subblock: cbee689cb721abdb0c7f80a4f2d0c1c7 host: 36b2d9731c1e1cf8594a759c8c4178f0