모든 용량 모드 예약의 토폴로지 및 상태 보기
TPU 슬라이스를 프로비저닝하기 전이나 후에 Google Cloud 콘솔 또는 Google Cloud CLI를 사용하여 모든 용량 모드 용량에 관한 토폴로지 및 상태 정보를 검색할 수 있습니다. Compute Engine Instance API를 통해 또는 TPU VM의 게스트 OS 내에서curl 명령어를 통해 TPU VM 인스턴스의 실제 위치를 가져올 수도 있습니다. 클러스터, 블록, 하위 블록, 호스트, VM 수준의 토폴로지 및 상태 정보를 통해 워크로드의 토폴로지 인식 배치 결정을 내리고, 배포를 위해 특정 블록 또는 하위 블록을 타겟팅하고, TPU VM 인스턴스 간의 상대적 근접성을 파악할 수 있습니다.
Google Cloud 콘솔에서 용량 토폴로지 보기
Google Cloud 콘솔을 사용하여 예약 세부정보를 보려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 검색창을 사용하여 '예약'을 검색하고 예약 페이지로 이동합니다.
- 온디맨드 예약 탭을 선택하고 TPU 모든 용량 모드 예약을 찾습니다. 계정팀에서 예약 이름을 알려드립니다.
- 예약을 선택하면 예약 세부정보 페이지가 표시됩니다.
모든 용량 모드 예약의 경우 작동 모드가 모든 용량으로 설정됩니다. 블록 목록이 사용률 및 상태 요약과 함께 표시됩니다.
목록에서 블록을 선택하여 블록 세부정보 페이지를 확인합니다. 블록의 토폴로지는 클러스터 위치 섹션에 표시됩니다. 이 섹션에는 클러스터 이름, 블록의 해싱된 ID, 하위 블록의 해싱된 ID가 표시됩니다.
클러스터 이름은 모든 Google 조직에서 전역적으로 고유합니다. 즉, 서로 다른 두 고객에게 동일한 클러스터 이름이 표시될 수 있습니다. 클러스터 이름과 달리 블록 또는 하위 블록의 해싱된 ID는Google Cloud 조직의 프로젝트 내에서 고유합니다.
하위 블록을 선택하여 활성 TPU VM 인스턴스가 있는 실제 호스트만 표시하는 하위 블록 세부정보 페이지를 표시할 수 있습니다. 사용되지 않는 물리적 호스트는 표시되지 않습니다.
Google Cloud CLI를 사용하여 용량 토폴로지 보기
예약, 블록, 하위 블록에서 Google Cloud CLI list 및 describe 명령어를 사용하여 용량에 관한 토폴로지 및 상태 정보를 찾을 수 있습니다.
이 섹션의 명령어로 표시되는 정보를 사용하여 예약의 실제 용량에 대한 토폴로지 계층 구조를 확인할 수 있습니다.
예약 설명
gcloud compute reservations describe을 사용하여 예약의 용량 개요를 확인할 수 있습니다. 다음 명령어는 'example-reservation'이라는 예약의 요약을 표시합니다.
gcloud compute reservations describe example-reservation \
--project=example-project \
--zone=us-central1-c
이 명령어는 다음과 비슷한 출력을 표시합니다.
advancedDeploymentControl: reservationOperationalMode: ALL_CAPACITY aggregateReservation: inUseResources: - accelerator: acceleratorCount: 48 acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x reservedResources: - accelerator: acceleratorCount: 128 acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X workloadType: UNSPECIFIED creationTimestamp: '2025-11-05T14:16:30.571-08:00' deleteAtTime: '2026-11-06T08:00:00Z' deploymentType: DENSE enableEmergentMaintenance: false id: '8873145979824927313' kind: compute#reservation linkedCommitments: - https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud name: example-reservation protectionTier: STANDARD reservationSharingPolicy: serviceShareType: ALLOW_ALL resourceStatus: healthInfo: degradedBlockCount: 0 healthStatus: HEALTHY healthyBlockCount: 1 reservationBlockCount: 1 reservationMaintenance: schedulingType: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation shareSettings: projectMap: '111111111111': projectId: '111111111111' shareType: SPECIFIC_PROJECTS specificReservationRequired: true status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
출력의 다음 값은 예약을 설명합니다.
advancedDeploymentControl.reservationOperationalMode- 예약의 용량 모드aggregateReservation.inUseResources.accelerator.acceleratorCount- 사용 중인 TPU 칩 수aggregateReservation.inUseResources.accelerator.acceleratorType- TPU 버전reservedResources.accelerator.acceleratorCount- 예약의 TPU 칩 수deploymentType- 배포 유형(TPU의 경우 항상DENSE)reservationSharingPolicy.serviceShareType- 서비스 공유 유형resourceStatus.healthInfo.healthStatus- 용량의 전반적인 상태resourceStatus.healthInfo.healthyBlockCount- 예약의 정상 블록 수resourceStatus.reservationBlockCount- 예약의 블록 수
모든 예약 블록 나열
gcloud compute reservations blocks list 명령어를 사용하여 예약의 모든 블록에 대한 용량, 토폴로지, 상태 정보를 표시할 수 있습니다.
다음 예에서 'example-reservation' 예약에는 'example-reservation-block-0001' 및 'example-reservation-block-0002'라는 2개의 블록이 있습니다. 두 블록은 모두 'example-cluster' 클러스터에 있습니다.
각 블록, 하위 블록, 호스트 객체는 해시 ID로 식별됩니다. 상위 객체의 ID는 하위 객체의 실제 토폴로지 필드에 표시됩니다. 해시 ID를 사용하여 용량의 토폴로지 계층 구조 뷰를 구성할 수 있습니다.
gcloud compute reservations blocks list example-reservation \
--project=example-project \
--zone=us-central1-c
이 명령어는 다음 출력을 표시합니다.
count: 32 creationTimestamp: '2025-11-05T15:00:15.223-08:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 2 id: '2996501069483632657' inUseCount: 12 kind: compute#reservationBlock name: example-reservation-block-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c count: 128 creationTimestamp: '2025-08-19T18:23:32.825-07:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 4 id: '9a0e671424e45fd480ca172ad7a4e25d' inUseCount: 64 kind: compute#reservationBlock name: example-reservation-block-0002 physicalTopology: block: 3feffcdeb6434d68bb818a836f75c1b8 cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
출력의 다음 값은 예약의 블록을 설명합니다.
count- 실제 호스트 수healthInfo.healthStatus- 블록의 전반적인 상태healthInfo.healthySubblockCount- 블록의 정상 하위 블록 수id- 블록의 IDinUseCount- 사용 중인 실제 호스트 수kind- 설명된 객체의 종류name- 블록의 이름physicalTopology.block- 블록 IDphysicalTopology.cluster- 블록이 있는 클러스터reservationSubBlockCount- 이 블록의 하위 블록 수reservationSubBlockInUseCount- 사용 중인 하위 블록 수
예약 블록 설명
특정 블록에서 gcloud compute reservations blocks describe 명령어를 사용하여 지정한 블록의 정보를 표시할 수 있습니다.
gcloud compute reservations blocks describe example-reservation \
--block-name=example-reservation-block-0001 \
--project=example-project \
--zone=us-central1-c
이 명령어는 다음 출력을 표시합니다.
resource: count: 32 creationTimestamp: '2025-11-05T15:00:15.223-08:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 2 id: '2996501069483632657' inUseCount: 12 kind: compute#reservationBlock name: example-reservation-block-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
출력의 다음 값은 예약의 블록을 설명합니다.
count- 블록의 호스트 수healthInfo.healthStatus- 블록의 전반적인 상태healthInfo.healthySubblockCount- 블록의 정상 하위 블록 수id- 블록의 IDinUseCount- 사용 중인 호스트 수kind- 설명된 객체의 종류name- 블록의 이름physicalTopology.block- 블록 IDphysicalTopology.cluster- 블록이 있는 클러스터reservationSubBlockCount- 이 블록의 하위 블록 수reservationSubBlockInUseCount- 사용 중인 하위 블록 수
블록의 모든 하위 블록 나열
블록의 하위 블록을 나열하여 각 하위 블록의 정보를 표시할 수 있습니다.
gcloud compute reservations sub-blocks list example-reservation \
--block-name=example-reservation-block-0001 \
--project=example-project \
--zone=us-central1-c
이 명령어는 다음 정보를 표시합니다.
count: 16 creationTimestamp: '2025-11-05T15:00:16.738-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '8309376980435233263' inUseCount: 0 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: a0122935eb54d02750b65eef2d4f0366 reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c --- count: 16 creationTimestamp: '2025-11-05T15:00:16.736-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '5629213080155482607' inUseCount: 12 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0002 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: 7aca49831e54d32970631524bc060d9c reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
출력의 다음 값은 예약의 하위 블록을 설명합니다.
count- 호스트 수healthInfo.degradedInfraCount- Ironwood 큐브의 광학 회로 스위치(OCS)의 정상 상태입니다. 이 값이 1이면 Ironwood 큐브의 OCS가 저하되었음을 나타냅니다. 이 값은 Trillium에는 적용되지 않습니다.healthInfo.healthStatus- 하위 블록의 전반적인 상태healthInfo.healthyHostCount- 하위 블록의 정상 호스트 수id- 블록의 IDinUseCount- 사용 중인 호스트 수kind- 설명된 객체의 종류name- 하위 블록의 이름physicalTopology.block- 이 하위 블록을 포함하는 블록의 IDphysicalTopology.cluster- 블록이 있는 클러스터physicalTopology.subblock- 하위 블록의 ID
예약 하위 블록 설명
gcloud compute sub-blocks describe을 사용하여 하위 블록에 관한 정보를 확인할 수 있습니다.
gcloud compute reservations sub-blocks describe example-reservation \
--block-name=example-reservation-block-0001 \
--sub-block-name=example-reservation-block-0001-subblock-0002 \
--project=example-project \
--zone=us-central1-c
이 명령어는 다음 정보를 표시합니다.
resource: count: 16 creationTimestamp: '2025-11-05T15:00:16.736-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '5629213080155482607' inUseCount: 12 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0002 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: 7aca49831e54d32970631524bc060d9c reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
출력의 다음 값은 예약의 하위 블록을 설명합니다.
count- 호스트 수healthInfo.degradedInfraCount- Ironwood 큐브의 광학 회로 스위치(OCS)의 정상 상태입니다. 이 값이 1이면 Ironwood 큐브의 OCS가 저하되었음을 나타냅니다. 이 값은 Trillium에는 적용되지 않습니다.healthInfo.healthStatus- 하위 블록의 전반적인 상태healthInfo.healthyHostCount- 하위 블록의 정상 호스트 수id- 블록의 IDinUseCount- 사용 중인 호스트 수kind- 설명된 객체의 종류name- 하위 블록의 이름physicalTopology.block- 이 하위 블록을 포함하는 블록의 IDphysicalTopology.cluster- 블록이 있는 클러스터physicalTopology.subblock- 하위 블록의 ID
TPU VM 인스턴스의 실제 위치 찾기
TPU 슬라이스를 프로비저닝하면 TPU VM 인스턴스의 실제 위치를 가져올 수 있습니다. 이를 통해 워크로드 예약 최적화를 위해 TPU VM 인스턴스 간의 상대적 거리를 파악할 수 있습니다.
curl 또는 Google Cloud CLI를 사용하여 TPU VM 인스턴스의 실제 위치를 확인할 수 있습니다. 다음 예에서는 예시 예약 'example-reservation'에 있는 TPU VM 인스턴스의 실제 위치를 보여줍니다.
curl
curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology
gcloud
gcloud compute instances describe vm-1 \
--format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \
--zone=ZONE
이 두 명령어는 모두 지정한 TPU VM의 클러스터, 블록, 하위 블록, 호스트에 관한 정보를 표시합니다.
block: 3feffcdeb6434d68bb818a836f75c1b8
cluster: southamerica-west1-cluster-njga
subblock: cbee689cb721abdb0c7f80a4f2d0c1c7
host: 36b2d9731c1e1cf8594a759c8c4178f0