모든 용량 모드 예약의 토폴로지 및 상태 보기

TPU 슬라이스를 프로비저닝하기 전이나 후에 Google Cloud 콘솔 또는 Google Cloud CLI를 사용하여 모든 용량 모드 용량에 관한 토폴로지 및 상태 정보를 검색할 수 있습니다. Compute Engine Instance API를 통해 또는 TPU VM의 게스트 OS 내에서 curl 명령어를 통해 TPU VM 인스턴스의 실제 위치를 가져올 수도 있습니다. 클러스터, 블록, 하위 블록, 호스트, VM 수준의 토폴로지 및 상태 정보를 통해 워크로드의 토폴로지 인식 배치 결정을 내리고, 배포를 위해 특정 블록 또는 하위 블록을 타겟팅하고, TPU VM 인스턴스 간의 상대적 근접성을 파악할 수 있습니다.

Google Cloud 콘솔에서 용량 토폴로지 보기

Google Cloud 콘솔을 사용하여 예약 세부정보를 보려면 다음 단계를 따르세요.

  1. Google Cloud 콘솔에서 검색창을 사용하여 '예약'을 검색하고 예약 페이지로 이동합니다.
  2. 온디맨드 예약 탭을 선택하고 TPU 모든 용량 모드 예약을 찾습니다. 계정팀에서 예약 이름을 알려드립니다.
  3. 예약을 선택하면 예약 세부정보 페이지가 표시됩니다.

모든 용량 모드 예약의 경우 작동 모드모든 용량으로 설정됩니다. 블록 목록이 사용률 및 상태 요약과 함께 표시됩니다.

목록에서 블록을 선택하여 블록 세부정보 페이지를 확인합니다. 블록의 토폴로지는 클러스터 위치 섹션에 표시됩니다. 이 섹션에는 클러스터 이름, 블록의 해싱된 ID, 하위 블록의 해싱된 ID가 표시됩니다.

클러스터 이름은 모든 Google 조직에서 전역적으로 고유합니다. 즉, 서로 다른 두 고객에게 동일한 클러스터 이름이 표시될 수 있습니다. 클러스터 이름과 달리 블록 또는 하위 블록의 해싱된 ID는Google Cloud 조직의 프로젝트 내에서 고유합니다.

하위 블록을 선택하여 활성 TPU VM 인스턴스가 있는 실제 호스트만 표시하는 하위 블록 세부정보 페이지를 표시할 수 있습니다. 사용되지 않는 물리적 호스트는 표시되지 않습니다.

Google Cloud CLI를 사용하여 용량 토폴로지 보기

예약, 블록, 하위 블록에서 Google Cloud CLI listdescribe 명령어를 사용하여 용량에 관한 토폴로지 및 상태 정보를 찾을 수 있습니다.

이 섹션의 명령어로 표시되는 정보를 사용하여 예약의 실제 용량에 대한 토폴로지 계층 구조를 확인할 수 있습니다.

예약 설명

gcloud compute reservations describe을 사용하여 예약의 용량 개요를 확인할 수 있습니다. 다음 명령어는 'example-reservation'이라는 예약의 요약을 표시합니다.

gcloud compute reservations describe example-reservation \
   --project=example-project \
   --zone=us-central1-c

이 명령어는 다음과 비슷한 출력을 표시합니다.

advancedDeploymentControl:
  reservationOperationalMode: ALL_CAPACITY
aggregateReservation:
  inUseResources:
  - accelerator:
      acceleratorCount: 48
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  reservedResources:
  - accelerator:
      acceleratorCount: 128
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
  workloadType: UNSPECIFIED
creationTimestamp: '2025-11-05T14:16:30.571-08:00'
deleteAtTime: '2026-11-06T08:00:00Z'
deploymentType: DENSE 
enableEmergentMaintenance: false
id: '8873145979824927313'
kind: compute#reservation
linkedCommitments:
- https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud
name: example-reservation
protectionTier: STANDARD
reservationSharingPolicy:
  serviceShareType: ALLOW_ALL
resourceStatus:
  healthInfo:
    degradedBlockCount: 0
    healthStatus: HEALTHY
    healthyBlockCount: 1
  reservationBlockCount: 1
  reservationMaintenance:
    schedulingType: 
schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation
shareSettings:
  projectMap:
    '111111111111':
      projectId: '111111111111'
  shareType: SPECIFIC_PROJECTS
specificReservationRequired: true
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

출력의 다음 값은 예약을 설명합니다.

  • advancedDeploymentControl.reservationOperationalMode - 예약의 용량 모드
  • aggregateReservation.inUseResources.accelerator.acceleratorCount - 사용 중인 TPU 칩 수
  • aggregateReservation.inUseResources.accelerator.acceleratorType - TPU 버전
  • reservedResources.accelerator.acceleratorCount - 예약의 TPU 칩 수
  • deploymentType - 배포 유형(TPU의 경우 항상 DENSE)
  • reservationSharingPolicy.serviceShareType - 서비스 공유 유형
  • resourceStatus.healthInfo.healthStatus - 용량의 전반적인 상태
  • resourceStatus.healthInfo.healthyBlockCount - 예약의 정상 블록 수
  • resourceStatus.reservationBlockCount - 예약의 블록 수

모든 예약 블록 나열

gcloud compute reservations blocks list 명령어를 사용하여 예약의 모든 블록에 대한 용량, 토폴로지, 상태 정보를 표시할 수 있습니다. 다음 예에서 'example-reservation' 예약에는 'example-reservation-block-0001' 및 'example-reservation-block-0002'라는 2개의 블록이 있습니다. 두 블록은 모두 'example-cluster' 클러스터에 있습니다.

각 블록, 하위 블록, 호스트 객체는 해시 ID로 식별됩니다. 상위 객체의 ID는 하위 객체의 실제 토폴로지 필드에 표시됩니다. 해시 ID를 사용하여 용량의 토폴로지 계층 구조 뷰를 구성할 수 있습니다.

gcloud compute reservations blocks list example-reservation \
  --project=example-project \
  --zone=us-central1-c

이 명령어는 다음 출력을 표시합니다.

count: 32
creationTimestamp: '2025-11-05T15:00:15.223-08:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 2
  id: '2996501069483632657'
inUseCount: 12
kind: compute#reservationBlock
name: example-reservation-block-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c


count: 128
creationTimestamp: '2025-08-19T18:23:32.825-07:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 4
id: '9a0e671424e45fd480ca172ad7a4e25d'
inUseCount: 64
kind: compute#reservationBlock
name: example-reservation-block-0002
physicalTopology:
  block: 3feffcdeb6434d68bb818a836f75c1b8
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

출력의 다음 값은 예약의 블록을 설명합니다.

  • count - 실제 호스트 수
  • healthInfo.healthStatus - 블록의 전반적인 상태
  • healthInfo.healthySubblockCount - 블록의 정상 하위 블록 수
  • id - 블록의 ID
  • inUseCount - 사용 중인 실제 호스트 수
  • kind - 설명된 객체의 종류
  • name - 블록의 이름
  • physicalTopology.block - 블록 ID
  • physicalTopology.cluster - 블록이 있는 클러스터
  • reservationSubBlockCount - 이 블록의 하위 블록 수
  • reservationSubBlockInUseCount - 사용 중인 하위 블록 수

예약 블록 설명

특정 블록에서 gcloud compute reservations blocks describe 명령어를 사용하여 지정한 블록의 정보를 표시할 수 있습니다.

gcloud compute reservations blocks describe example-reservation \
  --block-name=example-reservation-block-0001 \
  --project=example-project \
  --zone=us-central1-c

이 명령어는 다음 출력을 표시합니다.

resource:
  count: 32
  creationTimestamp: '2025-11-05T15:00:15.223-08:00'
  healthInfo:
    degradedSubBlockCount: 0
    healthStatus: HEALTHY
    healthySubBlockCount: 2
  id: '2996501069483632657'
  inUseCount: 12
  kind: compute#reservationBlock
  name: example-reservation-block-0001
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
  reservationMaintenance:
    schedulingType: GROUPED
  reservationSubBlockCount: 2
  reservationSubBlockInUseCount: 1
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

출력의 다음 값은 예약의 블록을 설명합니다.

  • count - 블록의 호스트 수
  • healthInfo.healthStatus - 블록의 전반적인 상태
  • healthInfo.healthySubblockCount - 블록의 정상 하위 블록 수
  • id - 블록의 ID
  • inUseCount - 사용 중인 호스트 수
  • kind - 설명된 객체의 종류
  • name - 블록의 이름
  • physicalTopology.block - 블록 ID
  • physicalTopology.cluster - 블록이 있는 클러스터
  • reservationSubBlockCount - 이 블록의 하위 블록 수
  • reservationSubBlockInUseCount - 사용 중인 하위 블록 수

블록의 모든 하위 블록 나열

블록의 하위 블록을 나열하여 각 하위 블록의 정보를 표시할 수 있습니다.

gcloud compute reservations sub-blocks list example-reservation \
  --block-name=example-reservation-block-0001 \
  --project=example-project \
  --zone=us-central1-c

이 명령어는 다음 정보를 표시합니다.

count: 16
creationTimestamp: '2025-11-05T15:00:16.738-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '8309376980435233263'
inUseCount: 0
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: a0122935eb54d02750b65eef2d4f0366
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
---
count: 16
creationTimestamp: '2025-11-05T15:00:16.736-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '5629213080155482607'
inUseCount: 12
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0002
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: 7aca49831e54d32970631524bc060d9c
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

출력의 다음 값은 예약의 하위 블록을 설명합니다.

  • count - 호스트 수
  • healthInfo.degradedInfraCount - Ironwood 큐브의 광학 회로 스위치(OCS)의 정상 상태입니다. 이 값이 1이면 Ironwood 큐브의 OCS가 저하되었음을 나타냅니다. 이 값은 Trillium에는 적용되지 않습니다.
  • healthInfo.healthStatus - 하위 블록의 전반적인 상태
  • healthInfo.healthyHostCount - 하위 블록의 정상 호스트 수
  • id - 블록의 ID
  • inUseCount - 사용 중인 호스트 수
  • kind - 설명된 객체의 종류
  • name - 하위 블록의 이름
  • physicalTopology.block - 이 하위 블록을 포함하는 블록의 ID
  • physicalTopology.cluster - 블록이 있는 클러스터
  • physicalTopology.subblock - 하위 블록의 ID

예약 하위 블록 설명

gcloud compute sub-blocks describe을 사용하여 하위 블록에 관한 정보를 확인할 수 있습니다.

gcloud compute reservations sub-blocks describe example-reservation \
  --block-name=example-reservation-block-0001 \
  --sub-block-name=example-reservation-block-0001-subblock-0002 \
  --project=example-project \
  --zone=us-central1-c

이 명령어는 다음 정보를 표시합니다.

resource:
  count: 16
  creationTimestamp: '2025-11-05T15:00:16.736-08:00'
  healthInfo:
    degradedHostCount: 0
    degradedInfraCount: 0
    healthStatus: HEALTHY
    healthyHostCount: 16
    healthyInfraCount: 1
  id: '5629213080155482607'
  inUseCount: 12
  kind: compute#reservationSubBlock
  name: example-reservation-block-0001-subblock-0002
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
    subBlock: 7aca49831e54d32970631524bc060d9c
  reservationSubBlockMaintenance:
    schedulingType: GROUPED
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

출력의 다음 값은 예약의 하위 블록을 설명합니다.

  • count - 호스트 수
  • healthInfo.degradedInfraCount - Ironwood 큐브의 광학 회로 스위치(OCS)의 정상 상태입니다. 이 값이 1이면 Ironwood 큐브의 OCS가 저하되었음을 나타냅니다. 이 값은 Trillium에는 적용되지 않습니다.
  • healthInfo.healthStatus - 하위 블록의 전반적인 상태
  • healthInfo.healthyHostCount - 하위 블록의 정상 호스트 수
  • id - 블록의 ID
  • inUseCount - 사용 중인 호스트 수
  • kind - 설명된 객체의 종류
  • name - 하위 블록의 이름
  • physicalTopology.block - 이 하위 블록을 포함하는 블록의 ID
  • physicalTopology.cluster - 블록이 있는 클러스터
  • physicalTopology.subblock - 하위 블록의 ID

TPU VM 인스턴스의 실제 위치 찾기

TPU 슬라이스를 프로비저닝하면 TPU VM 인스턴스의 실제 위치를 가져올 수 있습니다. 이를 통해 워크로드 예약 최적화를 위해 TPU VM 인스턴스 간의 상대적 거리를 파악할 수 있습니다.

curl 또는 Google Cloud CLI를 사용하여 TPU VM 인스턴스의 실제 위치를 확인할 수 있습니다. 다음 예에서는 예시 예약 'example-reservation'에 있는 TPU VM 인스턴스의 실제 위치를 보여줍니다.

curl

curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology

gcloud

gcloud compute instances describe vm-1 \
--format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \
  --zone=ZONE

이 두 명령어는 모두 지정한 TPU VM의 클러스터, 블록, 하위 블록, 호스트에 관한 정보를 표시합니다.

block: 3feffcdeb6434d68bb818a836f75c1b8
cluster: southamerica-west1-cluster-njga
subblock: cbee689cb721abdb0c7f80a4f2d0c1c7
host: 36b2d9731c1e1cf8594a759c8c4178f0