Melihat topologi dan status kesehatan semua reservasi Mode Kapasitas

Anda dapat mengambil informasi topologi dan kondisi tentang kapasitas mode Semua Kapasitas menggunakan konsol Google Cloud atau Google Cloud CLI sebelum atau setelah Anda menyediakan slice TPU. Anda juga dapat mengambil lokasi fisik instance VM TPU melalui Compute Engine Instance API atau melalui perintah curl dari dalam OS tamu VM TPU. Informasi topologi dan status respons di tingkat cluster, blok, sub-blok, host, dan VM memungkinkan Anda membuat keputusan penempatan yang sesuai dengan topologi untuk workload, menargetkan blok atau sub-blok tertentu untuk deployment, dan memahami kedekatan relatif antara instance VM TPU.

Melihat topologi kapasitas di konsol Google Cloud

Untuk menggunakan konsol Google Cloud guna melihat detail pemesanan Anda:

  1. Di konsol Google Cloud , gunakan kotak penelusuran untuk menelusuri "reservations" dan buka halaman reservasi.
  2. Pilih tab On-demand reservations dan temukan reservasi mode Semua Kapasitas TPU Anda. Tim akun Anda akan memberi tahu nama reservasi Anda.
  3. Pilih reservasi Anda untuk melihat halaman detail.

Untuk reservasi mode Semua Kapasitas, Mode operasional disetel ke Semua kapasitas. Daftar blok ditampilkan bersama dengan ringkasan pemanfaatan dan status kesehatannya.

Pilih blok dari daftar untuk melihat halaman detail blok. Topologi blok ditampilkan di bagian Cluster Location. Bagian ini menampilkan nama cluster, ID hash blok, dan ID hash sub-blok.

Nama cluster unik secara global di semua organisasi Google. Dengan kata lain, dua pelanggan yang berbeda dapat melihat nama cluster yang sama. Tidak seperti nama cluster, ID hash blok atau sub-blok bersifat unik dalam project organisasi Anda.Google Cloud

Anda dapat memilih sub-blok untuk menampilkan halaman detail sub-blok yang hanya menampilkan host fisik dengan instance VM TPU aktif. Host fisik yang tidak digunakan tidak ditampilkan.

Melihat topologi kapasitas menggunakan Google Cloud CLI

Anda dapat menggunakan perintah list dan describe Google Cloud CLI pada reservasi, blok, dan sub-blok untuk menemukan informasi topologi dan kondisi tentang kapasitas Anda.

Anda dapat menggunakan informasi yang ditampilkan oleh perintah di bagian ini untuk menentukan hierarki topologi kapasitas fisik dalam reservasi Anda.

Mendeskripsikan reservasi

Anda dapat menggunakan gcloud compute reservations describe untuk melihat ringkasan kapasitas dalam reservasi Anda. Perintah berikut menampilkan ringkasan reservasi:

gcloud compute reservations describe RESERVATION_NAME \
   --project=PROJECT_ID \
   --zone=ZONE

Ganti kode berikut:

  • RESERVATION_NAME: Nama pemesanan Anda.
  • PROJECT_ID: Project ID Anda.
  • ZONE: Zona tempat pemesanan Anda berada.

Outputnya mirip dengan hal berikut ini:

advancedDeploymentControl:
  reservationOperationalMode: ALL_CAPACITY
aggregateReservation:
  inUseResources:
  - accelerator:
      acceleratorCount: 48
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  reservedResources:
  - accelerator:
      acceleratorCount: 128
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
  workloadType: UNSPECIFIED
creationTimestamp: '2025-11-05T14:16:30.571-08:00'
deleteAtTime: '2026-11-06T08:00:00Z'
deploymentType: DENSE 
enableEmergentMaintenance: false
id: '8873145979824927313'
kind: compute#reservation
linkedCommitments:
- https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud
name: example-reservation
protectionTier: STANDARD
reservationSharingPolicy:
  serviceShareType: ALLOW_ALL
resourceStatus:
  healthInfo:
    degradedBlockCount: 0
    healthStatus: HEALTHY
    healthyBlockCount: 1
  reservationBlockCount: 1
  reservationMaintenance:
    schedulingType: 
schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation
shareSettings:
  projectMap:
    '111111111111':
      projectId: '111111111111'
  shareType: SPECIFIC_PROJECTS
specificReservationRequired: true
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Nilai berikut dari output menjelaskan pemesanan:

  • advancedDeploymentControl.reservationOperationalMode: mode kapasitas untuk reservasi
  • aggregateReservation.inUseResources.accelerator.acceleratorCount: jumlah chip TPU yang digunakan
  • aggregateReservation.inUseResources.accelerator.acceleratorType: versi TPU
  • reservedResources.accelerator.acceleratorCount: jumlah chip TPU dalam reservasi
  • deploymentType: jenis deployment (akan selalu berupa DENSE untuk TPU)
  • reservationSharingPolicy.serviceShareType: jenis berbagi layanan
  • resourceStatus.healthInfo.healthStatus: keseluruhan kondisi kapasitas
  • resourceStatus.healthInfo.healthyBlockCount: jumlah blok yang sehat dalam reservasi
  • resourceStatus.reservationBlockCount: jumlah blok dalam pemesanan

Mencantumkan semua blok reservasi

Anda dapat menggunakan perintah gcloud compute reservations blocks list untuk menampilkan informasi kapasitas, topologi, dan kondisi untuk semua blok dalam reservasi.

Setiap blok, sub-blok, dan objek host diidentifikasi oleh ID hash. ID objek induk ditampilkan di kolom topologi fisik objek turunan. Anda dapat menggunakan ID hash untuk membuat tampilan hierarki topologi kapasitas.

gcloud compute reservations blocks list RESERVATION_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Ganti kode berikut:

  • RESERVATION_NAME: Nama pemesanan Anda.
  • PROJECT_ID: Project ID Anda.
  • ZONE: Zona tempat pemesanan Anda berada.

Perintah menampilkan output berikut:

count: 32
creationTimestamp: '2025-11-05T15:00:15.223-08:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 2
  id: '2996501069483632657'
inUseCount: 12
kind: compute#reservationBlock
name: example-reservation-block-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c


count: 128
creationTimestamp: '2025-08-19T18:23:32.825-07:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 4
id: '9a0e671424e45fd480ca172ad7a4e25d'
inUseCount: 64
kind: compute#reservationBlock
name: example-reservation-block-0002
physicalTopology:
  block: 3feffcdeb6434d68bb818a836f75c1b8
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Nilai berikut dari output menjelaskan blok dalam reservasi:

  • count: jumlah host fisik
  • healthInfo.healthStatus: keseluruhan kondisi blok
  • healthInfo.healthySubblockCount: jumlah sub-blok yang sehat dalam blok
  • id: ID blok
  • inUseCount: jumlah host fisik yang digunakan
  • kind: jenis objek yang dijelaskan
  • name: nama blok
  • physicalTopology.block: ID blok
  • physicalTopology.cluster: cluster tempat blok berada
  • reservationSubBlockCount: jumlah sub-blok dalam blok ini
  • reservationSubBlockInUseCount: jumlah sub-blok yang digunakan

Mendeskripsikan blok reservasi

Anda dapat menggunakan perintah gcloud compute reservations blocks describe pada blok tertentu untuk menampilkan informasi blok yang Anda tentukan.

gcloud compute reservations blocks describe RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Ganti kode berikut:

  • RESERVATION_NAME: Nama pemesanan Anda.
  • BLOCK_NAME: Nama blok reservasi.
  • PROJECT_ID: Project ID Anda.
  • ZONE: Zona tempat pemesanan Anda berada.

Perintah ini menampilkan output berikut:

resource:
  count: 32
  creationTimestamp: '2025-11-05T15:00:15.223-08:00'
  healthInfo:
    degradedSubBlockCount: 0
    healthStatus: HEALTHY
    healthySubBlockCount: 2
  id: '2996501069483632657'
  inUseCount: 12
  kind: compute#reservationBlock
  name: example-reservation-block-0001
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
  reservationMaintenance:
    schedulingType: GROUPED
  reservationSubBlockCount: 2
  reservationSubBlockInUseCount: 1
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Nilai berikut dari output menjelaskan blok dalam reservasi:

  • count: jumlah host dalam blok
  • healthInfo.healthStatus: keseluruhan kondisi blok
  • healthInfo.healthySubblockCount: jumlah sub-blok yang sehat dalam blok
  • id: ID blok
  • inUseCount: jumlah host yang digunakan
  • kind: jenis objek yang dijelaskan
  • name: nama blok
  • physicalTopology.block: ID blok
  • physicalTopology.cluster: cluster tempat blok berada
  • reservationSubBlockCount: jumlah sub-blok dalam blok ini
  • reservationSubBlockInUseCount: jumlah sub-blok yang digunakan

Mencantumkan semua sub-blok dari suatu blok

Anda dapat mencantumkan sub-blok dalam blok untuk menampilkan informasi untuk setiap sub-blok:

gcloud compute reservations sub-blocks list RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Ganti kode berikut:

  • RESERVATION_NAME: Nama pemesanan Anda.
  • BLOCK_NAME: Nama blok reservasi.
  • PROJECT_ID: Project ID Anda.
  • ZONE: Zona tempat pemesanan Anda berada.

Perintah ini menampilkan informasi berikut:

count: 16
creationTimestamp: '2025-11-05T15:00:16.738-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '8309376980435233263'
inUseCount: 0
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: a0122935eb54d02750b65eef2d4f0366
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
---
count: 16
creationTimestamp: '2025-11-05T15:00:16.736-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '5629213080155482607'
inUseCount: 12
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0002
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: 7aca49831e54d32970631524bc060d9c
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Nilai berikut dari output menjelaskan sub-blok dalam reservasi:

  • count: jumlah host
  • healthInfo.degradedInfraCount: status sehat Optical Circuit Switch (OCS) kubus Ironwood. Jika nilai ini adalah 1, berarti OCS kubus Ironwood telah menurun. Nilai ini tidak berlaku untuk Trillium
  • healthInfo.healthStatus: keseluruhan kondisi sub-blok
  • healthInfo.healthyHostCount: jumlah host yang sehat dalam sub-blok
  • id: ID blok
  • inUseCount: jumlah host yang digunakan
  • kind: jenis objek yang dijelaskan
  • name: nama sub-blok
  • physicalTopology.block: ID blok yang berisi sub-blok ini
  • physicalTopology.cluster: cluster tempat blok berada
  • physicalTopology.subblock: ID sub-blok

Mendeskripsikan sub-blok reservasi

Anda dapat menggunakan gcloud compute sub-blocks describe untuk melihat informasi tentang sub-blok:

gcloud compute reservations sub-blocks describe RESERVATION_NAME \
  --block-name=BLOCK_NAME \
  --sub-block-name=SUB_BLOCK_NAME \
  --project=PROJECT_ID \
  --zone=ZONE

Ganti kode berikut:

  • RESERVATION_NAME: Nama pemesanan Anda.
  • BLOCK_NAME: Nama blok reservasi.
  • SUB_BLOCK_NAME: Nama sub-blok reservasi.
  • PROJECT_ID: Project ID Anda.
  • ZONE: Zona tempat pemesanan Anda berada.

Perintah ini menampilkan informasi berikut:

resource:
  count: 16
  creationTimestamp: '2025-11-05T15:00:16.736-08:00'
  healthInfo:
    degradedHostCount: 0
    degradedInfraCount: 0
    healthStatus: HEALTHY
    healthyHostCount: 16
    healthyInfraCount: 1
  id: '5629213080155482607'
  inUseCount: 12
  kind: compute#reservationSubBlock
  name: example-reservation-block-0001-subblock-0002
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
    subBlock: 7aca49831e54d32970631524bc060d9c
  reservationSubBlockMaintenance:
    schedulingType: GROUPED
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

Nilai berikut dari output menjelaskan sub-blok dalam reservasi:

  • count: jumlah host
  • healthInfo.degradedInfraCount: status sehat Optical Circuit Switch (OCS) kubus Ironwood. Jika nilai ini adalah 1, berarti OCS kubus Ironwood telah menurun. Nilai ini tidak berlaku untuk Trillium
  • healthInfo.healthStatus: keseluruhan kondisi sub-blok
  • healthInfo.healthyHostCount: jumlah host yang sehat dalam sub-blok
  • id: ID blok
  • inUseCount: jumlah host yang digunakan
  • kind: jenis objek yang dijelaskan
  • name: nama sub-blok
  • physicalTopology.block: ID blok yang berisi sub-blok ini
  • physicalTopology.cluster: cluster tempat blok berada
  • physicalTopology.subblock: ID sub-blok

Menemukan lokasi fisik instance VM TPU

Setelah menyediakan slice TPU, Anda dapat mengambil lokasi fisik instance VM TPU. Hal ini memungkinkan Anda memahami jarak relatif antara instance VM TPU untuk pengoptimalan penjadwalan workload.

Anda dapat menemukan lokasi fisik instance VM TPU menggunakan curl atau Google Cloud CLI:

curl

curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology

gcloud

gcloud compute instances describe VM_NAME \
    --format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \
    --zone=ZONE

Ganti kode berikut:

  • VM_NAME: Nama VM TPU Anda.
  • ZONE: Zona tempat VM TPU Anda berada.

Kedua perintah ini menampilkan informasi tentang cluster, blok, sub-blok, dan host VM TPU yang Anda tentukan:

block: 3feffcdeb6434d68bb818a836f75c1b8
cluster: southamerica-west1-cluster-njga
subblock: cbee689cb721abdb0c7f80a4f2d0c1c7
host: 36b2d9731c1e1cf8594a759c8c4178f0