Melihat topologi dan status kesehatan semua reservasi Mode Kapasitas
Anda dapat mengambil informasi topologi dan kondisi tentang kapasitas mode Semua Kapasitas menggunakan konsol Google Cloud atau Google Cloud CLI sebelum atau setelah Anda menyediakan slice TPU. Anda juga dapat mengambil lokasi fisik instance VM TPU melalui Compute Engine Instance API atau melalui perintahcurl dari dalam OS tamu VM TPU. Informasi topologi dan status respons di tingkat cluster, blok, sub-blok, host, dan VM memungkinkan Anda membuat keputusan penempatan yang sesuai dengan topologi untuk workload, menargetkan blok atau sub-blok tertentu untuk deployment, dan memahami kedekatan relatif antara instance VM TPU.
Melihat topologi kapasitas di konsol Google Cloud
Untuk menggunakan konsol Google Cloud guna melihat detail pemesanan Anda:
- Di konsol Google Cloud , gunakan kotak penelusuran untuk menelusuri "reservations" dan buka halaman reservasi.
- Pilih tab On-demand reservations dan temukan reservasi mode Semua Kapasitas TPU Anda. Tim akun Anda akan memberi tahu nama reservasi Anda.
- Pilih reservasi Anda untuk melihat halaman detail.
Untuk reservasi mode Semua Kapasitas, Mode operasional disetel ke Semua kapasitas. Daftar blok ditampilkan bersama dengan ringkasan pemanfaatan dan status kesehatannya.
Pilih blok dari daftar untuk melihat halaman detail blok. Topologi blok ditampilkan di bagian Cluster Location. Bagian ini menampilkan nama cluster, ID hash blok, dan ID hash sub-blok.
Nama cluster unik secara global di semua organisasi Google. Dengan kata lain, dua pelanggan yang berbeda dapat melihat nama cluster yang sama. Tidak seperti nama cluster, ID hash blok atau sub-blok bersifat unik dalam project organisasi Anda.Google Cloud
Anda dapat memilih sub-blok untuk menampilkan halaman detail sub-blok yang hanya menampilkan host fisik dengan instance VM TPU aktif. Host fisik yang tidak digunakan tidak ditampilkan.
Melihat topologi kapasitas menggunakan Google Cloud CLI
Anda dapat menggunakan perintah list dan describe Google Cloud CLI pada reservasi, blok, dan sub-blok untuk menemukan informasi topologi dan kondisi tentang kapasitas Anda.
Anda dapat menggunakan informasi yang ditampilkan oleh perintah di bagian ini untuk menentukan hierarki topologi kapasitas fisik dalam reservasi Anda.
Mendeskripsikan reservasi
Anda dapat menggunakan gcloud compute reservations describe untuk melihat ringkasan kapasitas dalam reservasi Anda. Perintah berikut menampilkan ringkasan reservasi:
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID \ --zone=ZONE
Ganti kode berikut:
- RESERVATION_NAME: Nama pemesanan Anda.
- PROJECT_ID: Project ID Anda.
- ZONE: Zona tempat pemesanan Anda berada.
Outputnya mirip dengan hal berikut ini:
advancedDeploymentControl: reservationOperationalMode: ALL_CAPACITY aggregateReservation: inUseResources: - accelerator: acceleratorCount: 48 acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x reservedResources: - accelerator: acceleratorCount: 128 acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X workloadType: UNSPECIFIED creationTimestamp: '2025-11-05T14:16:30.571-08:00' deleteAtTime: '2026-11-06T08:00:00Z' deploymentType: DENSE enableEmergentMaintenance: false id: '8873145979824927313' kind: compute#reservation linkedCommitments: - https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud name: example-reservation protectionTier: STANDARD reservationSharingPolicy: serviceShareType: ALLOW_ALL resourceStatus: healthInfo: degradedBlockCount: 0 healthStatus: HEALTHY healthyBlockCount: 1 reservationBlockCount: 1 reservationMaintenance: schedulingType: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation shareSettings: projectMap: '111111111111': projectId: '111111111111' shareType: SPECIFIC_PROJECTS specificReservationRequired: true status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Nilai berikut dari output menjelaskan pemesanan:
advancedDeploymentControl.reservationOperationalMode: mode kapasitas untuk reservasiaggregateReservation.inUseResources.accelerator.acceleratorCount: jumlah chip TPU yang digunakanaggregateReservation.inUseResources.accelerator.acceleratorType: versi TPUreservedResources.accelerator.acceleratorCount: jumlah chip TPU dalam reservasideploymentType: jenis deployment (akan selalu berupaDENSEuntuk TPU)reservationSharingPolicy.serviceShareType: jenis berbagi layananresourceStatus.healthInfo.healthStatus: keseluruhan kondisi kapasitasresourceStatus.healthInfo.healthyBlockCount: jumlah blok yang sehat dalam reservasiresourceStatus.reservationBlockCount: jumlah blok dalam pemesanan
Mencantumkan semua blok reservasi
Anda dapat menggunakan perintah gcloud compute reservations blocks list untuk menampilkan informasi kapasitas, topologi, dan kondisi untuk semua blok dalam reservasi.
Setiap blok, sub-blok, dan objek host diidentifikasi oleh ID hash. ID objek induk ditampilkan di kolom topologi fisik objek turunan. Anda dapat menggunakan ID hash untuk membuat tampilan hierarki topologi kapasitas.
gcloud compute reservations blocks list RESERVATION_NAME \ --project=PROJECT_ID \ --zone=ZONE
Ganti kode berikut:
- RESERVATION_NAME: Nama pemesanan Anda.
- PROJECT_ID: Project ID Anda.
- ZONE: Zona tempat pemesanan Anda berada.
Perintah menampilkan output berikut:
count: 32 creationTimestamp: '2025-11-05T15:00:15.223-08:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 2 id: '2996501069483632657' inUseCount: 12 kind: compute#reservationBlock name: example-reservation-block-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c count: 128 creationTimestamp: '2025-08-19T18:23:32.825-07:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 4 id: '9a0e671424e45fd480ca172ad7a4e25d' inUseCount: 64 kind: compute#reservationBlock name: example-reservation-block-0002 physicalTopology: block: 3feffcdeb6434d68bb818a836f75c1b8 cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Nilai berikut dari output menjelaskan blok dalam reservasi:
count: jumlah host fisikhealthInfo.healthStatus: keseluruhan kondisi blokhealthInfo.healthySubblockCount: jumlah sub-blok yang sehat dalam blokid: ID blokinUseCount: jumlah host fisik yang digunakankind: jenis objek yang dijelaskanname: nama blokphysicalTopology.block: ID blokphysicalTopology.cluster: cluster tempat blok beradareservationSubBlockCount: jumlah sub-blok dalam blok inireservationSubBlockInUseCount: jumlah sub-blok yang digunakan
Mendeskripsikan blok reservasi
Anda dapat menggunakan perintah gcloud compute reservations blocks describe pada blok tertentu untuk menampilkan informasi blok yang Anda tentukan.
gcloud compute reservations blocks describe RESERVATION_NAME \ --block-name=BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Ganti kode berikut:
- RESERVATION_NAME: Nama pemesanan Anda.
- BLOCK_NAME: Nama blok reservasi.
- PROJECT_ID: Project ID Anda.
- ZONE: Zona tempat pemesanan Anda berada.
Perintah ini menampilkan output berikut:
resource: count: 32 creationTimestamp: '2025-11-05T15:00:15.223-08:00' healthInfo: degradedSubBlockCount: 0 healthStatus: HEALTHY healthySubBlockCount: 2 id: '2996501069483632657' inUseCount: 12 kind: compute#reservationBlock name: example-reservation-block-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster reservationMaintenance: schedulingType: GROUPED reservationSubBlockCount: 2 reservationSubBlockInUseCount: 1 selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Nilai berikut dari output menjelaskan blok dalam reservasi:
count: jumlah host dalam blokhealthInfo.healthStatus: keseluruhan kondisi blokhealthInfo.healthySubblockCount: jumlah sub-blok yang sehat dalam blokid: ID blokinUseCount: jumlah host yang digunakankind: jenis objek yang dijelaskanname: nama blokphysicalTopology.block: ID blokphysicalTopology.cluster: cluster tempat blok beradareservationSubBlockCount: jumlah sub-blok dalam blok inireservationSubBlockInUseCount: jumlah sub-blok yang digunakan
Mencantumkan semua sub-blok dari suatu blok
Anda dapat mencantumkan sub-blok dalam blok untuk menampilkan informasi untuk setiap sub-blok:
gcloud compute reservations sub-blocks list RESERVATION_NAME \ --block-name=BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Ganti kode berikut:
- RESERVATION_NAME: Nama pemesanan Anda.
- BLOCK_NAME: Nama blok reservasi.
- PROJECT_ID: Project ID Anda.
- ZONE: Zona tempat pemesanan Anda berada.
Perintah ini menampilkan informasi berikut:
count: 16 creationTimestamp: '2025-11-05T15:00:16.738-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '8309376980435233263' inUseCount: 0 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0001 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: a0122935eb54d02750b65eef2d4f0366 reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c --- count: 16 creationTimestamp: '2025-11-05T15:00:16.736-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '5629213080155482607' inUseCount: 12 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0002 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: 7aca49831e54d32970631524bc060d9c reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Nilai berikut dari output menjelaskan sub-blok dalam reservasi:
count: jumlah hosthealthInfo.degradedInfraCount: status sehat Optical Circuit Switch (OCS) kubus Ironwood. Jika nilai ini adalah 1, berarti OCS kubus Ironwood telah menurun. Nilai ini tidak berlaku untuk TrilliumhealthInfo.healthStatus: keseluruhan kondisi sub-blokhealthInfo.healthyHostCount: jumlah host yang sehat dalam sub-blokid: ID blokinUseCount: jumlah host yang digunakankind: jenis objek yang dijelaskanname: nama sub-blokphysicalTopology.block: ID blok yang berisi sub-blok iniphysicalTopology.cluster: cluster tempat blok beradaphysicalTopology.subblock: ID sub-blok
Mendeskripsikan sub-blok reservasi
Anda dapat menggunakan gcloud compute sub-blocks describe untuk melihat informasi tentang sub-blok:
gcloud compute reservations sub-blocks describe RESERVATION_NAME \ --block-name=BLOCK_NAME \ --sub-block-name=SUB_BLOCK_NAME \ --project=PROJECT_ID \ --zone=ZONE
Ganti kode berikut:
- RESERVATION_NAME: Nama pemesanan Anda.
- BLOCK_NAME: Nama blok reservasi.
- SUB_BLOCK_NAME: Nama sub-blok reservasi.
- PROJECT_ID: Project ID Anda.
- ZONE: Zona tempat pemesanan Anda berada.
Perintah ini menampilkan informasi berikut:
resource: count: 16 creationTimestamp: '2025-11-05T15:00:16.736-08:00' healthInfo: degradedHostCount: 0 degradedInfraCount: 0 healthStatus: HEALTHY healthyHostCount: 16 healthyInfraCount: 1 id: '5629213080155482607' inUseCount: 12 kind: compute#reservationSubBlock name: example-reservation-block-0001-subblock-0002 physicalTopology: block: 9a0e671424e45fd480ca172ad7a4e25d cluster: example-cluster subBlock: 7aca49831e54d32970631524bc060d9c reservationSubBlockMaintenance: schedulingType: GROUPED selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002 selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607 status: READY zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
Nilai berikut dari output menjelaskan sub-blok dalam reservasi:
count: jumlah hosthealthInfo.degradedInfraCount: status sehat Optical Circuit Switch (OCS) kubus Ironwood. Jika nilai ini adalah 1, berarti OCS kubus Ironwood telah menurun. Nilai ini tidak berlaku untuk TrilliumhealthInfo.healthStatus: keseluruhan kondisi sub-blokhealthInfo.healthyHostCount: jumlah host yang sehat dalam sub-blokid: ID blokinUseCount: jumlah host yang digunakankind: jenis objek yang dijelaskanname: nama sub-blokphysicalTopology.block: ID blok yang berisi sub-blok iniphysicalTopology.cluster: cluster tempat blok beradaphysicalTopology.subblock: ID sub-blok
Menemukan lokasi fisik instance VM TPU
Setelah menyediakan slice TPU, Anda dapat mengambil lokasi fisik instance VM TPU. Hal ini memungkinkan Anda memahami jarak relatif antara instance VM TPU untuk pengoptimalan penjadwalan workload.
Anda dapat menemukan lokasi fisik instance VM TPU menggunakan curl atau
Google Cloud CLI:
curl
curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology
gcloud
gcloud compute instances describe VM_NAME \ --format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \ --zone=ZONE
Ganti kode berikut:
- VM_NAME: Nama VM TPU Anda.
- ZONE: Zona tempat VM TPU Anda berada.
Kedua perintah ini menampilkan informasi tentang cluster, blok, sub-blok, dan host VM TPU yang Anda tentukan:
block: 3feffcdeb6434d68bb818a836f75c1b8 cluster: southamerica-west1-cluster-njga subblock: cbee689cb721abdb0c7f80a4f2d0c1c7 host: 36b2d9731c1e1cf8594a759c8c4178f0