All Capacity モードの予約のトポロジと健全性ステータスを表示する

TPU スライスをプロビジョニングする前または後に、 Google Cloud コンソールまたは Google Cloud CLI を使用して、All Capacity モードの容量に関するトポロジと健全性情報を取得できます。Compute Engine Instance API または TPU VM のゲスト OS 内で curl コマンドを使用して、TPU VM インスタンスの物理的な位置を取得することもできます。クラスタ、ブロック、サブブロック、ホスト、VM レベルのトポロジと健全性ステータス情報を使用すると、ワークロードのトポロジを考慮した配置の決定、デプロイの特定のブロックまたはサブブロックのターゲット設定、TPU VM インスタンス間の相対的な近接性を把握できます。

Google Cloud コンソールで容量トポロジを表示する

Google Cloud コンソールを使用して予約の詳細を表示する手順は次のとおりです。

  1. Google Cloud コンソールの検索バーで「予約」を検索し、予約ページに移動します。
  2. [オンデマンド予約] タブを選択し、TPU All Capacity モードの予約を見つけます。予約の名前は、アカウント チームからお知らせします。
  3. 予約を選択すると、予約の詳細ページが表示されます。

All Capacity モードの予約の場合、運用モードは [すべての容量] に設定されます。ブロックのリストと、使用率と健全性ステータスの概要が表示されます。

リストからブロックを選択すると、ブロックの詳細ページが表示されます。ブロックのトポロジは、[クラスタのロケーション] セクションに表示されます。このセクションには、クラスタ名、ブロックのハッシュ ID、サブブロックのハッシュ ID が表示されます。

クラスタ名は、すべての Google 組織にわたってグローバルに一意です。つまり、2 人の異なるお客様に同じクラスタ名が表示される可能性があります。クラスタ名とは異なり、ブロックまたはサブブロックのハッシュ ID は、Google Cloud 組織のプロジェクト内で一意です。

サブブロックを選択すると、アクティブな TPU VM インスタンスを持つ物理ホストのみが表示されるサブブロックの詳細ページが表示されます。未使用の物理ホストは表示されません。

Google Cloud CLI で容量トポロジを表示する

予約、ブロック、サブブロックで Google Cloud CLI の list コマンドと describe コマンドを使用すると、容量に関するトポロジと健全性情報を確認できます。

このセクションのコマンドで表示される情報を使用して、予約の物理容量のトポロジ階層を特定できます。

予約の説明を取得する

gcloud compute reservations describe を使用すると、予約の容量の概要を確認できます。次のコマンドは、「example-reservation」という予約の概要を表示します。

gcloud compute reservations describe example-reservation \
   --project=example-project \
   --zone=us-central1-c

このコマンドを実行すると、次のような出力が表示されます。

advancedDeploymentControl:
  reservationOperationalMode: ALL_CAPACITY
aggregateReservation:
  inUseResources:
  - accelerator:
      acceleratorCount: 48
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  reservedResources:
  - accelerator:
      acceleratorCount: 128
      acceleratorType: projects/example-project/zones/us-central1-c/acceleratorTypes/tpu7x
  vmFamily: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
  workloadType: UNSPECIFIED
creationTimestamp: '2025-11-05T14:16:30.571-08:00'
deleteAtTime: '2026-11-06T08:00:00Z'
deploymentType: DENSE 
enableEmergentMaintenance: false
id: '8873145979824927313'
kind: compute#reservation
linkedCommitments:
- https://www.googleapis.com/compute/v1/projects/example-project/regions/us-central1/commitments/example-cud
name: example-reservation
protectionTier: STANDARD
reservationSharingPolicy:
  serviceShareType: ALLOW_ALL
resourceStatus:
  healthInfo:
    degradedBlockCount: 0
    healthStatus: HEALTHY
    healthyBlockCount: 1
  reservationBlockCount: 1
  reservationMaintenance:
    schedulingType: 
schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation
shareSettings:
  projectMap:
    '111111111111':
      projectId: '111111111111'
  shareType: SPECIFIC_PROJECTS
specificReservationRequired: true
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

出力の次の値は、予約を表します。

  • advancedDeploymentControl.reservationOperationalMode - 予約の容量モード
  • aggregateReservation.inUseResources.accelerator.acceleratorCount - 使用中の TPU チップの数
  • aggregateReservation.inUseResources.accelerator.acceleratorType - TPU バージョン
  • reservedResources.accelerator.acceleratorCount - 予約内の TPU チップの数
  • deploymentType - デプロイタイプ(TPU の場合は常に DENSE
  • reservationSharingPolicy.serviceShareType - サービス共有タイプ
  • resourceStatus.healthInfo.healthStatus - 容量の全体的な健全性
  • resourceStatus.healthInfo.healthyBlockCount - 予約内の正常なブロックの数
  • resourceStatus.reservationBlockCount - 予約内のブロック数

すべての予約ブロックを一覧表示する

gcloud compute reservations blocks list コマンドを使用すると、予約内のすべてのブロックの容量、トポロジ、健全性情報を表示できます。次の例では、予約「example-reservation」に「example-reservation-block-0001」と「example-reservation-block-0002」の 2 つのブロックがあります。両方のブロックはクラスタ「example-cluster」にあります。

各ブロック、サブブロック、ホスト オブジェクトはハッシュ ID で識別されます。親オブジェクトの ID は、子オブジェクトの物理トポロジ フィールドに表示されます。ハッシュ ID を使用して、容量のトポロジ階層ビューを作成できます。

gcloud compute reservations blocks list example-reservation \
  --project=example-project \
  --zone=us-central1-c

次の出力が表示されます。

count: 32
creationTimestamp: '2025-11-05T15:00:15.223-08:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 2
  id: '2996501069483632657'
inUseCount: 12
kind: compute#reservationBlock
name: example-reservation-block-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c


count: 128
creationTimestamp: '2025-08-19T18:23:32.825-07:00'
healthInfo:
  degradedSubBlockCount: 0
  healthStatus: HEALTHY
  healthySubBlockCount: 4
id: '9a0e671424e45fd480ca172ad7a4e25d'
inUseCount: 64
kind: compute#reservationBlock
name: example-reservation-block-0002
physicalTopology:
  block: 3feffcdeb6434d68bb818a836f75c1b8
  cluster: example-cluster
reservationMaintenance:
  schedulingType: GROUPED
reservationSubBlockCount: 2
reservationSubBlockInUseCount: 1
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

出力の次の値は、予約内のブロックを表します。

  • count - 物理ホストの数
  • healthInfo.healthStatus - ブロックの全体的な健全性
  • healthInfo.healthySubblockCount - ブロック内の正常なサブブロックの数
  • id - ブロックの ID
  • inUseCount - 使用中の物理ホストの数
  • kind - 説明されているオブジェクトの種類
  • name - ブロックの名前
  • physicalTopology.block - ブロック ID
  • physicalTopology.cluster - ブロックが配置されているクラスタ
  • reservationSubBlockCount - このブロック内のサブブロックの数
  • reservationSubBlockInUseCount - 使用中のサブブロックの数

予約ブロックの説明を取得する

特定のブロックで gcloud compute reservations blocks describe コマンドを使用すると、指定したブロックの情報が表示されます。

gcloud compute reservations blocks describe example-reservation \
  --block-name=example-reservation-block-0001 \
  --project=example-project \
  --zone=us-central1-c

このコマンドを実行すると、次の出力が表示されます。

resource:
  count: 32
  creationTimestamp: '2025-11-05T15:00:15.223-08:00'
  healthInfo:
    degradedSubBlockCount: 0
    healthStatus: HEALTHY
    healthySubBlockCount: 2
  id: '2996501069483632657'
  inUseCount: 12
  kind: compute#reservationBlock
  name: example-reservation-block-0001
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
  reservationMaintenance:
    schedulingType: GROUPED
  reservationSubBlockCount: 2
  reservationSubBlockInUseCount: 1
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/2996501069483632657
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

出力の次の値は、予約内のブロックを表します。

  • count - ブロック内のホスト数
  • healthInfo.healthStatus - ブロックの全体的な健全性
  • healthInfo.healthySubblockCount - ブロック内の正常なサブブロックの数
  • id - ブロックの ID
  • inUseCount - 使用中のホストの数
  • kind - 説明されているオブジェクトの種類
  • name - ブロックの名前
  • physicalTopology.block - ブロック ID
  • physicalTopology.cluster - ブロックが配置されているクラスタ
  • reservationSubBlockCount - このブロック内のサブブロックの数
  • reservationSubBlockInUseCount - 使用中のサブブロックの数

ブロックのすべてのサブブロックを一覧表示する

ブロック内のサブブロックを一覧表示して、各サブブロックの情報を表示できます。

gcloud compute reservations sub-blocks list example-reservation \
  --block-name=example-reservation-block-0001 \
  --project=example-project \
  --zone=us-central1-c

このコマンドは、次の情報を表示します。

count: 16
creationTimestamp: '2025-11-05T15:00:16.738-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '8309376980435233263'
inUseCount: 0
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0001
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: a0122935eb54d02750b65eef2d4f0366
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0001
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/8309376980435233263
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c
---
count: 16
creationTimestamp: '2025-11-05T15:00:16.736-08:00'
healthInfo:
  degradedHostCount: 0
  degradedInfraCount: 0
  healthStatus: HEALTHY
  healthyHostCount: 16
  healthyInfraCount: 1
id: '5629213080155482607'
inUseCount: 12
kind: compute#reservationSubBlock
name: example-reservation-block-0001-subblock-0002
physicalTopology:
  block: 9a0e671424e45fd480ca172ad7a4e25d
  cluster: example-cluster
  subBlock: 7aca49831e54d32970631524bc060d9c
reservationSubBlockMaintenance:
  schedulingType: GROUPED
selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
status: READY
zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

出力の次の値は、予約のサブブロックを表します。

  • count - ホストの数
  • healthInfo.degradedInfraCount - Ironwood キューブの Optical Circuit Switch(OCS)の正常な状態。この値が 1 の場合、Ironwood キューブの OCS が低下していることを示します。この値は Trillium には適用されません
  • healthInfo.healthStatus - サブブロックの全体的な健全性
  • healthInfo.healthyHostCount - サブブロック内の正常なホストの数
  • id - ブロックの ID
  • inUseCount - 使用中のホストの数
  • kind - 説明されているオブジェクトの種類
  • name - サブブロックの名前
  • physicalTopology.block - このサブブロックを含むブロックの ID
  • physicalTopology.cluster - ブロックが配置されているクラスタ
  • physicalTopology.subblock - サブブロックの ID

予約サブブロックを取得する

gcloud compute sub-blocks describe を使用して、サブブロックに関する情報を確認できます。

gcloud compute reservations sub-blocks describe example-reservation \
  --block-name=example-reservation-block-0001 \
  --sub-block-name=example-reservation-block-0001-subblock-0002 \
  --project=example-project \
  --zone=us-central1-c

このコマンドは、次の情報を表示します。

resource:
  count: 16
  creationTimestamp: '2025-11-05T15:00:16.736-08:00'
  healthInfo:
    degradedHostCount: 0
    degradedInfraCount: 0
    healthStatus: HEALTHY
    healthyHostCount: 16
    healthyInfraCount: 1
  id: '5629213080155482607'
  inUseCount: 12
  kind: compute#reservationSubBlock
  name: example-reservation-block-0001-subblock-0002
  physicalTopology:
    block: 9a0e671424e45fd480ca172ad7a4e25d
    cluster: example-cluster
    subBlock: 7aca49831e54d32970631524bc060d9c
  reservationSubBlockMaintenance:
    schedulingType: GROUPED
  selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/example-reservation-block-0001-subblock-0002
  selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c/reservations/example-reservation/reservationBlocks/example-reservation-block-0001/reservationSubBlocks/5629213080155482607
  status: READY
  zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/us-central1-c

出力の次の値は、予約のサブブロックを表します。

  • count - ホストの数
  • healthInfo.degradedInfraCount - Ironwood キューブの Optical Circuit Switch(OCS)の正常な状態。この値が 1 の場合、Ironwood キューブの OCS が低下していることを示します。この値は Trillium には適用されません
  • healthInfo.healthStatus - サブブロックの全体的な健全性
  • healthInfo.healthyHostCount - サブブロック内の正常なホストの数
  • id - ブロックの ID
  • inUseCount - 使用中のホストの数
  • kind - 説明されているオブジェクトの種類
  • name - サブブロックの名前
  • physicalTopology.block - このサブブロックを含むブロックの ID
  • physicalTopology.cluster - ブロックが配置されているクラスタ
  • physicalTopology.subblock - サブブロックの ID

TPU VM インスタンスの物理的な位置を確認する

TPU スライスをプロビジョニングすると、TPU VM インスタンスの物理的な場所を取得できます。これにより、ワークロード スケジューリングの最適化のために TPU VM インスタンス間の相対距離を把握できます。

TPU VM インスタンスの物理的な場所は、curl または Google Cloud CLI を使用して確認できます。次の例は、予約「example-reservation」の TPU VM インスタンスの物理的なロケーションを示しています。

curl

curl -s -H "Metadata-Flavor: Google" http://metadata.google.internal/computeMetadata/v1/instance/attributes/physical_host_topology

gcloud

gcloud compute instances describe vm-1 \
--format="table[box,title=VM-Position](resourceStatus.physical_host_topology:label=location)" \
  --zone=ZONE

これらのコマンドはどちらも、指定した TPU VM のクラスタ、ブロック、サブブロック、ホストに関する情報を表示します。

block: 3feffcdeb6434d68bb818a836f75c1b8
cluster: southamerica-west1-cluster-njga
subblock: cbee689cb721abdb0c7f80a4f2d0c1c7
host: 36b2d9731c1e1cf8594a759c8c4178f0