tpu-info CLI로 모니터링
tpu-info CLI는 Cloud TPU 기기를 감지하고 메모리 사용량과 가동 주기를 비롯한 런타임 측정항목을 libtpu 라이브러리에서 읽는 도구입니다. 정적인 일회성 스냅샷과 지속적으로 측정항목을 모니터링하는 라이브 스트리밍을 지원합니다.
설치
pip를 사용하여 최신 출시 버전을 설치합니다.
pip install tpu-info
또는 소스에서 tpu-info를 설치합니다.
pip install git+https://github.com/google/cloud-accelerator-diagnostics/#subdirectory=tpu_info
tpu-info 버전을 이미 설치한 경우 환경과 호환되고 측정항목과 기능이 누락되지 않았는지 확인합니다.
자세한 내용은 기능 또는 측정항목 누락을 참조하세요.
CLI를 사용하여 표준 LibTPU 측정항목 액세스
다음 명령어를 사용하여 CLI로 기본 tpu-info 측정항목을 확인합니다.
tpu-info
출력은 다음과 비슷합니다.
TPU Chips
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━┳━━━━━━━━┓
┃ Chip ┃ Type ┃ Devices ┃ PID ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━╕━━━━━━━━━╕━━━━━━━━┩
│ /dev/vfio/0 │ TPU v6e chip │ 1 │ 1052 │
│ /dev/vfio/1 │ TPU v6e chip │ 1 │ 1052 │
│ /dev/vfio/2 │ TPU v6e chip │ 1 │ 1052 │
│ /dev/vfio/3 │ TPU v6e chip │ 1 │ 1052 │
└──────────────┴──────────────┴─────────┴────────┘
TPU Runtime Utilization
┏━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃ Chip ┃ HBM usage ┃ Duty cycle ┃
┡━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━╕━━━━━━━━━━━━┩
│ 8 │ 18.45 GiB / 31.25 GiB │ 100.00% │
│ 9 │ 10.40 GiB / 31.25 GiB │ 100.00% │
│ 12 │ 10.40 GiB / 31.25 GiB │ 100.00% │
│ 13 │ 10.40 GiB / 31.25 GiB │ 100.00% │
└────────┴──────────────────────────┴────────────┘
TensorCore Utilization
┏━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ Core ID ┃ TensorCore Utilization ┃
┡━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 0 │ 13.60%│
│ 1 │ 14.81%│
│ 2 │ 14.36%│
│ 3 │ 13.60%│
└─────────┴────────────────────────┘
TPU Buffer Transfer Latency
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┓
┃ Buffer Size ┃ P50 ┃ P90 ┃ P95 ┃ P999 ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━╕━━━━━━━━━━━━━━╕━━━━━━━━━━━━━━╕━━━━━━━━━━━━━━┩
│ 8MB+ │ 108978.82 us │ 164849.81 us │ 177366.42 us │ 212419.07 us │
│ 4MB+ │ 21739.38 us │ 38126.84 us │ 42110.12 us │ 55474.21 us │
└──────────────┴──────────────┴──────────────┴──────────────┴──────────────┘
TPU gRPC TCP Minimum RTT
┏━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━━┓
┃ P50 ┃ P90 ┃ P95 ┃ P999 ┃
┡━━━━━━━━━━╇━━━━━━━━━━╇━━━━━━━━━━╇━━━━━━━━━━┩
│ 35.99 us │ 52.15 us │ 53.83 us │ 55.51 us │
└──────────┴──────────┴──────────┴──────────┘
TPU gRPC TCP Delivery Rate
┏━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┓
┃ P50 ┃ P90 ┃ P95 ┃ P999 ┃
┡━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━┩
│ 12305.96 Mbps │ 18367.10 Mbps │ 24872.11 Mbps │ 44841.55 Mbps │
└───────────────┴───────────────┴───────────────┴───────────────┘
사용
현재 TPU 사용률 데이터를 보려면 tpu-info에 JAX 또는 PyTorch/XLA와 같은 지원되는 ML 프레임워크를 사용하여 실행 중인 TPU 워크로드가 필요합니다. 터미널에서 다음 플래그를 사용하여 tpu-info 명령어를 실행할 수 있습니다.
프로세스
--process 또는 -p 플래그를 사용하여 TPU에서 실행되는 프로세스에 관한 정보를 표시합니다.
$ tpu-info --process
출력은 다음과 비슷하게 표시됩니다.
TPU Process Info
┏━━━━━━━━━━━━━┳━━━━━━━━┳━━━━━━━━━━━━━━┓
┃ Chip ┃ PID ┃ Process Name ┃
┡━━━━━━━━━━━━━╇━━━━━━━━╇━━━━━━━━━━━━━━┩
│ /dev/vfio/0 │ 799657 │ python3 │
│ /dev/vfio/1 │ 799657 │ python3 │
│ /dev/vfio/2 │ 799657 │ python3 │
│ /dev/vfio/3 │ 799657 │ python3 │
│ /dev/vfio/4 │ 799657 │ python3 │
│ /dev/vfio/5 │ 799657 │ python3 │
│ /dev/vfio/6 │ 799657 │ python3 │
│ /dev/vfio/7 │ 799657 │ python3 │
└─────────────┴────────┴──────────────┘
측정항목
--metric 플래그를 사용하여 특정 측정항목을 표시합니다. 공백으로 구분하여 여러 측정항목을 지정할 수 있습니다. 일반적으로 지원되는 측정항목은 다음과 같습니다.
hbm_usageduty_cycle_percenttensorcore_utilizationbuffer_transfer_latencyhost_to_device_transfer_latencydevice_to_host_transfer_latencycollective_e2e_latency
$ tpu-info --metric duty_cycle_percent hbm_usage
출력은 다음과 비슷하게 표시됩니다.
TPU Duty Cycle
┏━━━━━━━━━┳━━━━━━━━━━━━━━━━┓
┃ Core ID ┃ Duty Cycle (%) ┃
┡━━━━━━━━━╇━━━━━━━━━━━━━━━━┩
│ 0 │ 100.00% │
│ 1 │ 100.00% │
│ 2 │ 100.00% │
│ 3 │ 100.00% │
│ 4 │ 100.00% │
│ 5 │ 100.00% │
│ 6 │ 100.00% │
│ 7 │ 100.00% │
└─────────┴────────────────┘
TPU HBM Usage
┏━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━┓
┃ Chip ┃ HBM Usage (GiB) ┃
┡━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━┩
│ 0 │ 29.50 GiB / 31.25 GiB │
│ 1 │ 21.50 GiB / 31.25 GiB │
│ 2 │ 21.50 GiB / 31.25 GiB │
│ 3 │ 21.50 GiB / 31.25 GiB │
│ 4 │ 21.50 GiB / 31.25 GiB │
│ 5 │ 21.50 GiB / 31.25 GiB │
│ 6 │ 21.50 GiB / 31.25 GiB │
│ 7 │ 21.50 GiB / 31.25 GiB │
└────────┴───────────────────────┘
측정항목 나열
--list_metrics 플래그를 사용하여 --metric 플래그로 요청할 수 있는 지원되는 모든 측정항목을 표시합니다.
$ tpu-info --list_metrics
출력은 다음과 비슷하게 표시됩니다.
╭─ Supported Metrics ─────────────────────────────────────────────────────────────────────────────╮
│ grpc_tcp_min_rtt │
│ host_to_device_transfer_latency │
│ grpc_tcp_delivery_rate │
│ buffer_transfer_latency │
│ collective_e2e_latency │
│ device_to_host_transfer_latency │
│ hbm_usage │
│ duty_cycle_percent │
│ tensorcore_utilization │
╰─────────────────────────────────────────────────────────────────────────────────────────────────╯
측정항목 스트리밍
스트리밍 모드는 주기적으로 새로고침하여 최신 사용률 통계를 표시합니다. LibTPU 측정항목을 스트리밍하려면 tpu-info 명령어에 --streaming 플래그를 추가합니다. --rate 플래그를 사용하여 스트리밍의 빈도를 초 단위로 제어합니다.
다음 명령어를 사용하여 CLI로 기본 tpu-info 측정항목을 스트리밍합니다.
# Refresh metrics every 2 seconds
tpu-info --streaming --rate 2
출력은 다음과 비슷합니다.
Refresh rate: 0.1s
Last update: 2025-07-24 11:00:59 UTC
Libtpu version: 0.0.19.dev20250721+nightly
Accelerator type: v6e
TPU Chips
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━┳━━━━━━━━┓
┃ Chip ┃ Type ┃ Devices ┃ PID ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━╢━━━━━━━━━╢━━━━━━━━┪
│ /dev/vfio/0 │ TPU v6e chip │ 1 │ 1022 │
│ /dev/vfio/1 │ TPU v6e chip │ 1 │ 1022 │
│ /dev/vfio/2 │ TPU v6e chip │ 1 │ 1022 │
│ /dev/vfio/3 │ TPU v6e chip │ 1 │ 1022 │
└──────────────┴──────────────┴─────────┴────────┘
TPU Runtime Utilization
┏━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃ Chip ┃ HBM usage ┃ Duty cycle ┃
┡━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━╕━━━━━━━━━━━━┩
│ 8 │ 17.26 GiB / 31.25 GiB │ 100.00% │
│ 9 │ 9.26 GiB / 31.25 GiB │ 100.00% │
│ 12 │ 9.26 GiB / 31.25 GiB │ 100.00% │
│ 13 │ 9.26 GiB / 31.25 GiB │ 100.00% │
└────────┴──────────────────────────┴────────────┘
TensorCore Utilization
┏━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ Core ID ┃ TensorCore Utilization ┃
┡━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 0 │ 15.17%│
│ 1 │ 14.62%│
│ 2 │ 14.68%│
│ 3 │ 15.14%│
└─────────┴────────────────────────┘
TPU Buffer Transfer Latency
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┓
┃ Buffer Size ┃ P50 ┃ P90 ┃ P95 ┃ P999 ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━╕━━━━━━━━━━━━━━╕━━━━━━━━━━━━━━╕━━━━━━━━━━━━━━┩
│ 8MB+ │ 18264.03 us │ 33263.06 us │ 35990.98 us │ 53997.32 us │
└──────────────┴──────────────┴──────────────┴──────────────┴──────────────┘
TPU gRPC TCP Minimum RTT
┏━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━━┓
┃ P50 ┃ P90 ┃ P95 ┃ P999 ┃
┡━━━━━━━━━━╇━━━━━━━━━━╇━━━━━━━━━━╇━━━━━━━━━━┩
│ 35.99 us │ 52.15 us │ 53.83 us │ 55.51 us │
└──────────┴──────────┴──────────┴──────────┘
TPU gRPC TCP Delivery Rate
┏━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┓
┃ P50 ┃ P90 ┃ P95 ┃ P999 ┃
┡━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━┩
│ 12305.96 Mbps │ 18367.10 Mbps │ 24872.11 Mbps │ 44841.55 Mbps │
└───────────────┴───────────────┴───────────────┴───────────────┘
TPU-Z 측정항목
TPU-Z는 TPU의 원격 분석 및 디버깅 기능입니다. 호스트에 연결된 모든 TPU 코어의 자세한 런타임 상태 정보를 제공합니다. 이 기능은 libtpu Python SDK의 libtpu.sdk 모듈에 포함된 tpuz 모듈을 통해 제공됩니다. 이 모듈은 각 코어의 상태 스냅샷을 제공합니다.
TPU-Z의 기본 사용 사례는 분산 TPU 워크로드에서 중단 또는 교착 상태를 진단하는 것입니다. 호스트에서 TPU-Z 서비스를 쿼리하여 모든 코어의 상태를 캡처하고, 모든 코어에서 프로그램 카운터, HLO 위치, 실행 ID를 비교하여 이상치를 식별할 수 있습니다.
다음 명령어를 사용하여 CLI로 TPU-Z 측정항목을 확인합니다.
tpu-info --metric core_state
tpu-info --metric sequencer_state
tpu-info --metric sequencer_state_detailed
tpu-info --metric queued_program
출력에는 core_state, sequencer_state, sequencer_state_detailed, queued_programs 테이블이 포함됩니다.
핵심 상태 정보
핵심 상태 정보(core_state) 테이블은 지정된 칩의 코어에 관한 정보를 제공합니다. TPU에는 세대에 따라 칩당 코어가 1개 또는 2개 있습니다.
| 필드 | 설명 | 예시 값 |
|---|---|---|
| 칩 ID | 코어가 속한 칩의 ID입니다. | 0 |
| 전역 코어 ID | 전체 TPU 시스템 내 코어의 고유 ID입니다. | 1 |
| 코어 유형 | TPU 코어의 유형입니다. | "TPU_CORE_TYPE_TENSOR_CORE""TPU_CORE_TYPE_SPARSE_CORE" |
| xdb 서버 실행 | 가속기 디버거(XDB) 서버가 특정 TPU 코어에서 실행되고 있는지 여부를 나타냅니다. | True |
출력은 다음 테이블과 비슷하게 표시됩니다.
Core Information
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┓
┃ Chip ID ┃ Global Core ID┃ Core Type ┃ xdb Server ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━┩
│ 0 │ 0 │ TPU_CORE_TYPE_TENSOR_CORE │ True │
│ 0 │ 1 │ TPU_CORE_TYPE_SPARSE_CORE │ True │
│ 1 │ 2 │ TPU_CORE_TYPE_SPARSE_CORE │ False │
│ 1 │ 3 │ TPU_CORE_TYPE_SPARSE_CORE │ False │
│ 2 │ 4 │ TPU_CORE_TYPE_SPARSE_CORE │ True │
│ 2 │ 5 │ TPU_CORE_TYPE_SPARSE_CORE │ True │
└──────────────┴───────────────┴─────────────────────────────┴───────────────┘
시퀀서 상태 정보
시퀀서 상태 정보(sequencer_state) 테이블은 코어의 시퀀서 상태에 관한 정보를 제공합니다. 시퀀서는 TPU 코어 내에서 명령어 실행을 가져오고 디코딩하고 조정하는 역할을 하는 제어 단위입니다. 단일 코어에 여러 시퀀서가 있을 수 있습니다.
| 측정항목 | 설명 | 예시 값 |
|---|---|---|
| 칩 ID | 코어가 속한 칩의 ID입니다. | 0 |
| 전역 코어 ID | 전체 TPU 시스템 내 코어의 고유 ID입니다. | 1 |
| 프로그램 카운터 | 시퀀서에서 실행할 명령어의 메모리 주소입니다. | 15390 |
| TraceMark | 현재 또는 가장 최근 프로그램의 출시 ID입니다. 해당하지 않는 경우 이 필드는 없습니다. | 2147483647 |
| 프로그램 ID | TPU 코어에서 실행하기 위해 출시되는 프로그램의 특정 인스턴스와 연결된 ID입니다. | 3230481660274331500 |
| 실행 ID | 프로그램과 연결된 실행 ID입니다. | 1150 |
| 시퀀스 유형 | 시퀀서 유형입니다. | "TPU_SEQUENCER_TYPE_SPARSE_CORE_SEQUENCER""TPU_SEQUENCER_TYPE_SPARSE_CORE_TILE_EXECUTE_CORE_SEQUENCER" |
출력은 다음 테이블과 비슷하게 표시됩니다.
Sequencer Info
┏━━━━━━┳━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ Chip ┃ Global┃ Program ┃ Tracemark ┃ Program ID ┃ Run ┃ Sequence Type ┃
┃ ID ┃ Core ┃ Counter:Tag ┃ ┃ ┃ ID ┃ ┃
┡━━━━━━╇━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 0 │ 0 │ 760:1 │ 2147483647 │ -5.75e17 │ 1150 │ TPU_SEQ_SPARSE_CORE_SEQUENCER │
│ 0 │ 1 │ 9:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 0 │ 1 │ 0:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 1 │ 2 │ 9:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 1 │ 3 │ 0:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 1 │ 3 │ 9:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 1 │ 3 │ 0:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 2 │ 4 │ 9:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 2 │ 4 │ 0:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 2 │ 4 │ 9:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 2 │ 5 │ 9:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
│ 2 │ 5 │ 0:0 │ 0 │ -1 │ -1 │ TPU_SEQ_SPARSE_TILE_EXECUTE │
└━━━━━━┴━━━━━━━┴━━━━━━━━━━━━━━━┴━━━━━━━━━━━━━━━┴━━━━━━━━━━━━━━━┴━━━━━━━┴────────────────────────────────┘
시퀀서 상태 정보(세부정보)
시퀀서 상태 정보(세부정보)(sequencer_state_detailed) 테이블은 시퀀서 상태 정보(sequencer_state) 테이블의 모든 정보와 다음 추가 측정항목을 제공합니다.
| 측정항목 | 설명 | 예시 값 |
|---|---|---|
| HLO 세부정보 | 자세한 HLO 정보를 제공합니다(있는 경우). | [] |
| 큐에 추가된 프로그램 실행 ID | 이 큐에 추가된 프로그램의 실행 ID입니다. | 81 |
| 큐에 추가된 프로그램 출시 ID | 이 큐에 추가된 프로그램의 출시 ID입니다. | 1394130914 |
| 코어 오류 | 이 코어의 오류 메시지를 포함합니다. 오류가 없는 경우 이 필드는 없습니다. | "Failed to parse launch id: 0xdcf36153" |
| HLO 위치 | 고수준 옵티마이저(HLO) 위치 정보입니다. | "no HLO mapping""HLO: fusion.11; HLO computation: main.126_spmd" |
출력은 다음 테이블과 비슷하게 표시됩니다.
Sequencer States (Detailed)
┏━━━━━━━━━┳━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━┓
┃ Chip ID ┃ Global Core ID ┃ Program Counter ┃ Tracemark ┃ Program ID ┃ Run ID ┃ Sequence Type ┃ Core Error ┃ HLO Location ┃ HLO Details ┃
┡━━━━━━━━━╇━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━┩
│ 0 │ 0 │ 760 │ 2147483647 │ -5752110712385440928 │ 114 │ TPU_SEQUENCER_TYPE_TENSOR_CORE_SEQUENCER │ Failed to parse launch id: 0xdcf36109 │ no HLO mapping │ [] │
│ 0 │ 1 │ 9 │ 0 │ -1 │ -1 │ TPU_SEQUENCER_TYPE_SPARSE_CORE_SEQUENCER │ Compiler metadata or executable │ None │ None │
│ │ │ │ │ │ │ │ fingerprint not found. │ │ │
│ 0 │ 1 │ 0 │ 0 │ -1 │ -1 │ TPU_SEQUENCER_TYPE_SPARSE_CORE_TILE_EXE… │ Compiler metadata or executable │ None │ None │
│ │ │ │ │ │ │ │ fingerprint not found. │ │ │
│ 0 │ 1 │ 0 │ 0 │ -1 │ -1 │ TPU_SEQUENCER_TYPE_SPARSE_CORE_TILE_EXE… │ Compiler metadata or executable │ None │ None │
│ ... │ ... │ │ ... │ ... │ ... │ ... │ ... │... │ ... │
└─────────┴────────────────┴─────────────────┴────────────┴──────────────────────┴────────┴──────────────────────────────────────────┴──────────────────────────────────────────┴────────────────┴─────────────┘
큐에 추가된 프로그램
큐에 추가된 프로그램(queued_programs) 테이블에는 실행을 위해 큐에 추가된 프로그램 목록이 표시됩니다.
| 측정항목 | 설명 | 예시 값 |
|---|---|---|
| 칩 ID | 코어가 속한 칩의 ID입니다. | 0 |
| 전역 코어 | 전체 TPU 시스템 내 코어의 고유 ID입니다. | 1 |
| 프로그램 카운터:태그 | 시퀀서에서 실행할 명령어의 메모리 주소입니다. | 15390 |
| TraceMark | 현재 또는 가장 최근 프로그램의 출시 ID입니다. 해당하지 않는 경우 이 필드는 없습니다. | 2147483647 |
| 프로그램 ID | TPU 코어에서 실행하기 위해 출시되는 프로그램의 특정 인스턴스와 연결된 ID입니다. | 3230481660274331500 |
| 실행 ID | 프로그램과 연결된 실행 ID입니다. | 1150 |
| 시퀀스 유형 | 시퀀서 유형입니다. | "\ufffdU\ufffd4j\u7c6e\ufffd\ufffd{\u0017\ufffd\ufffdHHV\ufffdD\ufffde\uff" |
Queued Programs
┏━━━━━━┳━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ Chip ┃ Global┃ Program ┃ Tracemark ┃ Program ID ┃ Run ┃ Sequence Type ┃
┃ ID ┃ Core ┃ Counter:Tag ┃ ┃ ┃ ID ┃ ┃
┡━━━━━━╇━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 0 │ 0 │ 10712385440928│ 1220 │ -5.75e17 │ 1220 │ \ufffdU\...ufffd{\u0017\...\ufffde |
│ 0 │ 1 │ 31435440272417│ 1530 │ -1 │ 1530 │ \ufff4j\...\ufffd{\u0017\...\ufffde|
│ 0 │ 1 │ 10230672051156│ 1410 │ -1 │ 1410 │ \ufffde\...\ufffd{\u0017\...\ufffde|
│ ... │ ... │ ... │ ... │ ... │ ... │ ... │
└━━━━━━┴━━━━━━━┴━━━━━━━━━━━━━━━┴━━━━━━━━━━━┴━━━━━━━━━━━━━┴━━━━━━━┴────────────────────────────────────┘
기능 또는 측정항목 누락
일부 기능이나 측정항목을 볼 수 없는 경우 가장 일반적인 원인은 오래된 libtpu 버전입니다. tpu-info 내의 기능과 측정항목은 libtpu 출시 버전에 포함되어 있으며, 오래된 버전에는 새로운 기능과 측정항목이 누락되어 있을 수 있습니다.
tpu-info 버전이 환경과 호환되는지 확인하려면 --version 또는 -v 플래그를 사용하세요.
$ tpu-info --version
다음 출력은 호환되는 환경의 예를 보여줍니다.
- tpu-info version: 0.5.1
- libtpu version: 0.0.18
- accelerator type: v6e
다음 출력은 호환되지 않는 환경의 예를 보여줍니다.
- tpu-info version: 0.5.1
- libtpu version: N/A (incompatible environment)
- accelerator type: N/A (incompatible environment)
오래된 버전을 사용하는 경우 최신 버전의 libtpu로 업데이트합니다.
pip install --upgrade libtpu