本页面介绍了如何配置 Google Cloud Managed Lustre 环境以获得最佳性能。
性能规范
以下性能数字是近似最大值。
IOPS
IOPS 上限随预配的实例容量线性扩缩(以 TiB 为单位)。
| 吞吐量层级 | 读取 IOPS(每 TiB) | 写入 IOPS(每 TiB) |
|---|---|---|
125 MBps per TiB |
725 | 700 |
250 MBps per TiB |
1,450 | 1400 |
500 MBps per TiB |
2,900 | 2,800 |
1000 MBps per TiB |
5,800 | 5,600 |
元数据操作
每 72 GBps 的预配吞吐量可增加的最大元数据操作数。
| 文件统计信息 | 文件创建 | 文件删除 | |
|---|---|---|---|
| 每 72 GBps | 每秒 41 万次 | 每秒 115,000 次 | 每秒 95,000 次 |
增加容量后的性能
增加现有实例的存储空间容量会提高其最大吞吐量和 IOPS,还可能会提高其元数据性能。
随着新数据写入并重新分布到额外的存储空间中,读取吞吐量性能会逐渐提高。写入吞吐量性能立即提升。
VPC 网络最大传输单元 (MTU)
创建 VPC 网络时,将 mtu(最大传输单元,即可在此网络上传输的最大 IP 数据包的大小)的值设置为允许的最大值 8896 后,性能可提高多达 10%(与默认值 1460 字节相比)。
您可以使用以下命令查看网络的当前 MTU 值:
gcloud compute networks describe NETWORK_NAME --format="value(mtu)"
网络创建后,可以更新网络的 MTU 值,但需要注意一些重要事项。如需了解详情,请参阅更改网络的 MTU。
Compute Engine 机器类型
网络吞吐量可能会受到所选机器类型的影响。一般来说,为了获得最佳吞吐量:
- 增加 vCPU 数量。每个实例的最大出站流量带宽通常为每个 vCPU 2 Gbps,最高可达机器类型上限。
- 选择支持更高入站和出站流量限制的机器系列。例如,使用 Tier_1 网络的 C2 实例支持高达 100 Gbps 的出站流量带宽。使用 Tier_1 网络的 C3 实例支持高达 200 Gbps 的带宽。
- 使用更大的机器类型来启用每个虚拟机的 Tier_1 网络性能。
- 使用 Google 虚拟 NIC (gVNIC)。对于第 3 代及更新的机器类型,gVNIC 是唯一选择。使用 Tier_1 网络时,必须使用 gVNIC。
如需了解详情,请参阅网络带宽。
衡量单客户端性能
如需测试单个 Compute Engine 客户端的读取和写入性能,请使用 fio(灵活的 I/O 测试工具)命令行工具。
安装 fio:
Rocky 8
sudo dnf install fio -yUbuntu 20.04 和 22.04
sudo apt update sudo install fio运行以下命令:
fio --ioengine=libaio --filesize=32G --ramp_time=2s \ --runtime=5m --numjobs=16 --direct=1 --verify=0 --randrepeat=0 \ --group_reporting --directory=/lustre --buffer_compress_percentage=50 \ --name=read --blocksize=1m --iodepth=64 --readwrite=read
测试大约需要 5 分钟才能完成。完成后,系统会显示结果。根据您的配置,您可以获得高达虚拟机的最大网络速度的吞吐量,以及每 TiB 数千 IOPS。