性能考虑因素

本页面介绍了如何配置 Google Cloud Managed Lustre 环境以获得最佳性能。

性能规范

以下性能数字是近似最大值。

IOPS

IOPS 上限随预配的实例容量线性扩缩(以 TiB 为单位)。

吞吐量层级 读取 IOPS(每 TiB) 写入 IOPS(每 TiB)
125 MBps per TiB 725 700
250 MBps per TiB 1,450 1400
500 MBps per TiB 2,900 2,800
1000 MBps per TiB 5,800 5,600

元数据操作

每 72 GBps 的预配吞吐量可增加的最大元数据操作数。

文件统计信息 文件创建 文件删除
每 72 GBps 每秒 41 万次 每秒 115,000 次 每秒 95,000 次

增加容量后的性能

增加现有实例的存储空间容量会提高其最大吞吐量和 IOPS,还可能会提高其元数据性能。

随着新数据写入并重新分布到额外的存储空间中,读取吞吐量性能会逐渐提高。写入吞吐量性能立即提升。

VPC 网络最大传输单元 (MTU)

创建 VPC 网络时,将 mtu(最大传输单元,即可在此网络上传输的最大 IP 数据包的大小)的值设置为允许的最大值 8896 后,性能可提高多达 10%(与默认值 1460 字节相比)。

您可以使用以下命令查看网络的当前 MTU 值:

gcloud compute networks describe NETWORK_NAME --format="value(mtu)"

网络创建后,可以更新网络的 MTU 值,但需要注意一些重要事项。如需了解详情,请参阅更改网络的 MTU

Compute Engine 机器类型

网络吞吐量可能会受到所选机器类型的影响。一般来说,为了获得最佳吞吐量:

  • 增加 vCPU 数量。每个实例的最大出站流量带宽通常为每个 vCPU 2 Gbps,最高可达机器类型上限。
  • 选择支持更高入站和出站流量限制的机器系列。例如,使用 Tier_1 网络的 C2 实例支持高达 100 Gbps 的出站流量带宽。使用 Tier_1 网络的 C3 实例支持高达 200 Gbps 的带宽。
  • 使用更大的机器类型来启用每个虚拟机的 Tier_1 网络性能
  • 使用 Google 虚拟 NIC (gVNIC)。对于第 3 代及更新的机器类型,gVNIC 是唯一选择。使用 Tier_1 网络时,必须使用 gVNIC。

如需了解详情,请参阅网络带宽

衡量单客户端性能

如需测试单个 Compute Engine 客户端的读取和写入性能,请使用 fio灵活的 I/O 测试工具)命令行工具。

  1. 安装 fio:

    Rocky 8

    sudo dnf install fio -y
    

    Ubuntu 20.04 和 22.04

    sudo apt update
    sudo install fio
    
  2. 运行以下命令:

    fio --ioengine=libaio --filesize=32G --ramp_time=2s \
    --runtime=5m --numjobs=16 --direct=1 --verify=0 --randrepeat=0 \
    --group_reporting --directory=/lustre --buffer_compress_percentage=50 \
    --name=read --blocksize=1m --iodepth=64 --readwrite=read
    

测试大约需要 5 分钟才能完成。完成后,系统会显示结果。根据您的配置,您可以获得高达虚拟机的最大网络速度的吞吐量,以及每 TiB 数千 IOPS。