パフォーマンスに関する注意事項

このページでは、最高のパフォーマンスを実現するように Google Cloud Managed Lustre 環境を構成するためのガイダンスを提供します。

パフォーマンス仕様

次のパフォーマンス値は、おおよその最大値です。

IOPS

最大 IOPS は、プロビジョニングされたインスタンス容量の 1 TiB あたりで線形にスケーリングされます。

スループット ティア 読み取り IOPS(TiB あたり) 書き込み IOPS(TiB あたり)
125 MBps per TiB 725 700
250 MBps per TiB 1,450 1,400
500 MBps per TiB 2,900 2,800
1000 MBps per TiB 5,800 5,600

メタデータ オペレーション

プロビジョニングされたスループット 72 GBps ごとに、メタデータ オペレーションの最大数が段階的に増加します。

ファイルの統計情報 ファイルの作成 ファイルの削除
72 GBps あたり 410,000/秒 115,000/秒 95,000/秒

容量増加後のパフォーマンス

既存のインスタンスのストレージ容量を増やすと、最大スループットと IOPS が増加し、メタデータのパフォーマンスも向上する可能性があります。

新しいデータが書き込まれ、追加のストレージに再分散されるにつれて、読み取りスループットのパフォーマンスが徐々に向上します。書き込みスループットのパフォーマンスがすぐに向上します。

VPC ネットワークの最大伝送単位(MTU)

VPC ネットワークを作成するときに、mtu(最大伝送単位: このネットワーク上で送信可能な最大の IP パケットサイズ)の値を、デフォルトの 1, 460 バイトから、許可されている最大値の 8, 896 バイトに設定すると、性能が最大で約 10 %向上します。

ネットワークの現在の MTU 値は、次のコマンドで確認できます。

gcloud compute networks describe NETWORK_NAME --format="value(mtu)"

ネットワークの MTU 値は、ネットワークの作成後に更新できますが、重要な考慮事項があります。詳細については、ネットワークの MTU を変更するをご覧ください。

Compute Engine のマシンタイプ

ネットワーク スループットは、選択したマシンタイプの影響を受ける可能性があります。一般に、最適なスループットを得るには:

  • vCPU の数を増やします。インスタンスあたりの最大下り(外向き)帯域幅は、通常は vCPU あたり 2 Gbps で、マシンタイプの上限までです。
  • より高い上り(内向き)と下り(外向き)の制限をサポートするマシンシリーズを選択します。たとえば、Tier_1 ネットワーキングを備えた C2 インスタンスは、最大 100 Gbps の下り(外向き)帯域幅をサポートします。Tier_1 ネットワーキング対応の C3 インスタンスは、最大 200 Gbps をサポートします。
  • より大きいマシンタイプを使用して、VM あたりの Tier_1 ネットワーキング パフォーマンスを有効にします。
  • Google Virtual NIC(gVNIC)を使用します。gVNIC は、第 3 世代以降のマシンタイプでの唯一のオプションです。Tier_1 ネットワーキングを使用する場合は、gVNIC が必要です。

詳細については、ネットワーク帯域幅をご覧ください。

単一クライアントのパフォーマンスを測定する

単一の Compute Engine クライアントから読み取りと書き込みのパフォーマンスをテストするには、fioフレキシブル I/O テスター)コマンドライン ツールを使用します。

  1. fio をインストールします。

    Rocky 8

    sudo dnf install fio -y
    

    Ubuntu 20.04 と 22.04

    sudo apt update
    sudo install fio
    
  2. 次のコマンドを実行します。

    fio --ioengine=libaio --filesize=32G --ramp_time=2s \
    --runtime=5m --numjobs=16 --direct=1 --verify=0 --randrepeat=0 \
    --group_reporting --directory=/lustre --buffer_compress_percentage=50 \
    --name=read --blocksize=1m --iodepth=64 --readwrite=read
    

テストの完了には、約 5 分かかります。完了すると、結果が表示されます。構成によっては、VM の最大ネットワーク速度までのスループットと、TiB あたり数千の IOPS が期待できます。