高效能機器類型的自動設定值

本文說明如何自動設定高效能 Compute Engine 機器類型使用的預設 Cloud Storage FUSE 值,這些值旨在為高輸送量工作負載最佳化效能。掛接時手動設定的值會覆寫這些預設值。

機器類型

下列高效能 Compute Engine 機器類型的設定值會自動設定:

系列類型 機型
A2 系列機型
a2-megagpu-16g
a2-ultragpu-8g
A3 系列機型
a3-edgegpu-8g
a3-highgpu-8g
a3-megagpu-8g
a3-ultragpu-8g
A4 系列機型
4-highgpu-8g-lowmem
TPU v5e
ct5l-hightpu-8t
ct5lp-hightpu-8t
TPU v5p
ct5p-hightpu-4t
ct5p-hightpu-4t-tpu
TPU v6e (Trillium)
ct6e-standard-4t
ct6e-standard-4t-tpu
ct6e-standard-8t
ct6e-standard-8t-tpu

自動設定值

偵測到支援的機型時,Cloud Storage FUSE 會自動套用下列設定值:

Cloud Storage FUSE 設定檔欄位 Cloud Storage FUSE CLI 選項 自動設定值
metadata-cache.negative-ttl-secs --metadata-cache-negative-ttl-secs 0
metadata-cache.ttl-secs1 --metadata-cache-ttl-secs1

-1

metadata-cache.stat-cache-max-size-mb --stat-cache-max-size-mb 1024
metadata-cache.type-cache-max-size-mb --type-cache-max-size-mb 128
implicit-dirs --implicit-dirs true
file-system.rename-dir-limit --rename-dir-limit 200000

1將這項設定設為 -1,系統一律會從快取提供檔案,大幅提升效能。請注意,這項設定會略過一致性檢查,可能導致系統放送過時資料。如要瞭解如何管理資料一致性,請參閱「Cloud Storage FUSE 快取總覽」。

進一步調整效能

使用高效能 Google Cloud 機型時,系統會自動套用本頁詳述的設定值。不過,您可以透過下列方法進一步微調機器,以達到最佳效能:

  • 請參閱效能調整最佳做法指南,瞭解如何運用 Cloud Storage FUSE 的主要功能和設定,盡可能提高輸送量並達到最佳效能。

  • 如果您在 Google Kubernetes Engine 叢集上執行訓練、服務或檢查點作業,並使用 Cloud GPU 或 Cloud TPU 存取 Cloud Storage 中的大型資料集,可以利用預先設定的 YAML 檔案,直接將 Cloud Storage 值區掛接到 Pod 中,更有效率地簡化設定。如要進一步瞭解如何使用預先設定的 GKE YAML 檔案,請參閱「使用預先設定的 GKE YAML 檔案,提升 Cloud Storage FUSE 效能」一文。

  • 如果您使用 Cloud Storage FUSE 執行訓練、服務或檢查點工作負載,可以透過profile 欄位--profile 指令選項,根據特定工作負載類型自動調整特定 Cloud Storage FUSE 設定,以達到最佳效能。詳情請參閱「根據設定檔設定 AI/ML 工作負載」。

後續步驟