建立 Managed Lustre 執行個體

Google Cloud Managed Lustre 執行個體是雲端中的完整 Lustre 檔案系統。您可以將其掛接至 Compute Engine VM 或 Kubernetes Engine 叢集。您可以使用標準 POSIX 術語存取執行個體上的資料。

建立 Managed Lustre 執行個體時,您必須定義下列屬性:

  • 執行個體的名稱,由 Google Cloud使用。
  • 檔案系統名稱,供 lfs 等用戶端工具使用。
  • 儲存空間容量 (GiB)。容量範圍為 9,000 GiB 至 12,240,000 GiB (11.67 PiB)。執行個體的大小上限取決於效能層級。
  • 效能等級。Managed Lustre 提供多種效能等級,從每 TiB 125 MBps 到每 TiB 1000 MBps 不等。
  • 地點。如要獲得最佳效能,請將執行個體置於與用戶端 VM 或 GKE 叢集相同的區域。
  • 這個執行個體的虛擬私有雲網路。這個網路必須與 VM 或叢集使用的網路相同。
  • 這個執行個體是否會從 Kubernetes Engine (GKE) 叢集存取。 由於 Lustre 和 GKE 預設都會使用通訊埠 988,因此這項設定會變更 Lustre 通訊埠,避免發生衝突。

效能層級和儲存空間容量上限

Managed Lustre 提供 4 個效能層級,每個層級的每 TiB 最大處理量速度都不同。效能層級也會影響執行個體的最小和最大大小,以及可接受容量值之間的步階大小。

級別 容量下限 最大容量 移動增量大小
每 TiB 125 MB/秒 72,000 GiB 12,240,000 GiB (11.67 PiB) 72,000 GiB
每 TiB 250 MB/秒 36,000 GiB 6,120,000 GiB (5.84 PiB) 36,000 GiB
每 TiB 500 MB/秒 18,000 GiB 3,060,000 GiB (2.92 PiB) 18,000 GiB
每 TiB 1000 MB/秒 9,000 GiB 1,530,000 GiB (1.46 PiB) 9,000 GiB

執行個體建立後,就無法變更效能層級。

所需權限

如要建立新的 Managed Lustre 執行個體,您必須具備專案的 Managed Lustre 管理員 (roles/lustre.admin) IAM 權限。

詳情請參閱「使用 IAM 控管存取權」。

此外,您還必須啟用 Managed Lustre API

建立執行個體

您可以透過下列介面建立新的 Managed Lustre 執行個體。

gcloud

如要建立新的 Managed Lustre 執行個體,請使用 gcloud lustre instances create 指令:

gcloud lustre instances create INSTANCE_ID \
  --per-unit-storage-throughput=PER_UNIT_STORAGE_THROUGHPUT \
  --capacity-gib=CAPACITY_GIB \
  --filesystem=FILESYSTEM \
  --location=LOCATION \
  --network=NETWORK_PATH

必須指定下列值:

  • INSTANCE_ID 是這個 Managed Lustre 執行個體的名稱。必須:

    • 只能包含小寫字母、數字和連字號。
    • 並以英文字母開頭。
    • 長度介於 1 至 63 個字元之間。
    • 結尾必須是數字或英文字母。
    • 在專案和位置中不得重複。
  • --per-unit-storage-throughput 是執行個體的最大總處理量,以每 TiB 的 MBps 為單位。有效值為 1252505001000。您選擇的總處理量會影響執行個體的儲存空間容量下限和上限。

  • --capacity-gib 是執行個體的儲存空間容量,以 gibibytes (GiB) 為單位。允許的值取決於您指定的儲存空間總處理量層級。詳情請參閱「效能層級和儲存空間容量上限」一節。

  • --filesystem 是指派給這個 Lustre 檔案系統的名稱。這個名稱會用於用戶端指令,包括 mountlfs。長度不得超過 8 個字元,只能包含英文字母和/或數字,且會區分大小寫。

    建議您選擇在虛擬私有雲中所有 Managed Lustre 執行個體都不重複的名稱。這樣一來,單一 GKE 節點就能使用多個執行個體。

  • --location 必須是 Managed Lustre 支援的有效 Google Cloud 區域。如需完整清單,請參閱「支援的地點」。

  • --network 是執行個體所屬虛擬私有雲網路的完整路徑,格式為 projects/PROJECT_ID/global/networks/NETWORK。請參閱「設定虛擬私有雲網路」。

  • --project 是您的 Google Cloud 專案 ID。

選用旗標如下:

  • --kms-key-name 指定用來加密這個執行個體的客戶管理加密金鑰。詳情請參閱「Managed Lustre 的客戶管理加密金鑰」。

  • --gke-support-enabled 會建立可供 Google Kubernetes Engine 叢集使用的執行個體。將 Lustre LNet accept_port 設為 6988。

    指定 --gke-support-enabled 時,如要從 Compute Engine VM 連線,您必須更新 VM 上的 LNet 設定檔。請參閱gke-support-enabled 執行個體設定 LNet

  • --async (選用) 會以非同步方式執行指令。Google Cloud CLI 會傳回作業 ID,您可以使用該 ID 查詢指令的狀態,不必等待執行個體建立完成。

如果要求成功,系統會傳回作業 ID:

Create request issued for: [$INSTANCE_ID]
Waiting for operation [projects/$PROJECT_ID/locations/us-central1-a/operations/
operation-1234567890-609d21deae6f0-befaf0bc-867b1aa1] to complete...

建立容量為 9,000 GiB 的執行個體約需 15 分鐘,建立容量為 12,240,000 GiB (11.67 PiB) 的執行個體則最多需要一小時。如要瞭解如何查看要求狀態,請參閱「查詢執行個體建立狀態」。

REST

如要使用 REST API 建立執行個體,請將要求傳送至下列端點:

POST https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/ZONE/instances?instanceId=INSTANCE_ID
Authorization: Bearer AUTH_TOKEN
{
  "filesystem": string,
  "perUnitStorageThroughput": int64,
  "capacityGib": int64,
  "network": string,
  "gkeSupportEnabled": boolean
}

必須指定下列值:

  • PROJECT_ID 是您的 Google Cloud 專案 ID。

  • ZONE 必須是 Managed Lustre 支援的有效 Google Cloud 區域。如需完整清單,請參閱「支援的地點」。

  • INSTANCE_ID 是這個 Managed Lustre 執行個體的名稱。必須:

    • 只能包含小寫字母、數字和連字號。
    • 並以英文字母開頭。
    • 長度介於 1 至 63 個字元之間。
    • 結尾必須是數字或英文字母。
    • 在專案和位置中不得重複。
  • filesystem 是指派給這個 Lustre 檔案系統的名稱。這個名稱會用於用戶端指令,包括 mountlfs。長度不得超過 8 個字元,只能包含英文字母和/或數字,且會區分大小寫。

    建議您選擇在虛擬私有雲中所有 Managed Lustre 執行個體之間不重複的檔案系統名稱。這樣一來,單一 GKE 節點就能使用多個執行個體。

  • perUnitStorageThroughput 是執行個體的最大總處理量,以每 TiB 的 MBps 為單位。有效值為 1252505001000。您選擇的總處理量會影響執行個體的儲存空間容量下限和上限。

  • capacityGib 是執行個體的儲存空間容量,以 gibibytes (GiB) 為單位。允許的值取決於您指定的儲存空間總處理量層級。詳情請參閱「效能層級和儲存空間容量上限」一節。

  • network 是執行個體所屬 VPC 網路的完整路徑,格式為 projects/PROJECT_ID/global/networks/NETWORK。請參閱「設定虛擬私有雲網路」。

以下為選用欄位:

  • kmsKey 指定用來加密這個執行個體的客戶管理加密金鑰。詳情請參閱「Managed Lustre 的客戶管理加密金鑰」。

  • gkeSupportEnabled,表示這個執行個體可供 Google Kubernetes Engine 叢集使用。將 Lustre LNet accept_port 設為 6988。

    指定 gkeSupportEnabled 時,如要從 Compute Engine VM 連線,您必須更新 VM 上的 LNet 設定檔。請參閱gke-support-enabled 執行個體設定 LNet

這個 API 支援執行個體的其他選填欄位。如需完整清單和說明,請參閱 Instance 資源參考說明文件

Google Cloud 控制台

  1. 前往 Google Cloud 控制台的「Managed Lustre」(受管理 Lustre) 頁面。

    前往 Managed Lustre

  2. 點按「Create」(建立)。系統會顯示「建立執行個體」頁面。

  3. 輸入專屬的「執行個體名稱」,並視需要輸入說明。 Google Cloud 會使用執行個體名稱識別這個執行個體。

  4. 輸入「Filesystem」(檔案系統)名稱。這是用戶端工具 (例如 lfs) 使用的名稱。長度不得超過 8 個字元,只能包含英文字母和/或數字,且會區分大小寫。

  5. 選取要建立這個執行個體的區域和可用區。執行個體應與要連線的 Compute Engine VM 或 Google Kubernetes Engine 叢集位於相同區域和可用區。

  6. 選取這個執行個體的效能層級。

  7. 指定執行個體的儲存空間容量 (GiB)。有效值取決於您選取的儲存空間輸送量層級。詳情請參閱「效能層級和儲存空間容量上限」一節。

  8. 在「Encryption」(加密) 區段中,選取「Google-managed encryption key」(Google 代管加密金鑰) 或「Cloud Key Management Service key」(Cloud Key Management Service 金鑰)。如要瞭解 Cloud Key Management Service 金鑰選項,請參閱「Managed Lustre 的客戶代管加密金鑰」。

  9. 如要從 GKE 叢集連線至這個執行個體,請選取「啟用 GKE 支援」。這個選項會將 Lustre LNet accept_port 設為 6988。

    指定「啟用 GKE 支援」時,如要從 Compute Engine VM 連線,必須更新 VM 上的 LNet 設定檔。請參閱gke-support-enabled 執行個體設定 LNet

  10. 選取您在「建立虛擬私有雲網路」中建立的「網路」

頁面的「摘要」部分會根據您的選擇更新,顯示預估費用。

按一下「提交」繼續操作。執行個體建立程序需要 15 分鐘到 1 小時不等,視執行個體容量而定。

查詢執行個體建立狀態

您可以透過下列介面查詢建立要求的狀態。

gcloud

如要查詢建立作業的狀態,您可以取得作業或執行個體。

如要取得執行個體:

gcloud lustre instances describe INSTANCE_NAME \
  --location=ZONE

建立狀態是 state 的值。

如要取得作業,請使用執行個體建立回應中的作業 ID。作業 ID 的格式如下:

  • operation-1234567890123-6127783ad26ea-88913969-02748053
gcloud lustre operations describe OPERATION_ID \
  --location=LOCATION

建立狀態是 done 的值。

建立執行個體後,對執行個體發出的 get 要求會傳回類似下列的回應。

請記下 mountPoint 欄位中的 IP 位址和檔案系統名稱,掛接執行個體時需要這些值。

capacityGib: '27000'
createTime: '2025-03-14T00:07:34.308574307Z'
filesystem: lustre-fs
mountPoint: 10.115.0.3@tcp:/testfs
name: projects/$PROJECT/locations/us-central1-a/instances/$INSTANCE_NAME
network: projects/$PROJECT/global/networks/default
state: ACTIVE
updateTime: '2025-03-14T00:15:37.101024263Z'

REST

如要查詢建立作業的狀態,請使用回應中的作業 ID。作業 ID 的格式如下:

  • operation-1234567890123-6127783ad26ea-88913969-02748053

向下列端點傳送要求:

GET https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/ZONE/operations/OPERATION_ID
Authorization: Bearer

如果成功,回應主體會包含 Operation 的執行個體。

Google Cloud 控制台

  1. 前往 Google Cloud 控制台的「Managed Lustre」(受管理 Lustre) 頁面。

    前往 Managed Lustre

  2. 在清單中按一下執行個體名稱。系統會顯示「執行個體詳細資料」頁面,其中包含執行個體建立要求的目前狀態。

後續步驟