建立 Managed Lustre 執行個體

Google Cloud Managed Lustre 執行個體是雲端中的完整 Lustre 檔案系統。可掛接至 Compute Engine VM 或 Google Kubernetes Engine (GKE) 叢集。您可以使用標準 POSIX 術語存取執行個體上的資料。

建立 Managed Lustre 執行個體時,必須定義下列屬性:

  • 執行個體的名稱,由 Google Cloud使用。
  • 檔案系統名稱,供 lfs 等用戶端工具使用。
  • 儲存空間容量 (GiB)。容量範圍為 9,000 GiB 至 40,032,000 GiB (38.2 PiB)。執行個體的大小上限取決於效能層級。
  • 效能等級。Managed Lustre 提供多種效能層級,從每 TiB 125 MBps 到每 TiB 1000 MBps 不等。
  • 位置。如要發揮最佳效能,請將執行個體放在與用戶端 VM 或 GKE 叢集相同的區域。
  • 這個執行個體的虛擬私有雲網路。這個網路必須與 VM 或叢集使用的網路相同。
  • 是否要從 GKE 叢集存取這個執行個體。由於 Lustre 和 GKE 預設都會使用通訊埠 988,因此這項設定會變更 Lustre 通訊埠,避免發生衝突。

效能層級和儲存空間容量上限

Managed Lustre 提供 4 個效能層級,每個層級的每 TiB 最大處理量速度都不同。效能層級也會影響執行個體的最小和最大大小,以及可接受容量值之間的步距。執行個體建立後,就無法變更執行個體的效能層級。

級別 最低容量 最大容量 移動增量大小
每 TiB 125 MB/秒 72,000 GiB 12,240,000 GiB (11.7 PiB) 72,000 GiB
每 TiB 250 MB/秒 36,000 GiB 40,032,000 GiB (38.2 PiB) 儲存空間容量最高 6,120,000 GiB:36,000 GiB
儲存空間容量超過 6,120,000 GiB:288,000 GiB
每 TiB 500 MB/秒 18,000 GiB 20,016,000 GiB (19.1 PiB) 儲存空間容量最高 3,060,000 GiB:18,000 GiB
儲存空間容量超過 3,060,000 GiB:144,000 GiB
每 TiB 1000 MB/秒 9,000 GiB 10,008,000 GiB (9.5 PiB) 儲存空間容量最高 1,530,000 GiB:9,000 GiB
儲存空間容量超過 1,530,000 GiB:72,000 GiB

執行個體大小達到特定門檻後,步階大小就會改變。 請使用下列計算機,找出所選效能層級的有效容量。

執行個體建立後,您可以增加儲存空間容量,但不得超過效能層級和步距允許的最大值。如果您在層級的較小步距範圍內建立執行個體,之後就無法將執行個體大小增加到步距門檻以上。詳情請參閱「增加容量的限制」。

容量計算機

選取效能層級並輸入目標容量,即可找出最接近的有效大小。系統會根據層級的最小值和步階大小,將有效大小無條件進位。

儲存空間容量配額

可用儲存空間容量配額取決於多項因素,包括執行個體位置和要求的效能層級。

預設儲存空間容量配額是每個區域的每個虛擬私有雲 (VPC) 網路,且所有效能層級共用此配額。使用某個層級的容量會減少其他層級的可用儲存空間配額。

所需權限

如要建立新的 Managed Lustre 執行個體,您必須具備專案的 Managed Lustre 管理員 (roles/lustre.admin) IAM 權限。

詳情請參閱「使用 IAM 控管存取權」。

此外,您還必須啟用 Managed Lustre API

建立執行個體

您可以透過下列介面建立新的 Managed Lustre 執行個體。

gcloud

如要建立新的 Managed Lustre 執行個體,請使用 gcloud lustre instances create 指令:

gcloud lustre instances create INSTANCE_ID \
  --per-unit-storage-throughput=PER_UNIT_STORAGE_THROUGHPUT \
  --capacity-gib=CAPACITY_GIB \
  --filesystem=FILESYSTEM \
  --location=LOCATION \
  --network=NETWORK_PATH

必須指定下列值:

  • INSTANCE_ID 是這個 Managed Lustre 執行個體的名稱。必須:

    • 只能包含小寫字母、數字和連字號。
    • 並以英文字母開頭。
    • 長度介於 1 至 63 個字元之間。
    • 結尾必須是數字或英文字母。
    • 在專案和位置中不得重複。
  • --per-unit-storage-throughput 是執行個體的最大總處理量,單位為每 TiB 的 MBps。有效值為 1252505001000。您選擇的總處理量會影響執行個體的儲存空間容量下限和上限。

  • --capacity-gib 是執行個體的儲存空間容量,以 GiB 為單位。允許的值取決於您指定的儲存空間總處理量層級。詳情請參閱「效能層級和儲存空間容量上限」一節。

  • --filesystem 是指派給這個 Lustre 檔案系統的名稱。這個名稱會用於用戶端指令,包括 mountlfs。長度不得超過 8 個字元,只能包含英文字母和/或數字,且會區分大小寫。

    建議您選擇在虛擬私有雲中所有 Managed Lustre 執行個體之間不重複的名稱。這樣一來,單一 GKE 節點就能使用多個執行個體。

  • --location 必須是 Managed Lustre 支援的有效 Google Cloud 區域。如需完整清單,請參閱「支援的地點」。

  • --network 是執行個體所屬虛擬私有雲網路的完整路徑,格式為 projects/PROJECT_ID/global/networks/NETWORK。請參閱「設定虛擬私有雲網路」。

  • --project 是您的 Google Cloud 專案 ID。

選用旗標如下:

  • --kms-key-name 指定用於加密這個執行個體的客戶管理加密金鑰。詳情請參閱「Managed Lustre 的客戶管理加密金鑰」。

  • --gke-support-enabled 會建立可供 Google Kubernetes Engine 叢集使用的執行個體。將 Lustre LNet accept_port 設為 6988。

    指定 --gke-support-enabled 時,如要從 Compute Engine VM 連線,您必須更新 VM 上的 LNet 設定檔。請參閱「gke-support-enabled 執行個體設定 LNet」。

  • --async (選用) 會以非同步方式執行指令。Google Cloud CLI 會傳回作業 ID,您可以使用該 ID 查詢指令的狀態,不必等待執行個體建立完成。

如果要求成功,系統會傳回作業 ID:

Create request issued for: [$INSTANCE_ID]
Waiting for operation [projects/$PROJECT_ID/locations/us-central1-a/operations/
operation-1234567890-609d21deae6f0-befaf0bc-867b1aa1] to complete...

建立容量為 9,000 GiB 的執行個體約需 15 分鐘,建立容量為 12,240,000 GiB (11.7 PiB) 的執行個體則最多需要一小時。如需查看要求狀態的操作說明,請參閱「查詢執行個體建立狀態」。

REST

如要使用 REST API 建立執行個體,請將要求傳送至下列端點:

POST https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/ZONE/instances?instanceId=INSTANCE_ID
Authorization: Bearer AUTH_TOKEN
{
  "filesystem": string,
  "perUnitStorageThroughput": int64,
  "capacityGib": int64,
  "network": string,
  "gkeSupportEnabled": boolean
}

必須指定下列值:

  • PROJECT_ID 是您的 Google Cloud 專案 ID。

  • ZONE 必須是 Managed Lustre 支援的有效 Google Cloud 區域。如需完整清單,請參閱「支援的地點」。

  • INSTANCE_ID 是這個 Managed Lustre 執行個體的名稱。必須:

    • 只能包含小寫字母、數字和連字號。
    • 並以英文字母開頭。
    • 長度介於 1 至 63 個字元之間。
    • 結尾必須是數字或英文字母。
    • 在專案和位置中不得重複。
  • filesystem 是指派給這個 Lustre 檔案系統的名稱。這個名稱會用於用戶端指令,包括 mountlfs。長度不得超過 8 個字元,只能包含英文字母和/或數字,且會區分大小寫。

    建議您選擇在虛擬私有雲中所有 Managed Lustre 執行個體之間不重複的檔案系統名稱。這樣一來,單一 GKE 節點就能使用多個執行個體。

  • perUnitStorageThroughput 是執行個體的最大總處理量,單位為每 TiB 的 MBps。有效值為 1252505001000。您選擇的總處理量會影響執行個體的儲存空間容量下限和上限。

  • capacityGib 是執行個體的儲存空間容量,以 GiB 為單位。允許的值取決於您指定的儲存空間總處理量層級。詳情請參閱「效能層級和儲存空間容量上限」一節。

  • network 是執行個體所屬虛擬私有雲網路的完整路徑,格式為 projects/PROJECT_ID/global/networks/NETWORK。請參閱「設定虛擬私有雲網路」。

以下為選用欄位:

  • kmsKey 指定用於加密這個執行個體的客戶管理加密金鑰。詳情請參閱「Managed Lustre 的客戶管理加密金鑰」。

  • gkeSupportEnabled,表示這個執行個體可供 Google Kubernetes Engine 叢集使用。將 Lustre LNet accept_port 設為 6988。

    指定 gkeSupportEnabled 時,如要從 Compute Engine VM 連線,您必須更新 VM 上的 LNet 設定檔。請參閱「gke-support-enabled 執行個體設定 LNet」。

這個 API 支援執行個體的其他選填欄位。如需完整清單和說明,請參閱 Instance 資源參考文件

Google Cloud 控制台

  1. 前往 Google Cloud 控制台的「Managed Lustre」頁面。

    前往 Managed Lustre

  2. 點按「Create」(建立)。系統會顯示「建立執行個體」頁面。

  3. 輸入專屬的「執行個體名稱」,並視需要輸入說明。 Google Cloud 會使用執行個體名稱識別這個執行個體。

  4. 輸入檔案系統名稱。這是用戶端工具 (例如 lfs) 使用的名稱。長度不得超過 8 個字元,只能包含英文字母和/或數字,且會區分大小寫。

  5. 選取要建立這個執行個體的區域和可用區。執行個體應與要連線的 Compute Engine VM 或 Google Kubernetes Engine 叢集位於相同區域和可用區。

  6. 選取這個執行個體的效能層級。

  7. 指定執行個體的儲存空間容量 (GiB)。有效值取決於您選取的儲存空間處理量層級。詳情請參閱「效能層級和儲存空間容量上限」一節。

  8. 在「Encryption」(加密) 區段中,選取「Google-managed encryption key」(Google 代管加密金鑰) 或「Cloud Key Management Service key」(Cloud Key Management Service 金鑰)。如要瞭解 Cloud Key Management Service 金鑰選項,請參閱「Managed Lustre 的客戶代管加密金鑰」。

  9. 如要從 GKE 叢集連線至這個執行個體,請選取「啟用 GKE 支援」。這個選項會將 Lustre LNet accept_port 設為 6988。

    指定「啟用 GKE 支援」時,如要從 Compute Engine VM 連線,必須更新 VM 上的 LNet 設定檔。請參閱「gke-support-enabled 執行個體設定 LNet」。

  10. 選取您在「建立虛擬私有雲網路」中建立的「網路」

頁面的「摘要」部分會根據您的選擇更新,顯示預估費用。

按一下「提交」繼續操作。執行個體建立程序需要 15 分鐘到 1 小時不等,視執行個體容量而定。

查詢執行個體建立狀態

您可以透過下列介面查詢建立要求的狀態。

gcloud

如要查詢建立作業的狀態,您可以取得作業或執行個體。

如要取得執行個體:

gcloud lustre instances describe INSTANCE_NAME \
  --location=ZONE

建立狀態是 state 的值。

如要取得作業,請使用執行個體建立回應中的作業 ID。作業 ID 的格式如下:

  • operation-1234567890123-6127783ad26ea-88913969-02748053
gcloud lustre operations describe OPERATION_ID \
  --location=LOCATION

建立狀態是 done 的值。

建立執行個體後,對執行個體發出的 get 要求會傳回類似下列的回應。

請記下「mountPoint」欄位中的 IP 位址和檔案系統名稱,掛接執行個體時需要這些值。

capacityGib: '27000'
createTime: '2025-03-14T00:07:34.308574307Z'
filesystem: lustre-fs
mountPoint: 10.115.0.3@tcp:/testfs
name: projects/$PROJECT/locations/us-central1-a/instances/$INSTANCE_NAME
network: projects/$PROJECT/global/networks/default
state: ACTIVE
updateTime: '2025-03-14T00:15:37.101024263Z'

REST

如要查詢建立作業的狀態,請使用回應中的作業 ID。作業 ID 的格式如下:

  • operation-1234567890123-6127783ad26ea-88913969-02748053

將要求傳送至下列端點:

GET https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/ZONE/operations/OPERATION_ID
Authorization: Bearer

如果成功,回應主體會包含 Operation 的執行個體。

Google Cloud 控制台

  1. 前往 Google Cloud 控制台的「Managed Lustre」頁面。

    前往 Managed Lustre

  2. 在清單中按一下執行個體名稱。系統會顯示「執行個體詳細資料」頁面,其中包含執行個體建立要求的目前狀態。

後續步驟