管理 TPU Spot VM
Spot VM 可提供未使用的容量,並享有大幅折扣。Spot VM 可能隨時遭到先占 (關閉),但與先占 TPU 不同,執行時間沒有限制。您無法重新啟動 TPU Spot VM,遭到先占後必須重新建立。如要進一步瞭解 Spot VM,請參閱 Compute Engine 說明文件中的 Spot VM 相關內容。
建立 TPU Spot VM
您可以使用排入佇列的資源建立 TPU Spot VM,這會將建立要求加入佇列,並在容量可用時提供給您。建議您將 TPU 建立為佇列資源。詳情請參閱佇列資源使用者指南。
以下範例說明如何使用佇列資源建立 TPU Spot VM:
gcloud
在 gcloud compute tpus queued-resources 指令中新增 --spot 旗標:
gcloud compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=NODE_ID \ --zone=europe-west4-a \ --accelerator-type=v3-8 \ --runtime-version=tpu-vm-tf-2.17.1-pod-pjrt \ --spot
curl
將 spot: {} 新增至要求主體:
curl -X POST https://tpu.googleapis.com/v2alpha1/projects/PROJECT_ID/locations/europe-west4-a/queuedResources?queued_resource_id=QUEUED_RESOURCE_ID \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ tpu: { node_spec: { parent: "projects/PROJECT_ID/locations/europe-west4-a", node_id: "NODE_ID", node: { accelerator_type: "v3-8", runtime_version: "tpu-vm-tf-2.17.1-pod-pjrt" } } }, spot: {} }'
控制台
前往 Google Cloud 控制台的「TPUs」頁面:
按一下「建立 TPU」。
在「Name」(名稱) 欄位中,輸入 TPU 的名稱。
在「Zone」(可用區) 方塊中,選取要建立 TPU 的可用區。
在「TPU type」(TPU 類型) 方塊中,選取加速器類型。加速器類型會指定要建立的 Cloud TPU 版本和大小。如要進一步瞭解各個 TPU 版本支援的加速器類型,請參閱「TPU 版本」。
在「TPU 軟體版本」方塊中,選取軟體版本。建立 Cloud TPU VM 時,TPU 軟體版本會指定要安裝的 TPU 執行階段版本。詳情請參閱「TPU 軟體版本」。
按一下「啟用佇列」切換鈕。
在「Queued resource name」(已排隊資源名稱) 欄位中,輸入已排隊資源要求的名稱。
展開「管理」部分。
選取「將此設為 TPU Spot VM」核取方塊。
點選「建立」。
您也可以不使用佇列資源,直接建立 TPU Spot VM:
gcloud
在 gcloud compute tpus tpu-vm 指令中新增 --spot 旗標:
gcloud compute tpus tpu-vm create TPU_NAME \ --zone=europe-west4-a \ --accelerator-type=v3-8 \ --version=tpu-vm-tf-2.17.1-pod-pjrt \ --spot
curl
將 scheduling_config: {spot: true} 新增至要求主體:
curl -X POST https://tpu.googleapis.com/v2/projects/PROJECT_ID/locations/europe-west4-a/nodes?node_id=TPU_NAME \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ accelerator_type: "v3-8", runtime_version: "tpu-vm-tf-2.17.1-pod-pjrt", network_config: {enable_external_ips: true}, scheduling_config: {spot: true} }'
控制台
前往 Google Cloud 控制台的「TPUs」頁面:
按一下「建立 TPU」。
在「Name」(名稱) 欄位中,輸入 TPU 的名稱。
在「Zone」(可用區) 方塊中,選取要建立 TPU 的可用區。
在「TPU type」(TPU 類型) 方塊中,選取加速器類型。加速器類型會指定要建立的 Cloud TPU 版本和大小。如要進一步瞭解各個 TPU 版本支援的加速器類型,請參閱「TPU 版本」。
在「TPU 軟體版本」方塊中,選取軟體版本。建立 Cloud TPU VM 時,TPU 軟體版本會指定要安裝的 TPU 執行階段版本。詳情請參閱「TPU 軟體版本」。
展開「管理」部分。
選取「將此設為 TPU Spot VM」核取方塊。
點選「建立」。
檢查 TPU VM 是否為 Spot VM
gcloud
如要確認 TPU VM 是否為 Spot VM,請使用 describe 指令:
gcloud compute tpus tpu-vm describe TPU_NAME --zone=europe-west4-a
如果 TPU VM 是 Spot VM,輸出內容會包含設為 true 的 spot 欄位,類似以下內容:
...
schedulingConfig:
spot: true
...
控制台
前往 Google Cloud 控制台的「TPUs」頁面:
按一下 Cloud TPU 的名稱。
如果 TPU VM 是 Spot VM,則「層級」會顯示「Spot VM」。
定價與配額
TPU Spot VM 的價格遠低於隨需和預留 TPU。如要進一步瞭解定價,請參閱 Cloud TPU 定價。
如要使用 TPU Spot VM,您需要先占配額。詳情請參閱「配額」。