使用 Compute Engine 管理 TPU 資源
本頁說明如何使用 Compute Engine 連線至 TPU VM、查看相關資訊、刪除或重設 TPU VM。
管理 TPU VM
您與 TPU VM 的互動方式,與任何 Compute Engine VM 相同。不過,您無法暫停或停止 TPU VM。您也無法重設多主機 TPU VM。
連線至 TPU VM
連線至 TPU VM 的方式與連線至任何其他 Compute Engine 執行個體相同。詳情請參閱「連線至 Linux VM」。
查看 TPU VM 的相關資訊
您可以查看 TPU VM 和 MIG 的資訊,方式與查看任何 Compute Engine 執行個體或 MIG 相同。
- 如要列出專案中的所有 VM,請參閱「取得 VM 清單」。
- 如要列出所有 MIG,請參閱「列出 MIG」。
- 如要查看 TPU VM 的詳細資料,請參閱「查看 VM 的詳細資料」。
- 如要查看 MIG 的相關資訊,請參閱「查看 MIG 的屬性」。
- 如要查看多主機 TPU 配量的狀態,請參閱「查看 TPU 配量的狀態」。
重設 TPU VM 執行個體
重設 TPU VM 執行個體與重設電腦類似,例如按下重設按鈕或按住電源按鈕。重設作業不會執行正常重新啟動,因此您可能會遺失未儲存的資料。建議您在下列情況下重設執行個體:
- 您想將執行個體重新初始化為啟動狀態,確保達到最佳效能和穩定性。
- 您想在客層 OS 發生當機且沒有回應後繼續執行工作負載,但除了重設執行個體外,沒有其他選項。
如要進一步瞭解如何重設 TPU VM 執行個體,請參閱 Compute Engine 說明文件中的「重設作業」。
刪除 TPU VM 執行個體
如要瞭解如何刪除 TPU VM 執行個體,請參閱 Compute Engine 說明文件中的「刪除 Compute Engine 執行個體」。
更新 TPU VM 執行個體屬性
您可以更新執行中 TPU VM 執行個體的屬性。詳情請參閱「更新執行個體屬性」。
在 MIG 中套用新的 VM 設定
如要瞭解如何在代管執行個體群組 (MIG) 中套用新的 TPU VM 設定,請參閱「在 MIG 中套用新的 VM 設定」。
後續步驟
- 瞭解如何使用單一主機 TPU 節點建立 MIG。
- 瞭解如何使用多主機 TPU 配量建立 MIG。
- 瞭解 GKE 中的 TPU。
- 瞭解如何在 TPU 上執行機器學習工作負載,例如在 TPU 上使用 vLLM 提供 Qwen2-72B-Instruct 服務。