使用 Compute Engine 管理 TPU 资源
本页面介绍了如何使用 Compute Engine 连接到 TPU 虚拟机、查看其相关信息、删除或重置 TPU 虚拟机。
管理 TPU 虚拟机
您与 TPU 虚拟机的互动方式与任何 Compute Engine 虚拟机一样。不过,您无法暂停或停止 TPU 虚拟机。您也无法重置多主机 TPU 虚拟机。
连接到 TPU 虚拟机
您可以通过与连接任何其他 Compute Engine 实例相同的方式连接到 TPU 虚拟机。如需了解详情,请参阅连接到 Linux 虚拟机。
查看 TPU 虚拟机的相关信息
您可以像查看任何 Compute Engine 实例或 MIG 一样,查看 TPU 虚拟机和 MIG 的相关信息。
- 如需列出项目中的所有虚拟机,请参阅获取虚拟机列表。
- 如需列出所有 MIG,请参阅列出 MIG。
- 如需查看 TPU 虚拟机的详细信息,请参阅查看虚拟机的详细信息。
- 如需查看有关 MIG 的信息,请参阅查看 MIG 的属性。
- 如需查看多主机 TPU 切片的状态,请参阅查看 TPU 切片的状态。
重置 TPU 虚拟机实例
重置 TPU 虚拟机实例类似于重置计算机,例如,按下重置按钮或按住电源按钮。重置操作不会执行安全重启,您可能会丢失未保存的数据。建议您在以下情况下重置实例:
- 您希望将实例重新初始化为启动状态,以帮助确保最佳性能和稳定性。
- 在客机操作系统崩溃且无响应,且无法通过其他方式恢复工作负载时,您希望通过重置实例来恢复运行。
如需详细了解如何重置 TPU 虚拟机实例,请参阅 Compute Engine 文档中的重置操作。
删除 TPU 虚拟机实例
如需了解如何删除 TPU 虚拟机实例,请参阅 Compute Engine 文档中的删除 Compute Engine 实例。
更新 TPU 虚拟机实例属性
您可以更新正在运行的 TPU 虚拟机实例的属性。如需了解详情,请参阅更新实例属性。
在 MIG 中应用新的虚拟机配置
如需了解如何在代管式实例组 (MIG) 中应用新的 TPU 虚拟机配置,请参阅在 MIG 中应用新的虚拟机配置。
后续步骤
- 了解如何创建包含单主机 TPU 切片的 MIG。
- 了解如何创建具有多主机 TPU 切片的 MIG。
- 了解 GKE 中的 TPU。
- 了解如何在 TPU 上运行机器学习工作负载,例如在 TPU 上使用 vLLM 部署 Qwen2-72B-Instruct。