Compute Engine 实例预配模型

本文档介绍了 Compute Engine 实例的预配模型。

创建实例时,您必须定义要用于获取所请求资源的方法,即预配模型。 每种预配模型都会影响实例的可用性、生命周期和价格。了解这些模型后,您可以为自己的工作负载选择最佳方案。

可用的预配模型

创建计算实例时,您可以指定以下预配模型之一。如果您未指定预配模型,Compute Engine 将默认使用标准预配模型。

  • 标准

  • Spot

  • 灵活启动

  • 受预留约束

下表可帮助您比较每种预配模型的用例和价格:

标准 Spot 灵活启动 受预留约束
摘要
  • 根据资源可用性,您可以立即创建实例。
  • 您可以控制何时停止或删除实例。
  • 根据资源可用性,您可以立即创建实例。
  • 您可以控制何时停止或删除实例。不过,Compute Engine 也可能会随时停止或删除实例以回收容量。
  • 根据资源可用性,您可以在指定的等待时间内创建实例。对于独立实例,您可以指定最长两小时的等待时间。对于 MIG 调整大小请求,等待时间是不确定的。
  • 您可以控制何时停止或删除实例。不过,您无法停止、暂停或重新创建这些实例。实例的运行时间最短为 10 分钟,最长为 7 天。当实例达到运行时长时,Compute Engine 会根据终止操作停止或删除这些实例。
  • 您可以请求在未来某个日期预留容量,以便创建挂接了 GPU 的实例。如果 Google Cloud 批准了您的请求,Compute Engine 会创建预留。在预留期开始时,您可以通过创建与预留匹配的 GPU 实例来使用预留。
  • 在预留批准期间,您可以根据需要停止、重启、删除并重新创建实例,以使用预留。当预留期结束时,Compute Engine 会删除预留,并根据终止操作停止或删除任何使用该预留的实例。
使用场景

非常适合需要稳定性和持续运行的工作负载,例如以下工作负载:

  • 网络服务器
  • 数据库
  • 企业应用
  • 开发和测试

非常适合可容忍中断的工作负载,例如以下工作负载:

  • 批处理
  • 高性能计算 (HPC)
  • 持续集成和持续部署 (CI/CD)
  • 数据分析
  • 媒体编码
  • 在线推理

需要稳定性且运行时间不超过 7 天的工作负载,例如以下工作负载:

  • 小型模型预训练
  • 模型微调
  • HPC 模拟
  • 批量推理

非常适合需要稳定性和特定运行时的工作负载,例如:

  • 对于持续时间不超过 90 天的工作负载

    • 模型预训练作业
    • 模型微调作业
    • HPC 模拟工作负载
    • 预计短期内会增加的推理工作负载
  • 对于超过 90 天的工作负载

    • 训练工作负载
    • 推理工作负载
价格
  • 您需要按标准价格付费。请参阅虚拟机实例价格
  • 您需要根据用于创建实例的方法支付费用:

    • 如果您立即创建实例,则采用随用随付 (PAYG) 模式。
    • 如果您通过使用按需预留或为未来预留自动创建的预留来创建实例,则系统会一直向您收取费用,直到预留失效为止。如需了解详情,请参阅预留结算
  • 许多机器类型、GPU、TPU 和本地 SSD 磁盘可享受最高 91% 的折扣。如需了解详情,请参阅 Spot 虚拟机价格
  • 随用随付。
  • 根据实例使用的机器系列,您可以获得以下折扣:

    • 对于 A4、A3 和 A2 机器系列,您可以获得 53% 的 vCPU、内存和 GPU 折扣。
    • 对于 H4D 机器系列,您可以获得 25% 的 vCPU 和内存折扣。
    其他受支持的机器系列不符合享受折扣的条件。如需了解详情,请参阅动态工作负载调度器 (DWS) 价格
  • 随用随付。
  • 您需要根据预留容量以创建实例的方式支付费用,具体如下:

  • 您需要支付预留期的费用。如需了解详情,请参阅预留结算
Quota 创建实例时,系统会消耗标准配额。 创建实例时,系统会消耗抢占式配额。如果您的项目缺少抢占式配额,则会使用标准配额。Google Cloud 免费层级赠金不适用于 Spot 虚拟机。 当 MIG 向该组添加实例时,抢占型配额会被消耗。如果您的项目缺少抢占式配额,则会使用标准配额。 配额不适用于预留绑定预配模型。

实例可用性和生命周期

下表显示了每种预配模型的计算实例可用性和生命周期:

标准 Spot 灵活启动 受预留约束
创建前提条件 无创建前提条件。 无创建前提条件。 无创建前提条件。

如需创建实例,您必须先使用以下方法之一预留容量:

在您选择的交付日期和时间,Compute Engine 会预配您请求的容量。然后,您可以通过创建实例来使用该容量。

支持的机器系列 您可以使用任何机器系列,但 A4X、A4 和 A3 Ultra 除外。 您可以使用任何机器系列,但 A4X、X4 和裸金属实例除外。

您只能使用以下机器系列:

根据您预留容量以创建虚拟机的方式,您只能使用以下机器系列:

实例可用性 只要您请求的资源可用,就可以随时创建实例。 只要您请求的资源可用,就可以随时创建实例。

您可以按如下方式创建实例:

Compute Engine 会使用 DWS 来根据资源可用性安排预配您请求的容量。DWS 有助于您获得 GPU 等高需求资源。

仅在为未来日期预留容量后,您才能创建实例。在您指定的日期,Compute Engine 会提供您请求的容量,然后您可以使用这些容量创建实例。 如果您使用日历模式下的未来预留来预留资源,Compute Engine 会使用 DWS 来预配您请求的容量。DWS 有助于您获得 GPU 等高需求资源。
容量保证 基于创建方法。容量保证因您用于创建实例的方法而异,具体如下:
  • 如果您立即创建实例,Compute Engine 会尽力预配您请求的容量。
  • 如果您通过使用按需预留或为未来预留自动创建的预留来创建实例,则如果预留有可用的预留容量,您可以极高地保证 Compute Engine 预配您请求的容量。
尽力而为。创建 Spot 虚拟机时,Compute Engine 会尽力尝试预配您请求的容量。 尽力而为。当您创建 MIG 规模调整请求时,Compute Engine 会尽力尝试安排预配您请求的容量。 非常高。如果 Google Cloud 批准了您的预留请求,您就可以极高地保证 Compute Engine 会在您选择的交付日期和时间预配您预留的容量。在预留期内,您可以独占使用预留的容量。
实例生命周期 您可以控制何时停止或删除实例。不过,如果实例使用的机器类型不支持实时迁移,则 Compute Engine 会在主机维护事件期间停止实例。

您可以控制何时停止或删除实例,但在以下情况下除外:

  • Compute Engine 会停止或删除实例以回收容量。此过程称为抢占
  • 如果实例使用的机器类型不支持实时迁移,则 Compute Engine 会在主机维护事件期间停止实例。

在实例运行时长结束之前,您可以执行以下操作:

  • 停止实例:只有在实例创建为独立实例的情况下,您才能随时停止该实例。
  • 删除实例:您可以随时删除实例。

当实例达到运行时长时,Compute Engine 会将其删除。

您可以控制何时停止或删除实例,但在以下情况下除外:

  • Compute Engine 会在主机维护事件期间停止实例。
  • 用于预配您请求容量的自动创建预留到达其承诺预留期的结束时间。届时,Compute Engine 会删除预留,并根据其配置中指定的终止操作停止或删除任何使用该预留的实例。

为密集部署预配模型

如需在 Google Cloud上部署高性能计算 (HPC)、人工智能 (AI) 和机器学习 (ML) 工作负载,计算资源必须在物理上彼此靠近,以最大限度地减少网络跃点并针对最低延迟时间进行优化。Compute Engine 提供多种预配方法,让您可以在单个数据中心内预留通过高速网络结构互连的紧密耦合的主机组。

如需详细了解密集部署的预配方法,请参阅以下内容:

后续步骤