配额和限制

本文档列出了适用于 Batch 的配额和系统限制。

  • 配额具有默认值,但您通常可以申请调整。
  • 系统限制是无法更改的固定值。

批处理作业在 Compute Engine 资源上运行,因此 Batch 也受 Compute Engine 配额和限制的约束。如果您的 Batch 作业还使用了其他 Google Cloud 服务,则还需遵守这些服务的配额。尝试超出配额或限制会返回错误。 如需了解详情,请参阅 Cloud 配额文档

除了其他 Google Cloud 服务的配额和限制之外,Batch 还具有以下配额和限制,这些配额和限制无法更改。

速率配额

以下限制适用于批量请求。这些限制以配额的形式显示(例如在 Google Cloud 控制台中),但无法增加。

限制
每个区域每分钟的代理请求数 30000
每个区域每分钟的变异请求数 6000
每分钟每个区域的读取请求数 15000

作业限制

以下限制适用于 Batch 作业。

限制
每个任务组的任务数 10 万
每个作业的并行任务数 5,000
单区域作业的并发虚拟机数1 2000
每个多可用区作业的并发虚拟机数1 4000
作业定义的大小2 1 MB
自动失败前的等待时间(QUEUED 作业状态的持续时间) 2 天
自动失败之前的运行时间(RUNNING 作业状态的持续时间)3 14 天

1 此处的单可用区作业和多可用区作业是指作业的虚拟机允许的可用区数量,这可能与作业的位置所处的可用区不同。如需了解详情,请参阅批量位置

2 例如,大致相当于对 jobs.create 方法或 gcloud CLI --config 文件的 REST 请求的大小。您可以通过将任务分配到多个作业来规避此限制,例如,了解如何安排相关作业预览版)。

3 此限制有以下例外情况:

  • 如果您将作业的 provisioningModel 字段设置为 FLEX_START,则自动失败前的最长运行时间为 7 天。
  • 如果作业使用 A3 系列的机器类型,将 reservation 字段设置为 NO_RESERVATION,并且 provisioningModel 未定义或设置为 STANDARD,则自动失败前的最长运行时间为 7 天。
  • (可选)您可以使用超时来缩短作业在自动失败之前的最长运行时间。