할당량 및 한도

이 문서에서는 Batch에 적용되는 quotas과 quotas에 대해 설명합니다.

  • 할당량에는 기본값이 있지만 일반적으로 조정을 요청할 수 있습니다.
  • 시스템 한도는 변경할 수 없는 고정 값입니다.

Batch 작업은 Compute Engine 리소스에서 실행되므로 Batch에도 Compute Engine 할당량 및 한도가 적용됩니다. Batch 작업이 다른 Google Cloud 서비스도 사용하는 경우 해당 서비스의 할당량도 적용됩니다. 할당량 또는 한도를 초과하려고 하면 오류가 반환됩니다. 자세한 내용은 Cloud Quotas 문서를 참고하세요.

Batch에는 다른 Google Cloud 서비스의 할당량 및 한도 외에도 다음과 같이 변경할 수 없는 할당량 및 한도가 있습니다.

비율 할당량

Batch 요청에는 다음 한도가 적용됩니다. 이 한도는 Google Cloud 콘솔 등에서 할당량으로 표시되지만 늘릴 수 없습니다.

한도
리전별 분당 에이전트 요청 수 30,000
리전별 분당 변형 요청 수 6,000
리전별 분당 읽기 요청 수 15,000

작업 한도

Batch 작업에는 다음 한도가 적용됩니다.

한도
태스크 그룹당 태스크 수 100,000
작업당 동시 태스크 수 5,000
단일 영역 작업당 동시 VM 수1 2,000
멀티 영역 작업당 동시 VM 수1 4,000
작업 정의 크기2 1MB
자동 실패 전 대기 시간 (QUEUED 작업 상태의 기간) 2일
자동 실패 전 실행 시간 (RUNNING 작업 상태의 기간)3 14일

1 단일 영역 작업멀티 영역 작업이라는 용어는 작업 VM에 허용되는 영역 수로, 작업 위치에 따라 영역과 다를 수 있습니다. 자세한 내용은 Batch 위치를 참조하세요.

2 예를 들어 jobs.create 메서드 또는 gcloud CLI --config 파일에 대한 REST 요청의 크기와 대략 같습니다. 여러 작업에 걸쳐 작업을 나누면 이 한도를 해결할 수 있습니다. 예를 들어 종속 작업 예약(미리보기) 방법을 알아보세요.

3 이 한도에는 다음과 같은 예외가 있습니다.

  • 작업의 provisioningModel 필드를 FLEX_START로 설정하면 자동 실패 전 최대 실행 시간이 7일로 변경됩니다.
  • 작업에서 A3 시리즈의 머신 유형을 사용하고, reservation 필드를 NO_RESERVATION로 설정하고, provisioningModel가 정의되지 않았거나 STANDARD로 설정된 경우 자동 실패 전 최대 실행 시간은 7일입니다.
  • 원하는 경우 시간 제한을 사용하여 작업의 자동 실패 전 최대 실행 시간을 줄일 수 있습니다.