할당량 조정자

이 페이지에서는 할당량 조정자 시스템을 사용하여 할당량을 조정하는 방법을 설명합니다.

할당량 조정자는 리소스 소비를 관찰하고 사용자 대신 할당량 조정 요청을 사전에 제출합니다. 리소스 사용을 모니터링하고 할당량 조정 요청을 사전에 제출하면 할당량 값에 도달하여 발생하는 서비스 중단을 방지할 수 있습니다. 할당량 조정자를 사용하면 리소스 사용량의 예기치 않은 증가를 감시할 필요성이 줄어들고 할당량 조정에 대한 수동 요청을 더 적게 제출할 수 있습니다.

할당량 조정자 작동 방식

할당량 조정자를 사용 설정하면 적용 가능한 모든 할당량을 모니터링하고 다음 로직을 적용합니다.

  • 할당량 조정자는 최대 사용량이 지정된 기간 동안 할당량 값에 도달했는지 확인합니다.
  • 이러한 경우 할당량 조정자에서 할당량 값을 상향 조정하려고 시도합니다(일반적으로 약 10~20%).

할당량 값을 상향 조정할 수 있으면 상향 조정이 승인되고 할당량 값이 조정됩니다. 할당량 조정자 사용 설정 여부와 관계없이 언제든지 할당량 값 상향 조정을 수동으로 요청할 수 있습니다.

할당량 조정자는 할당량 값을 늘리기 위한 할당량 조정 요청만 제출합니다. 값을 낮추지는 않습니다. 수동 할당량 한도가 있는 할당량의 경우 할당량 조정자가 할당량 조정 요청을 제출하지 않습니다.

Google Cloud 콘솔의 할당량 및 시스템 한도 페이지에서 할당량 조정자가 제출한 요청을 확인할 수 있습니다. 할당량 조정자가 시작한 변경사항을 모니터링하도록 알림을 설정할 수도 있습니다.

제한사항

할당량 조정자에는 다음과 같은 제한사항이 있습니다.

  • 할당량 조정자 설정은 프로젝트별로만 사용할 수 있습니다.
  • 할당량 조정자 설정은Google Cloud 콘솔에서만 액세스할 수 있습니다.
  • 일부 할당량에서는 할당량 조정자를 사용할 수 없습니다. 자세한 내용은 이 문서의 사용 가능 여부를 참고하세요.

가용성

할당량 조정자 사용 가능 여부는 Google Cloud 프로젝트에 따라 다르며 일부 Google Cloud 할당량에만 사용할 수 있습니다.

사용량 기록에 따른 자격 요건

할당량 조정자가 추가 할당량을 요청할 시기를 정확하게 결정하려면 이전 사용량 데이터가 충분하게 있어야 합니다. 따라서 할당량 조정자를 사용 설정하는 옵션은 정확한 예측을 지원하도록 이전 활동이 충분하게 있는 프로젝트에서만 사용 가능합니다.

지원되는 할당량

일부Google Cloud 할당량에서는 할당량 조정자를 사용할 수 없습니다. 서비스는 Google Cloud 할당량의 전부, 일부 또는 아무것도 아닌 할당량에 대해 할당량 조정기를 지원할 수 있습니다. 프로젝트에서 할당량 조정자를 사용 설정하면 지원되는 모든 할당량에 적용됩니다.

Google Cloud 서비스가 할당량에 대한 할당량 조정자 지원을 추가하거나 확장하면 할당량 조정자가 프로젝트에 대해 새로 지원되는 이러한 할당량을 자동으로 모니터링하고 조정합니다. 처음에 할당량 조정기를 사용 설정했을 때 이러한 특정 할당량이 지원되지 않았더라도 이 문제가 발생합니다.

다음 표에는 할당량 조정기에서 지원하는 할당량이 나와 있습니다.

서비스 할당량
Artifact Registry API 아시아 멀티 리전의 프로젝트별 분당 요청 수
Artifact Registry API 유럽 멀티 리전의 프로젝트별 분당 요청 수
Artifact Registry API 미국 멀티 리전의 프로젝트별 분당 요청 수
Artifact Registry API 리전 및 프로젝트별 분당 요청 수
Cloud Build API 분당 빌드 및 작업 가져오기 요청 수
Cloud Build API 사용자별 분당 빌드 및 작업 가져오기 요청 수
Cloud Build API 동시 빌드 CPU(리전 기본 풀)
Cloud Build API 동시 빌드(비지역 기본 풀)
Cloud Key Management Service API 분당 암호화 요청 수
Cloud Key Management Service API 분당 읽기 요청 수
Cloud Key Management Service API 분당 쓰기 요청 수
Cloud Logging API 리전별 분당 로그 쓰기 바이트
Cloud Resource Manager API 분당 읽기 요청 수
Cloud Run Admin API 리전별 분당 작업 실행 요청 수
Cloud Run Admin API 리전별 분당 읽기 요청 수
Cloud Run Admin API 리전별 프로젝트당 총 CPU 할당(밀리 vCPU)
Cloud Run Admin API 리전별 분당 쓰기 요청
Cloud Trace API 분당 쓰기 요청 수(무료)
Compute Engine API 관심 분야 그룹
Compute Engine API 백엔드 버킷
Compute Engine API C2 CPU
Compute Engine API C2D CPU
Compute Engine API C3 CPU
Compute Engine API 약정
Compute Engine API 약정된 A2 CPU
Compute Engine API 약정된 CPU
Compute Engine API 약정된 라이선스
Compute Engine API 예약된 약정 로컬 SSD 디스크(GB)
Compute Engine API 약정된 M3 CPU
Compute Engine API 약정된 메모리 최적화 CPU
Compute Engine API 약정된 N2 CPU
Compute Engine API 약정된 N2D CPU
Compute Engine API 약정된 T2D CPU
Compute Engine API CPU
Compute Engine API VM 계열별 CPU
Compute Engine API 교차 프로젝트 네트워킹 서비스 프로젝트
Compute Engine API VPC 네트워크별 커스텀 정적 경로
Compute Engine API 외부 패스 스루 네트워크 부하 분산기 백엔드 서비스
Compute Engine API 외부 패스 스루 네트워크 부하 분산기 전달 규칙
Compute Engine API 외부 프로토콜 전달 규칙
Compute Engine API 방화벽 규칙
Compute Engine API 전달 규칙
Compute Engine API 전역 외부 관리형 백엔드 서비스
Compute Engine API 전역 외부 관리형 전달 규칙
Compute Engine API 전역 외부 프록시 LB 백엔드 서비스
Compute Engine API 전역 내부 Traffic Director 백엔드 서비스
Compute Engine API GPU 제품군별 GPU 수
Compute Engine API GPU 수(모든 지역)
Compute Engine API 상태 점검
Compute Engine API 이미지
Compute Engine API 사용 중인 IP 주소
Compute Engine API 사용 중인 리전 외부 IPv4 주소
Compute Engine API 사용 중인 스냅샷 일정
Compute Engine API 인스턴스 그룹
Compute Engine API 인스턴스 템플릿
Compute Engine API 피어링 그룹당 인스턴스
Compute Engine API VPC 네트워크당 인스턴스
Compute Engine API 내부 IP 주소
Compute Engine API 내부 패스 스루 네트워크 부하 분산기 백엔드 서비스
Compute Engine API 피어링 그룹별 내부 패스 스루 네트워크 부하 분산기 전달 규칙
Compute Engine API VPC 네트워크당 내부 패스 스루 네트워크 부하 분산기 전달 규칙
Compute Engine API 피어링 그룹당 IP 별칭
Compute Engine API VPC 네트워크당 IP 별칭
Compute Engine API VM 제품군당 로컬 SSD 디스크(GB)
Compute Engine API M1 CPU
Compute Engine API M2 CPU
Compute Engine API M3 CPU
Compute Engine API 관리형 인스턴스 그룹
Compute Engine API N2 CPU
Compute Engine API N2D CPU
Compute Engine API 네트워크 엔드포인트 그룹
Compute Engine API 네트워크 방화벽 정책
Compute Engine API 네트워크 부하 분산 보안 정책 규칙 속성
Compute Engine API 네트워크 부하 분산 보안 정책
Compute Engine API 네트워크
Compute Engine API NVIDIA A2 CPU
Compute Engine API VPC 네트워크별 피어링
Compute Engine API 영구 디스크 IOPS
Compute Engine API Persistent Disk SSD(GB)
Compute Engine API Persistent Disk Standard(GB)
Compute Engine API 선점형 CPU
Compute Engine API 선점형 로컬 SSD(GB)
Compute Engine API 선점형 NVIDIA A100 80GB GPU
Compute Engine API 선점형 NVIDIA A100 GPU
Compute Engine API 선점형 NVIDIA H100 GPU
Compute Engine API 선점형 NVIDIA H100 MEGA GPU
Compute Engine API 선점형 NVIDIA K80 GPU
Compute Engine API 선점형 NVIDIA L4 GPU
Compute Engine API 선점형 NVIDIA L4 가상 워크스테이션 GPU
Compute Engine API 선점형 NVIDIA P100 GPU
Compute Engine API 선점형 NVIDIA P100 가상 워크스테이션 GPU
Compute Engine API 선점형 NVIDIA P4 GPU
Compute Engine API 선점형 NVIDIA P4 가상 워크스테이션 GPU
Compute Engine API 선점형 NVIDIA T4 GPU
Compute Engine API 선점형 NVIDIA T4 가상 워크스테이션 GPU
Compute Engine API 선점형 NVIDIA V100 GPU
Compute Engine API 공지된 공개 프리픽스
Compute Engine API 리전 외부 관리형 백엔드 서비스
Compute Engine API VPC 네트워크 및 리전별 리전 외부 관리형 전달 규칙
Compute Engine API 리전 인스턴스 템플릿
Compute Engine API 리전별 내부 관리형 백엔드 서비스
Compute Engine API 리전 내부 Traffic Director 백엔드 서비스
Compute Engine API 리전 관리형 인스턴스 그룹
Compute Engine API 리전 보안 정책
Compute Engine API 고급 일치 조건이 있는 리전 보안 정책 규칙
Compute Engine API 리전별 대상 TCP 프록시
Compute Engine API 라우터
Compute Engine API 경로
Compute Engine API 보안 정책
Compute Engine API 보안 정책 규칙
Compute Engine API 보안 정책 규칙 언어 규칙
Compute Engine API 스냅샷
Compute Engine API SSL 인증서
Compute Engine API 고정 BYOIP IP 주소
Compute Engine API 고정 IP 주소
Compute Engine API 피어링 그룹별 서브넷 범위
Compute Engine API VPC 네트워크당 서브네트워크 범위
Compute Engine API T2A CPU
Compute Engine API T2D CPU
Compute Engine API 대상 HTTP 프록시
Compute Engine API 대상 HTTPS 프록시
Compute Engine API 대상 SSL 프록시
Compute Engine API 대상 TCP 프록시
Compute Engine API 대상 VPN 게이트웨이
Compute Engine API 예약된 로컬 SSD 디스크 총 크기(GB)
Compute Engine API URL 맵
Compute Engine API VM 인스턴스
Compute Engine API VPN 게이트웨이
Compute Engine API VPN 터널
Connect Gateway API 분당 게이트웨이 연결 요청 수
Dialogflow API 분당 기타 모든 요청 수
Filestore API 리전별 백업
Filestore API 리전별 기본 HDD (표준) 용량(GB)
Filestore API 리전별 기본 SSD (프리미엄) 용량(GB)
Filestore API 리전별 영역 및 리전 1~10TiB (엔터프라이즈) 용량(GB)
Filestore API 영역 및 리전별 10~100TiB (대규모) 용량(GB)
Google Cloud Memorystore for Redis API 리전별 총 Redis 용량(GB)
Google Cloud Memorystore for Redis API 리전별 프로젝트당 총 Redis 클러스터 단위
Memorystore API 리전별 프로젝트당 총 Memorystore 단위
Vertex AI API 리전별 맞춤 모델 서빙 CPU
Vertex AI API 리전별 맞춤 모델 서빙 Nvidia T4 GPU
Vertex AI API 리전별 맞춤 모델 학습 Nvidia T4 GPU
Vertex AI API 프로젝트별 기본 모델별 분당 콘텐츠 생성 요청
Vertex AI API

프로젝트별 기본 모델별 분당 리전별 온라인 예측 요청

참고: 사용 가능한 측정기준의 전체 목록을 보려면 Google Cloud 콘솔에서 이 항목을 펼치세요.

Vertex AI API 리전별 분당 리소스 관리(CRUD) 요청
Vertex AI API 리전에 따라 제한된 이미지 학습 TPU V3 포드 코어

할당량 조정자 사용 설정

할당량 조정자를 사용 설정하려면 다음 IAM 권한이 있어야 합니다.

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Google Cloud 콘솔 프로젝트에서 할당량 조정자를 사용 설정하려면 적절한 탭을 선택하고 안내를 따르세요.

콘솔

Google Cloud 콘솔에서 Google Cloud 프로젝트의 할당량 조정자를 사용 설정하려면 다음 단계를 따르세요.

  1. Google Cloud 콘솔에서 IAM 및 관리자 > 할당량 및 시스템 한도 페이지로 이동합니다.

    할당량 및 시스템 한도로 이동

  2. 구성 탭을 클릭합니다.
  3. 사용 설정 전환 버튼을 클릭합니다.

상태 열에 사용 설정됨이 표시되면 할당량 조정자가 사용량을 모니터링하고 리소스 사용량이 할당량 값에 가까워지면 할당량 조정 요청을 실행합니다.

REST

  1. REST API를 사용하여 Google Cloud 프로젝트에서 할당량 조정자를 사용 설정하려면(프리뷰) HTTP 요청을 보내 할당량 조정자 설정을 업데이트합니다.

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. 요청 본문에서 할당량 조정기 설정 리소스를 지정하고 enablement 필드를 ENABLED로 설정합니다. ETag를 지정할 수도 있지만 이는 선택사항입니다.

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    다음을 바꿉니다.

    • PROJECT_ID_OR_NUMBER: 할당량 조정기를 사용 설정할 프로젝트의 프로젝트 ID 또는 프로젝트 번호
    • OPTIONAL_ETAG: 할당량 조정자 설정의 선택적 ETag 문자열

    이렇게 하면 사용 설정 상태가 enabled로 업데이트됩니다.

gcloud

gcloud CLI를 사용하여 Google Cloud 프로젝트에서 할당량 조정자를 사용 설정하려면(프리뷰) 다음 단계를 따르세요.

  1. gcloud CLI를 사용하여 인증합니다.

    gcloud auth login
    
  2. 할당량 조정자 설정을 사용 설정합니다.

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    PROJECT_ID_OR_NUMBER를 할당량 조정기를 사용 설정할 프로젝트의 프로젝트 ID 또는 프로젝트 번호로 바꿉니다.

  3. 사용 설정 상태를 확인합니다.

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    필요한 권한이 있다면 상태가 enabled로 반환됩니다.

할당량 조정 요청 보기

할당량 조정 요청을 보려면 다음 IAM 권한이 있어야 합니다.

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

할당량 조정자가 실행한 할당량 조정 요청을 보려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔에서 IAM 및 관리자 > 할당량 및 시스템 한도 페이지로 이동합니다.

    할당량 및 시스템 한도로 이동

  2. 상향 요청 탭을 클릭합니다. 상향 요청 뷰에는 수동으로 요청된 상향 요청과 할당량 조정자가 실행한 요청을 포함하여 프로젝트의 모든 상향 요청이 표시됩니다.
  3. 필터 입력란을 클릭합니다.
  4. 메뉴에서 유형을 선택하고 Auto를 입력합니다. 할당량 조정자가 제출한 요청을 필터링합니다.

할당량 조정자 알림 설정

할당량 조정자로부터 알림을 받으려면 다음 단계를 따르세요.

  1. Google Cloud 콘솔에서 IAM 및 관리자 > 할당량 및 시스템 한도 페이지로 이동합니다.

    할당량 및 시스템 한도로 이동

  2. 구성 탭을 클릭합니다.
  3. 알림 만들기를 클릭합니다.
  4. 알림 템플릿 하나 또는 둘 다를 선택합니다.
    1. 할당량 조정자별 모든 조정은 할당량 조정자가 프로젝트에 대한 할당량 조정 요청을 실행할 때마다 알림을 보냅니다.
    2. 할당량 조정자 오류 및 실패는 할당량 조정자가 할당량 값을 상향 조정하려고 시도했지만 이를 수행할 수 없는 경우에만 알림을 보냅니다.
  5. 선택사항: 옵션 표시를 클릭하여 알림과 이슈 자동 종료 기간 간의 최소 시간에 대한 기본값을 조정합니다.
  6. 알림을 받을 알림 채널을 선택합니다. 알림 채널 설정을 조정하거나 새 알림 채널을 만들려면 알림 채널 관리를 클릭합니다.
  7. 만들기를 클릭합니다.

할당량 조정자 알림 수정 또는 삭제

Google Cloud 콘솔에서 할당량 조정자 알림을 수정하거나 삭제할 수 있습니다.

  1. Cloud Monitoring 콘솔의 정책 페이지로 이동합니다.

    정책으로 이동

  2. 할당량 조정자 알림 정책을 검색합니다. 할당량 조정자 알림 정책의 이름은 다음과 같습니다.

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. 할당량 조정자 알림 정책을 보여주는 행에서 더보기를 클릭합니다.

  4. 수정 또는 삭제를 클릭합니다.

할당량 조정자 사용 중지

할당량 조정자를 사용 중지하려면 다음 IAM 권한이 있어야 합니다.

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Google Cloud 콘솔 프로젝트에서 할당량 조정자를 사용 중지하려면 적절한 탭을 선택하고 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 IAM 및 관리자 > 할당량 및 시스템 한도 페이지로 이동합니다.

    할당량 및 시스템 한도로 이동

  2. 구성 탭을 클릭합니다.
  3. 사용 설정 전환 버튼을 클릭합니다. 전환 스위치가 회색으로 바뀝니다.

전환 버튼이 회색이고 상태 열에 사용 설정되지 않음이 표시되면 할당량 조정자가 더 이상 사용량을 모니터링하거나 할당량 조정 요청을 실행하지 않습니다.

REST

  1. REST API를 사용하여 Google Cloud 프로젝트에서 할당량 조정자를 사용 중지하려면(프리뷰) HTTP 요청을 보내 할당량 조정자 설정을 업데이트합니다.

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. 요청 본문에서 할당량 조정기 설정 리소스를 지정하고 enablement 필드를 DISABLED로 설정합니다. ETag를 지정할 수도 있지만 이는 선택사항입니다.

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    다음을 바꿉니다.

    • PROJECT_ID_OR_NUMBER: 할당량 조정기를 사용 중지할 프로젝트의 프로젝트 ID 또는 프로젝트 번호
    • OPTIONAL_ETAG: 할당량 조정자 설정의 선택적 ETag 문자열

    이렇게 하면 사용 설정 상태가 disabled로 업데이트됩니다.

gcloud

gcloud CLI를 사용하여 Google Cloud 프로젝트에서 할당량 조정자를 사용 중지하려면(프리뷰) 다음 단계를 따르세요.

  1. gcloud CLI에 인증합니다.

    gcloud auth login
    
  2. 할당량 조정자 설정을 사용 중지합니다.

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    PROJECT_ID_OR_NUMBER를 할당량 조정기를 사용 중지할 프로젝트의 프로젝트 ID 또는 프로젝트 번호로 바꿉니다.

  3. 사용 설정 상태를 확인합니다.

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    필요한 권한이 있다면 상태가 disabled로 반환됩니다.

할당량 상향 거부 문제 해결

할당량 조정자가 시작한 할당량 상향 조정이 거부될 수 있습니다. Google Cloud 에서 특정 프로젝트, 리소스 또는 리전의 할당량을 특정 값 이상으로 상향 조정할 수 없는 경우 종종 이러한 일이 발생합니다. 이 시나리오에서는 언제든지 수동으로 할당량 상향 조정을 요청할 수 있습니다.

할당량 조정자가 제출한 할당량 조정 요청이 거부될 때 알림을 받으려면 할당량 조정자 알림을 설정합니다.