이 페이지에서는 할당량 조정자 시스템을 사용하여 할당량을 조정하는 방법을 설명합니다.
할당량 조정자는 리소스 소비를 관찰하고 사용자 대신 할당량 조정 요청을 사전에 제출합니다. 리소스 사용을 모니터링하고 할당량 조정 요청을 사전에 제출하면 할당량 값에 도달하여 발생하는 서비스 중단을 방지할 수 있습니다. 할당량 조정자를 사용하면 리소스 사용량의 예기치 않은 증가를 감시할 필요성이 줄어들고 할당량 조정에 대한 수동 요청을 더 적게 제출할 수 있습니다.
할당량 조정자 작동 방식
할당량 조정자를 사용 설정하면 적용 가능한 모든 할당량을 모니터링하고 다음 로직을 적용합니다.
- 할당량 조정자는 최대 사용량이 지정된 기간 동안 할당량 값에 도달했는지 확인합니다.
- 이러한 경우 할당량 조정자에서 할당량 값을 상향 조정하려고 시도합니다(일반적으로 약 10~20%).
할당량 값을 상향 조정할 수 있으면 상향 조정이 승인되고 할당량 값이 조정됩니다. 할당량 조정자 사용 설정 여부와 관계없이 언제든지 할당량 값 상향 조정을 수동으로 요청할 수 있습니다.
할당량 조정자는 할당량 값을 늘리기 위한 할당량 조정 요청만 제출합니다. 값을 낮추지는 않습니다. 수동 할당량 한도가 있는 할당량의 경우 할당량 조정자가 할당량 조정 요청을 제출하지 않습니다.
Google Cloud 콘솔의 할당량 및 시스템 한도 페이지에서 할당량 조정자가 제출한 요청을 확인할 수 있습니다. 할당량 조정자가 시작한 변경사항을 모니터링하도록 알림을 설정할 수도 있습니다.
제한사항
할당량 조정자에는 다음과 같은 제한사항이 있습니다.
- 할당량 조정자 설정은 프로젝트별로만 사용할 수 있습니다.
- 할당량 조정자 설정은Google Cloud 콘솔에서만 액세스할 수 있습니다.
- 일부 할당량에서는 할당량 조정자를 사용할 수 없습니다. 자세한 내용은 이 문서의 사용 가능 여부를 참고하세요.
가용성
할당량 조정자 사용 가능 여부는 Google Cloud 프로젝트에 따라 다르며 일부 Google Cloud 할당량에만 사용할 수 있습니다.
사용량 기록에 따른 자격 요건
할당량 조정자가 추가 할당량을 요청할 시기를 정확하게 결정하려면 이전 사용량 데이터가 충분하게 있어야 합니다. 따라서 할당량 조정자를 사용 설정하는 옵션은 정확한 예측을 지원하도록 이전 활동이 충분하게 있는 프로젝트에서만 사용 가능합니다.
지원되는 할당량
일부Google Cloud 할당량에서는 할당량 조정자를 사용할 수 없습니다. 서비스는 Google Cloud 할당량의 전부, 일부 또는 아무것도 아닌 할당량에 대해 할당량 조정기를 지원할 수 있습니다. 프로젝트에서 할당량 조정자를 사용 설정하면 지원되는 모든 할당량에 적용됩니다.
Google Cloud 서비스가 할당량에 대한 할당량 조정자 지원을 추가하거나 확장하면 할당량 조정자가 프로젝트에 대해 새로 지원되는 이러한 할당량을 자동으로 모니터링하고 조정합니다. 처음에 할당량 조정기를 사용 설정했을 때 이러한 특정 할당량이 지원되지 않았더라도 이 문제가 발생합니다.
다음 표에는 할당량 조정기에서 지원하는 할당량이 나와 있습니다.
서비스 | 할당량 |
---|---|
Artifact Registry API | 아시아 멀티 리전의 프로젝트별 분당 요청 수 |
Artifact Registry API | 유럽 멀티 리전의 프로젝트별 분당 요청 수 |
Artifact Registry API | 미국 멀티 리전의 프로젝트별 분당 요청 수 |
Artifact Registry API | 리전 및 프로젝트별 분당 요청 수 |
Cloud Build API | 분당 빌드 및 작업 가져오기 요청 수 |
Cloud Build API | 사용자별 분당 빌드 및 작업 가져오기 요청 수 |
Cloud Build API | 동시 빌드 CPU(리전 기본 풀) |
Cloud Build API | 동시 빌드(비지역 기본 풀) |
Cloud Key Management Service API | 분당 암호화 요청 수 |
Cloud Key Management Service API | 분당 읽기 요청 수 |
Cloud Key Management Service API | 분당 쓰기 요청 수 |
Cloud Logging API | 리전별 분당 로그 쓰기 바이트 |
Cloud Resource Manager API | 분당 읽기 요청 수 |
Cloud Run Admin API | 리전별 분당 작업 실행 요청 수 |
Cloud Run Admin API | 리전별 분당 읽기 요청 수 |
Cloud Run Admin API | 리전별 프로젝트당 총 CPU 할당(밀리 vCPU) |
Cloud Run Admin API | 리전별 분당 쓰기 요청 |
Cloud Trace API | 분당 쓰기 요청 수(무료) |
Compute Engine API | 관심 분야 그룹 |
Compute Engine API | 백엔드 버킷 |
Compute Engine API | C2 CPU |
Compute Engine API | C2D CPU |
Compute Engine API | C3 CPU |
Compute Engine API | 약정 |
Compute Engine API | 약정된 A2 CPU |
Compute Engine API | 약정된 CPU |
Compute Engine API | 약정된 라이선스 |
Compute Engine API | 예약된 약정 로컬 SSD 디스크(GB) |
Compute Engine API | 약정된 M3 CPU |
Compute Engine API | 약정된 메모리 최적화 CPU |
Compute Engine API | 약정된 N2 CPU |
Compute Engine API | 약정된 N2D CPU |
Compute Engine API | 약정된 T2D CPU |
Compute Engine API | CPU |
Compute Engine API | VM 계열별 CPU |
Compute Engine API | 교차 프로젝트 네트워킹 서비스 프로젝트 |
Compute Engine API | VPC 네트워크별 커스텀 정적 경로 |
Compute Engine API | 외부 패스 스루 네트워크 부하 분산기 백엔드 서비스 |
Compute Engine API | 외부 패스 스루 네트워크 부하 분산기 전달 규칙 |
Compute Engine API | 외부 프로토콜 전달 규칙 |
Compute Engine API | 방화벽 규칙 |
Compute Engine API | 전달 규칙 |
Compute Engine API | 전역 외부 관리형 백엔드 서비스 |
Compute Engine API | 전역 외부 관리형 전달 규칙 |
Compute Engine API | 전역 외부 프록시 LB 백엔드 서비스 |
Compute Engine API | 전역 내부 Traffic Director 백엔드 서비스 |
Compute Engine API | GPU 제품군별 GPU 수 |
Compute Engine API | GPU 수(모든 지역) |
Compute Engine API | 상태 점검 |
Compute Engine API | 이미지 |
Compute Engine API | 사용 중인 IP 주소 |
Compute Engine API | 사용 중인 리전 외부 IPv4 주소 |
Compute Engine API | 사용 중인 스냅샷 일정 |
Compute Engine API | 인스턴스 그룹 |
Compute Engine API | 인스턴스 템플릿 |
Compute Engine API | 피어링 그룹당 인스턴스 |
Compute Engine API | VPC 네트워크당 인스턴스 |
Compute Engine API | 내부 IP 주소 |
Compute Engine API | 내부 패스 스루 네트워크 부하 분산기 백엔드 서비스 |
Compute Engine API | 피어링 그룹별 내부 패스 스루 네트워크 부하 분산기 전달 규칙 |
Compute Engine API | VPC 네트워크당 내부 패스 스루 네트워크 부하 분산기 전달 규칙 |
Compute Engine API | 피어링 그룹당 IP 별칭 |
Compute Engine API | VPC 네트워크당 IP 별칭 |
Compute Engine API | VM 제품군당 로컬 SSD 디스크(GB) |
Compute Engine API | M1 CPU |
Compute Engine API | M2 CPU |
Compute Engine API | M3 CPU |
Compute Engine API | 관리형 인스턴스 그룹 |
Compute Engine API | N2 CPU |
Compute Engine API | N2D CPU |
Compute Engine API | 네트워크 엔드포인트 그룹 |
Compute Engine API | 네트워크 방화벽 정책 |
Compute Engine API | 네트워크 부하 분산 보안 정책 규칙 속성 |
Compute Engine API | 네트워크 부하 분산 보안 정책 |
Compute Engine API | 네트워크 |
Compute Engine API | NVIDIA A2 CPU |
Compute Engine API | VPC 네트워크별 피어링 |
Compute Engine API | 영구 디스크 IOPS |
Compute Engine API | Persistent Disk SSD(GB) |
Compute Engine API | Persistent Disk Standard(GB) |
Compute Engine API | 선점형 CPU |
Compute Engine API | 선점형 로컬 SSD(GB) |
Compute Engine API | 선점형 NVIDIA A100 80GB GPU |
Compute Engine API | 선점형 NVIDIA A100 GPU |
Compute Engine API | 선점형 NVIDIA H100 GPU |
Compute Engine API | 선점형 NVIDIA H100 MEGA GPU |
Compute Engine API | 선점형 NVIDIA K80 GPU |
Compute Engine API | 선점형 NVIDIA L4 GPU |
Compute Engine API | 선점형 NVIDIA L4 가상 워크스테이션 GPU |
Compute Engine API | 선점형 NVIDIA P100 GPU |
Compute Engine API | 선점형 NVIDIA P100 가상 워크스테이션 GPU |
Compute Engine API | 선점형 NVIDIA P4 GPU |
Compute Engine API | 선점형 NVIDIA P4 가상 워크스테이션 GPU |
Compute Engine API | 선점형 NVIDIA T4 GPU |
Compute Engine API | 선점형 NVIDIA T4 가상 워크스테이션 GPU |
Compute Engine API | 선점형 NVIDIA V100 GPU |
Compute Engine API | 공지된 공개 프리픽스 |
Compute Engine API | 리전 외부 관리형 백엔드 서비스 |
Compute Engine API | VPC 네트워크 및 리전별 리전 외부 관리형 전달 규칙 |
Compute Engine API | 리전 인스턴스 템플릿 |
Compute Engine API | 리전별 내부 관리형 백엔드 서비스 |
Compute Engine API | 리전 내부 Traffic Director 백엔드 서비스 |
Compute Engine API | 리전 관리형 인스턴스 그룹 |
Compute Engine API | 리전 보안 정책 |
Compute Engine API | 고급 일치 조건이 있는 리전 보안 정책 규칙 |
Compute Engine API | 리전별 대상 TCP 프록시 |
Compute Engine API | 라우터 |
Compute Engine API | 경로 |
Compute Engine API | 보안 정책 |
Compute Engine API | 보안 정책 규칙 |
Compute Engine API | 보안 정책 규칙 언어 규칙 |
Compute Engine API | 스냅샷 |
Compute Engine API | SSL 인증서 |
Compute Engine API | 고정 BYOIP IP 주소 |
Compute Engine API | 고정 IP 주소 |
Compute Engine API | 피어링 그룹별 서브넷 범위 |
Compute Engine API | VPC 네트워크당 서브네트워크 범위 |
Compute Engine API | T2A CPU |
Compute Engine API | T2D CPU |
Compute Engine API | 대상 HTTP 프록시 |
Compute Engine API | 대상 HTTPS 프록시 |
Compute Engine API | 대상 SSL 프록시 |
Compute Engine API | 대상 TCP 프록시 |
Compute Engine API | 대상 VPN 게이트웨이 |
Compute Engine API | 예약된 로컬 SSD 디스크 총 크기(GB) |
Compute Engine API | URL 맵 |
Compute Engine API | VM 인스턴스 |
Compute Engine API | VPN 게이트웨이 |
Compute Engine API | VPN 터널 |
Connect Gateway API | 분당 게이트웨이 연결 요청 수 |
Dialogflow API | 분당 기타 모든 요청 수 |
Filestore API | 리전별 백업 |
Filestore API | 리전별 기본 HDD (표준) 용량(GB) |
Filestore API | 리전별 기본 SSD (프리미엄) 용량(GB) |
Filestore API | 리전별 영역 및 리전 1~10TiB (엔터프라이즈) 용량(GB) |
Filestore API | 영역 및 리전별 10~100TiB (대규모) 용량(GB) |
Google Cloud Memorystore for Redis API | 리전별 총 Redis 용량(GB) |
Google Cloud Memorystore for Redis API | 리전별 프로젝트당 총 Redis 클러스터 단위 |
Memorystore API | 리전별 프로젝트당 총 Memorystore 단위 |
Vertex AI API | 리전별 맞춤 모델 서빙 CPU |
Vertex AI API | 리전별 맞춤 모델 서빙 Nvidia T4 GPU |
Vertex AI API | 리전별 맞춤 모델 학습 Nvidia T4 GPU |
Vertex AI API | 프로젝트별 기본 모델별 분당 콘텐츠 생성 요청 |
Vertex AI API | 프로젝트별 기본 모델별 분당 리전별 온라인 예측 요청 참고: 사용 가능한 측정기준의 전체 목록을 보려면 Google Cloud 콘솔에서 이 항목을 펼치세요. |
Vertex AI API | 리전별 분당 리소스 관리(CRUD) 요청 |
Vertex AI API | 리전에 따라 제한된 이미지 학습 TPU V3 포드 코어 |
할당량 조정자 사용 설정
할당량 조정자를 사용 설정하려면 다음 IAM 권한이 있어야 합니다.
cloudquotas.quotas.update
cloudquotas.quotas.get
Google Cloud 콘솔 프로젝트에서 할당량 조정자를 사용 설정하려면 적절한 탭을 선택하고 안내를 따르세요.
콘솔
Google Cloud 콘솔에서 Google Cloud 프로젝트의 할당량 조정자를 사용 설정하려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 IAM 및 관리자 > 할당량 및 시스템 한도 페이지로 이동합니다.
- 구성 탭을 클릭합니다.
- 사용 설정 전환 버튼을 클릭합니다.
상태 열에 사용 설정됨이 표시되면 할당량 조정자가 사용량을 모니터링하고 리소스 사용량이 할당량 값에 가까워지면 할당량 조정 요청을 실행합니다.
REST
REST API를 사용하여 Google Cloud 프로젝트에서 할당량 조정자를 사용 설정하려면(프리뷰) HTTP 요청을 보내 할당량 조정자 설정을 업데이트합니다.
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
요청 본문에서 할당량 조정기 설정 리소스를 지정하고
enablement
필드를ENABLED
로 설정합니다. ETag를 지정할 수도 있지만 이는 선택사항입니다.{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
다음을 바꿉니다.
PROJECT_ID_OR_NUMBER
: 할당량 조정기를 사용 설정할 프로젝트의 프로젝트 ID 또는 프로젝트 번호OPTIONAL_ETAG
: 할당량 조정자 설정의 선택적 ETag 문자열
이렇게 하면 사용 설정 상태가
enabled
로 업데이트됩니다.
gcloud
gcloud CLI를 사용하여 Google Cloud 프로젝트에서 할당량 조정자를 사용 설정하려면(프리뷰) 다음 단계를 따르세요.
gcloud CLI를 사용하여 인증합니다.
gcloud auth login
할당량 조정자 설정을 사용 설정합니다.
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
PROJECT_ID_OR_NUMBER
를 할당량 조정기를 사용 설정할 프로젝트의 프로젝트 ID 또는 프로젝트 번호로 바꿉니다.사용 설정 상태를 확인합니다.
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
필요한 권한이 있다면 상태가
enabled
로 반환됩니다.
할당량 조정 요청 보기
할당량 조정 요청을 보려면 다음 IAM 권한이 있어야 합니다.
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
할당량 조정자가 실행한 할당량 조정 요청을 보려면 다음 안내를 따르세요.
- Google Cloud 콘솔에서 IAM 및 관리자 > 할당량 및 시스템 한도 페이지로 이동합니다.
- 상향 요청 탭을 클릭합니다. 상향 요청 뷰에는 수동으로 요청된 상향 요청과 할당량 조정자가 실행한 요청을 포함하여 프로젝트의 모든 상향 요청이 표시됩니다.
- 필터 입력란을 클릭합니다.
- 메뉴에서 유형을 선택하고
Auto
를 입력합니다. 할당량 조정자가 제출한 요청을 필터링합니다.
할당량 조정자 알림 설정
할당량 조정자로부터 알림을 받으려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 IAM 및 관리자 > 할당량 및 시스템 한도 페이지로 이동합니다.
- 구성 탭을 클릭합니다.
- 알림 만들기를 클릭합니다.
- 알림 템플릿 하나 또는 둘 다를 선택합니다.
- 할당량 조정자별 모든 조정은 할당량 조정자가 프로젝트에 대한 할당량 조정 요청을 실행할 때마다 알림을 보냅니다.
- 할당량 조정자 오류 및 실패는 할당량 조정자가 할당량 값을 상향 조정하려고 시도했지만 이를 수행할 수 없는 경우에만 알림을 보냅니다.
- 선택사항: 옵션 표시를 클릭하여 알림과 이슈 자동 종료 기간 간의 최소 시간에 대한 기본값을 조정합니다.
- 알림을 받을 알림 채널을 선택합니다. 알림 채널 설정을 조정하거나 새 알림 채널을 만들려면 알림 채널 관리를 클릭합니다.
- 만들기를 클릭합니다.
할당량 조정자 알림 수정 또는 삭제
Google Cloud 콘솔에서 할당량 조정자 알림을 수정하거나 삭제할 수 있습니다.
Cloud Monitoring 콘솔의 정책 페이지로 이동합니다.
할당량 조정자 알림 정책을 검색합니다. 할당량 조정자 알림 정책의 이름은 다음과 같습니다.
Quota adjuster errors and failures
All adjustments by quota adjuster
할당량 조정자 알림 정책을 보여주는 행에서
더보기를 클릭합니다.수정 또는 삭제를 클릭합니다.
할당량 조정자 사용 중지
할당량 조정자를 사용 중지하려면 다음 IAM 권한이 있어야 합니다.
cloudquotas.quotas.update
cloudquotas.quotas.get
Google Cloud 콘솔 프로젝트에서 할당량 조정자를 사용 중지하려면 적절한 탭을 선택하고 안내를 따르세요.
콘솔
- Google Cloud 콘솔에서 IAM 및 관리자 > 할당량 및 시스템 한도 페이지로 이동합니다.
- 구성 탭을 클릭합니다.
- 사용 설정 전환 버튼을 클릭합니다. 전환 스위치가 회색으로 바뀝니다.
전환 버튼이 회색이고 상태 열에 사용 설정되지 않음이 표시되면 할당량 조정자가 더 이상 사용량을 모니터링하거나 할당량 조정 요청을 실행하지 않습니다.
REST
REST API를 사용하여 Google Cloud 프로젝트에서 할당량 조정자를 사용 중지하려면(프리뷰) HTTP 요청을 보내 할당량 조정자 설정을 업데이트합니다.
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
요청 본문에서 할당량 조정기 설정 리소스를 지정하고
enablement
필드를DISABLED
로 설정합니다. ETag를 지정할 수도 있지만 이는 선택사항입니다.{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
다음을 바꿉니다.
PROJECT_ID_OR_NUMBER
: 할당량 조정기를 사용 중지할 프로젝트의 프로젝트 ID 또는 프로젝트 번호OPTIONAL_ETAG
: 할당량 조정자 설정의 선택적 ETag 문자열
이렇게 하면 사용 설정 상태가
disabled
로 업데이트됩니다.
gcloud
gcloud CLI를 사용하여 Google Cloud 프로젝트에서 할당량 조정자를 사용 중지하려면(프리뷰) 다음 단계를 따르세요.
gcloud CLI에 인증합니다.
gcloud auth login
할당량 조정자 설정을 사용 중지합니다.
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
PROJECT_ID_OR_NUMBER
를 할당량 조정기를 사용 중지할 프로젝트의 프로젝트 ID 또는 프로젝트 번호로 바꿉니다.사용 설정 상태를 확인합니다.
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
필요한 권한이 있다면 상태가
disabled
로 반환됩니다.
할당량 상향 거부 문제 해결
할당량 조정자가 시작한 할당량 상향 조정이 거부될 수 있습니다. Google Cloud 에서 특정 프로젝트, 리소스 또는 리전의 할당량을 특정 값 이상으로 상향 조정할 수 없는 경우 종종 이러한 일이 발생합니다. 이 시나리오에서는 언제든지 수동으로 할당량 상향 조정을 요청할 수 있습니다.
할당량 조정자가 제출한 할당량 조정 요청이 거부될 때 알림을 받으려면 할당량 조정자 알림을 설정합니다.