Vertex AI 할당량 및 한도

Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.

Cloud Quotas 시스템은 다음을 수행합니다.

대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.

할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.

자세한 내용은 Cloud Quotas 개요를 참고하세요.

Vertex AI 리소스에도 한도가 있습니다. 이 한도는 할당량 시스템과 관련이 없습니다. 한도는 변경할 수 없습니다.

비율 할당량

다음 할당량은 특정 프로젝트 및 지원된 리전의 Vertex AI 요청에 적용됩니다. 예를 들어 단일 프로젝트의 한 리전에서 분당 온라인 추론 요청을 최대 30,000개 사용하고 다른 지원된 리전에서도 분당 온라인 추론 요청을 30,000개 사용할 수 있습니다.

Gemini 모델의 할당량은 Vertex AI의 생성형 AI 할당량 및 시스템 한도를 참조하세요. OpenMaaS 및 제3자 MaaS 모델의 할당량에 대한 자세한 내용은 MaaS용 Vertex AI 관리형 모델을 참조하세요. Llama 4 Maverick의 예는 Llama 4 Maverick 17B-128E를 참조하세요.

요청 유형 분당 요청 수
리소스 관리(CRUD) 요청1 600
작업 또는 장기 실행 작업(LRO) 제출 요청3 60
온라인 추론 요청2 30,000
온라인 추론 요청 처리량 1.5GB
온라인 설명 요청 600
Vertex AI 텐서보드 시계열 읽기 요청 60,000
ML Metadata(CRUD) 요청 12,000
생성형 AI 캐싱(CRUD) 요청 200
Vertex AI Vizier(CRUD) 요청 6,000
Vertex AI Feature Store 온라인 서빙 요청 300,000
Vertex ML Metadata 요청 12,000
count 토큰 또는 compute 토큰 요청 수 3,000

1리소스 관리 요청에는 작업 이외의 요청, LRO, 온라인 추론 요청, Vertex AI Vizier 요청, ML 메타데이터 요청, Vertex AI TensorBoard Timeseries Insights API 읽기 요청, Vertex AI Feature Store 요청, Vertex AI Feature Store 스트리밍 요청 또는 벡터 검색 요청이 포함됩니다. 리소스 관리 요청은 전역 및 리전 모두일 수 있습니다.

2 이 할당량은 공개 엔드포인트에만 적용됩니다. 3 작업 또는 LRO 제출 요청은 전역 및 리전일 수 있습니다.

작업 또는 LRO에는 다음 요청이 포함됩니다.

  • 데이터 세트를 만들거나 삭제합니다.
  • 데이터를 데이터 세트에서 가져오거나 데이터 세트로 내보냅니다.
  • 엔드포인트를 만듭니다.
  • 커스텀 작업을 만들거나 삭제합니다.
  • 데이터 라벨링 작업을 만들거나 삭제합니다.
  • 초매개변수 조정 작업을 만들거나 삭제합니다.
  • 일괄 추론 작업을 만들거나 삭제합니다.
  • 모델을 만들거나 삭제합니다.
  • 모델을 업로드, 삭제하거나 내보냅니다.
  • 노트북 런타임 템플릿을 만들거나 삭제합니다.
  • 노트북 런타임을 할당, 삭제, 시작, 업그레이드합니다.
  • 모델 모니터를 생성, 삭제 또는 업데이트합니다.
  • 모델 모니터링 작업을 만들거나 삭제합니다.


생성형 AI 모델의 할당량 정보는 Vertex AI의 생성형 AI 할당량 및 한도를 참조하세요.

AutoML 모델 할당량

특정 프로젝트 및 리전의 각 데이터 유형과 객체에 적용되는 할당량은 다음과 같습니다. 예를 들어 특정 프로젝트 및 리전에서 AutoML 이미지 분류 모델을 10개, AutoML 이미지 객체 감지 모델을 10개 배포하여 총 20개의 모델을 배포할 수 있습니다.

이미지

분류

Quota
동시 학습 작업 5
Explainable AI 포함 동시 학습 작업 2
동시 일괄 추론 작업 5
동시 실행되는 모델 배포 작업 5
동시 실행되는 모델 배포 취소 작업 5
배포된 모델 수 10

객체 감지

Quota
동시 학습 작업 5
동시 일괄 추론 작업 5
배포된 모델 수 10

테이블 형식

Quota
동시 학습 작업 5
동시 일괄 추론 작업 5
배포된 모델 수 30

Vertex AI Model Registry

Vertex AI Model Registry에서 지원하는 최대 모델 크기는 1TB입니다.

AutoML 모델 한도

특정 프로젝트 및 리전의 각 데이터 유형에 적용되는 한도는 다음과 같습니다. 예를 들어 특정 프로젝트 및 리전에서 일괄 요청 입력에 최대 1,000,000개의 이미지를 포함할 수 있습니다.

이미지

한도 유형
이미지 파일 크기 최대: 30MB
데이터 세트당 이미지 최대: 1,000,000
데이터 세트당 라벨 최소: 2
최대: 5,000
라벨당 이미지 최소: 10
권장: 1,000
일괄 입력 CSV 파일 크기 최대: 100MB
일괄 입력의 이미지 수 최대: 1,000,000

테이블 형식

한도 유형
최대 크기 100GB
행 수 행 1,000~100,000,000개
열 개수 열 2~1,000개
동시에 실행되는 데이터 세트 가져오기 수 가져오기 5개
CSV 파일 크기 최대: 파일당 10GB, 총 최대 100GB

커스텀 학습 모델 할당량

다음 할당량은 특정 프로젝트 및 리전의 Vertex AI 커스텀 학습 모델에 적용됩니다.

학습

Quota
동시 실행되는 커스텀 학습 파이프라인 2,000
리전별 학습용 N1 및 E2 CPU 수
지역
us-west1 2,200
us-west2 20
us-west3 2,200
us-west4 20
us-central1 2,200
us-east1 2,200
us-east4 20
us-east5 450
us-south1 450
northamerica-northeast1 2,200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2,200
europe-west1 2,200
europe-west4 2,200
europe-west6 20
europe-west3 2,200
europe-north1 20
europe-central2 450
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 2,200
asia-south2 20
asia-southeast1 2,200
asia-southeast2 2,200
asia-east2 2,200
asia-east1 2,200
asia-northeast1 2,200
asia-northeast2 20
australia-southeast1 2,200
australia-southeast2 20
asia-northeast3 2,200
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
리전별 학습용 N2 CPU 수
지역
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-south2 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
리전별 학습용 M1 CPU 수
지역
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-east5 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1 0
europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1 0
asia-south1 0
asia-south2 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
me-central1 0
me-central2 0
europe-west12 0
africa-south1 0
리전별 학습용 C2 CPU 수
지역
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-south2 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 20
me-central2 20
europe-west12 20
africa-south1 20
리전별 학습용 A2 CPU 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 무제한
us-east1 무제한
us-east4 무제한
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 무제한
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 무제한
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 무제한
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 동시 A3 CPU 수
지역
us-west1 무제한
us-west2 무제한
us-west3 무제한
us-west4 무제한
us-central1 무제한
us-east1 무제한
us-east4 무제한
us-east5 무제한
us-south1 무제한
northamerica-northeast1 무제한
northamerica-northeast2 무제한
southamerica-east1 무제한
southamerica-west1 무제한
europe-west2 무제한
europe-west1 무제한
europe-west4 무제한
europe-west6 무제한
europe-west3 무제한
europe-north1 무제한
europe-central2 무제한
europe-west8 무제한
europe-west9 무제한
europe-southwest1 무제한
asia-south1 무제한
asia-south2 무제한
asia-southeast1 무제한
asia-southeast2 무제한
asia-east2 무제한
asia-east1 무제한
asia-northeast1 무제한
asia-northeast2 무제한
australia-southeast1 무제한
australia-southeast2 무제한
asia-northeast3 무제한
me-west1 무제한
me-central1 무제한
me-central2 무제한
europe-west12 무제한
africa-south1 무제한
리전별 학습용 동시 H200 GPU 수
지역
us-west1 0
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 8
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 0
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 8
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 P4 GPU 수
지역
us-west1 사용 불가능
us-west2 6
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 6
us-east1 사용 불가능
us-east4 1
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 6
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 6
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 6
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 6
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 T4 GPU 수
지역
us-west1 2
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 12
us-east1 2
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 6
europe-west1 사용 불가능
europe-west4 2
europe-west6 사용 불가능
europe-west3 0
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 6
asia-south2 사용 불가능
asia-southeast1 1
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 6
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 1
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 L4 GPU 수
지역
us-west1 0
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 0
us-east4 0
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 0
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 0
asia-south2 사용 불가능
asia-southeast1 0
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 0
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 0
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 RTX PRO 6000 GPU 수
지역
us-west1 0
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 0
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 0
asia-southeast1 0
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 P100 GPU 수
지역
us-west1 30
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 56
us-east1 30
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 30
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 30
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 6
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 V100 GPU 수
지역
us-west1 6
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 6
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 6
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 6
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 A100 GPU 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 8
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 8
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 8
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 동시 A100 80GB GPU 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 0
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 0
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능

자세한 내용은 할당량 보기 및 관리를 참조하세요.

리전별 학습용 동시 H100 GPU 수
지역
us-west1 0
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 0
us-east5 0
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 0
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 0
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 동시 B200 GPU 수
지역
us-west1 사용 불가능
us-west2 0
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 0
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 0
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 동시 GB200 GPU 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 동시 H100 메가 GPU 수
지역
us-west1 0
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 0
us-central1 0
us-east1 사용 불가능
us-east4 0
us-east5 0
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 0
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 0
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 0
asia-northeast2 사용 불가능
australia-southeast1 0
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능

자세한 내용은 할당량 보기 및 관리를 참조하세요.

리전별 학습용 TPU V2 코어 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 0
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 TPU V2 포드 코어 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 사용 불가능
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 TPU V3 코어 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 0
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습용 TPU V3 포드 코어 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 사용 불가능
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 학습 중 HDD 사용량(GB)
지역
us-west1 180,000
us-west2 3,600개
us-west3 180,000
us-west4 3,600개
us-central1 180,000
us-east1 180,000
us-east4 3,600개
us-east5 3,600개
us-south1 180,000
northamerica-northeast1 180,000
northamerica-northeast2 3,600개
southamerica-east1 3,600개
southamerica-west1 3,600개
europe-west2 180,000
europe-west1 180,000
europe-west4 180,000
europe-west6 3,600개
europe-west3 180,000
europe-north1 3,600개
europe-central2 180,000
europe-west8 3,600개
europe-west9 180,000
europe-southwest1 3,600개
asia-south1 180,000
asia-south2 3,600개
asia-southeast1 180,000
asia-southeast2 180,000
asia-east2 180,000
asia-east1 180,000
asia-northeast1 180,000
asia-northeast2 3,600개
australia-southeast1 180,000
australia-southeast2 3,600개
asia-northeast3 180,000
me-west1 180,000
me-central1 3,600개
me-central2 3,600개
europe-west12 3,600개
africa-south1 3,600개
리전별 학습 중 SSD 사용량(GB)
지역
us-west1 75,000
us-west2 450
us-west3 75,000
us-west4 450
us-central1 75,000
us-east1 75,000
us-east4 450
us-east5 450
us-south1 75,000
northamerica-northeast1 75,000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75,000
europe-west1 75,000
europe-west4 75,000
europe-west6 450
europe-west3 75,000
europe-north1 450
europe-central2 75,000
europe-west8 450
europe-west9 75,000
europe-southwest1 450
asia-south1 75,000
asia-south2 450
asia-southeast1 75,000
asia-southeast2 75,000
asia-east2 75,000
asia-east1 75,000
asia-northeast1 75,000
asia-northeast2 450
australia-southeast1 75,000
australia-southeast2 450
asia-northeast3 75,000
me-west1 75,000
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
리전별 학습 중 Hyperdisk Balanced 사용량(GB)
지역
us-west1 75,000
us-west2 450
us-west3 450
us-west4 450
us-central1 75,000
us-east1 450
us-east4 75,000
us-east5 450
us-south1 75,000
northamerica-northeast1 450
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 450
europe-west1 75,000
europe-west4 75,000
europe-west6 450
europe-west3 450
europe-north1 450
europe-central2 450
europe-west8 450
europe-west9 450
europe-southwest1 450
asia-south1 75,000
asia-south2 450
asia-southeast1 450
asia-southeast2 450
asia-east2 450
asia-east1 450
asia-northeast1 450
asia-northeast2 450
australia-southeast1 450
australia-southeast2 450
asia-northeast3 450
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450

서빙

Quota
배포된 커스텀 모델 복제본 수 100
리전별 제공되는 CPU 수
지역
us-west1 2,200
us-west2 2,200
us-west3 2,200
us-west4 16
us-central1 2,200
us-east1 2,200
us-east4 2,200
us-east5 16
us-south1 450
northamerica-northeast1 2,200
northamerica-northeast2 450
southamerica-east1 2,200
southamerica-west1 450
europe-west2 2,200
europe-west1 2,200
europe-west4 2,200
europe-west6 2,200
europe-west3 2,200
europe-north1 16
europe-central2 450
europe-west8 16
europe-west9 16
europe-southwest1 16
asia-south1 2,200
asia-south2 16
asia-southeast1 2,200
asia-southeast2 2,200
asia-east2 2,200
asia-east1 2,200
asia-northeast1 2,200
asia-northeast2 16
australia-southeast1 2,200
australia-southeast2 16
asia-northeast3 2,200
me-west1 450
me-central1 16
me-central2 16
europe-west12 16
africa-south1 16
리전별 제공되는 동시 H200 GPU 수
지역
us-west1 0
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 0
us-east5 사용 불가능
us-south1 8
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 0
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 8
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 P100 GPU 수
지역
us-west1 30
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 56
us-east1 30
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 30
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 30
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 P4 GPU 수
지역
us-west1 사용 불가능
us-west2 6
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 6
us-east1 사용 불가능
us-east4 6
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 6
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 6
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 6
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 6
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 T4 GPU 수
지역
us-west1 12
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 12
us-east1 12
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 12
europe-west1 사용 불가능
europe-west4 12
europe-west6 사용 불가능
europe-west3 0
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 6
asia-south2 사용 불가능
asia-southeast1 6
asia-southeast2 사용 불가능
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 6
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 L4 GPU 수
지역
us-west1 28
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 28
us-east1 28
us-east4 28
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 28
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 28
asia-northeast1 28
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 V100 GPU 수
지역
us-west1 6
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 6
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 6
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 A100 GPU 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 14
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 14
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 14
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 14
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 14
me-west1 1
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 A100 80GB GPU 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 1
us-east1 사용 불가능
us-east4 1
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 1
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 1
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 동시 B200 GPU 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 동시 GB200 GPU 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 사용 불가능
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 H100 GPU 수
지역
us-west1 8
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 16
us-east1 사용 불가능
us-east4 0
us-east5 16
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 16
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 16
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 H100 Mega GPU 수
지역
us-west1 0
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 0
us-central1 0
us-east1 사용 불가능
us-east4 0
us-east5 0
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 0
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 0
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 0
asia-northeast2 사용 불가능
australia-southeast1 0
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 RTX Pro 6000 GPU 수
지역
us-west1 0
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 0
us-east1 0
us-east4 0
us-east5 사용 불가능
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 0
europe-west4 0
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 0
asia-southeast1 0
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 v5e TPU 칩 수
지역
us-west1 4
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 0
us-central1 32
us-east1 사용 불가능
us-east4 사용 불가능
us-east5 사용 불가능
us-south1 32
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 32
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 32
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 사용 불가능
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능
리전별 제공되는 v6e TPU 칩 수
지역
us-west1 사용 불가능
us-west2 사용 불가능
us-west3 사용 불가능
us-west4 사용 불가능
us-central1 사용 불가능
us-east1 0
us-east4 사용 불가능
us-east5 0
us-south1 사용 불가능
northamerica-northeast1 사용 불가능
northamerica-northeast2 사용 불가능
southamerica-east1 사용 불가능
southamerica-west1 사용 불가능
europe-west2 사용 불가능
europe-west1 사용 불가능
europe-west4 8
europe-west6 사용 불가능
europe-west3 사용 불가능
europe-north1 사용 불가능
europe-central2 사용 불가능
europe-west8 사용 불가능
europe-west9 사용 불가능
europe-southwest1 사용 불가능
asia-south1 사용 불가능
asia-south2 사용 불가능
asia-southeast1 사용 불가능
asia-southeast2 사용 불가능
asia-east2 사용 불가능
asia-east1 사용 불가능
asia-northeast1 0
asia-northeast2 사용 불가능
australia-southeast1 사용 불가능
australia-southeast2 사용 불가능
asia-northeast3 사용 불가능
me-west1 사용 불가능
me-central1 사용 불가능
me-central2 사용 불가능
europe-west12 사용 불가능
africa-south1 사용 불가능

커스텀 학습 모델 한도

다음 한도는 특정 프로젝트 및 리전의 Vertex AI 커스텀 학습 모델에 적용됩니다.

서빙

한도
프로젝트당 복제본 수 200
클러스터당 컨테이너 수 25,000

Vertex AI Feature Store

이 섹션에서는 다음 항목에 대한 할당량과 한도를 보여줍니다.

Vertex AI Feature Store

특정 프로젝트와 리전에 적용되는 할당량은 다음과 같습니다. 예를 들어 단일 프로젝트에서 us-central1에 200개의 온라인 서빙 노드를 지정하고 us-east4에 다시 50개 노드를 지정할 수 있습니다.

Quota
분당 온라인 서빙 요청 수 300,000
최대 FeatureOnlineStore 인스턴스 수 10
분당 최대 검색 요청 수 6,000,000
프로젝트의 모든 최적화된 FeatureOnlineStore 인스턴스에서 최대 온라인 서빙 노드 수 80
모든 FeatureOnlineStore 인스턴스의 최대 FeatureView 인스턴스 수 30

Vertex AI Feature Store에는 다음과 같은 한계가 있습니다. 다음 표에는 한도 상향 조정을 요청할 수 없습니다.

한도
프로젝트 및 위치의 최대 FeatureGroup 리소스 수 250
FeatureGroup 내의 최대 Feature 리소스 수 10,000
엔티티당 최대 특성 데이터 크기 5MB
온라인 서빙 요청당 엔티티 ID 수(FetchFeatureValues) 1
항목 ID의 최대 길이 4076자
최적화 온라인 서빙 노드의 스토리지 한도 200GB

Vertex AI Feature Store(기존)

특정 프로젝트와 리전에 적용되는 할당량은 다음과 같습니다. 예를 들어 단일 프로젝트에서 us-central1에 동시 일괄 작업 75개와 europe-west4에 다른 작업 75개를 만들 수 있습니다.

Quota
분당 온라인 서빙 요청 수 300,000
분당 스트리밍 수집 요청 수 60,000
분당 스트리밍 수집 쓰기 처리량 1.2GB
분당 특성 생성 요청 수 100
모든 피처스토어의 온라인 서빙 노드 30
동시 일괄 작업(수집, 제공, 삭제 특성 값 결합) 75
특성 값 삭제를 위한 동시 요청 1
모든 피처스토어의 항목 유형 75

Vertex AI Feature Store(기존)의 한도는 다음과 같습니다. 다음 표에는 한도 상향 조정을 요청할 수 없습니다.

한도
온라인 서빙 노드의 스토리지 한도 5TB
오프라인 저장소의 총 데이터 무제한
항목 유형당 특성 5,000
리전별 프로젝트당 일일 featurestore 생성, 업데이트, 삭제 횟수 500
스트리밍 수집의 경우 요청당 크기 1MB
스트리밍 읽기의 경우 요청당 포함할 수 있는 항목 수 100
일괄 가져오기의 경우 요청당 포함할 수 있는 파일 수 Avro의 경우 5,000 또는 CSV의 경우 500
일괄 서빙 및 내보내기의 경우 요청할 수 있는 특성 수 5,000
일괄 수집 및 스트리밍 수집의 경우 특성 데이터를 수집할 수 있는 가장 오래된 타임스탬프 현재 날짜로부터 4,000일간

Vertex AI Feature Store(기존)의 데이터 보관 한도에는 다음과 같은 기본값이 있으며, 이 값은 재정의할 수 있습니다.

데이터 보관 기본값 기본값
오프라인 저장소의 데이터 보관(값이 삭제된 이후 가장 오래된 특성 값 타임스탬프) 현재 날짜로부터 4,000일간
온라인 저장소의 데이터 보관(값이 삭제된 후 가장 오래된 특성 값 타임스탬프) 현재 날짜로부터 4,000일간

다음과 같은 방법으로 데이터 보관 한도를 재정의할 수 있습니다.

  • 온라인 저장소의 데이터 보관 한도를 재정의하려면 피처스토어를 만들거나 업데이트할 때 online_storage_ttl_days 파라미터를 설정합니다.

  • 오프라인 저장소의 데이터 보관 한도를 재정의하려면 엔티티 유형을 만들거나 업데이트할 때 offline_storage_ttl_days 파라미터를 설정합니다.

다음 할당량은 각 리전에 지정된 프로젝트의 벡터 검색에 적용됩니다.

Quota
동시 실행 색인 생성 작업 5
동시 실행 색인 업데이트 작업 5
배포된 색인 노드 수 50
배포된 색인 N2D 노드 수 5
색인 수 100
분당 스트리밍 업데이트 요청 수 6,000
분당 스트리밍 업데이트 처리량(KB) 120,000

Vertex ML Metadata

각 리전의 특정 프로젝트에 대한 Vertex ML Metadata에는 다음 한도가 적용됩니다.

한도
리소스 내 메타데이터 필드의 최대 직렬화된 크기 204,800바이트
메타데이터 스키마의 최대 직렬화된 크기 204,800바이트

Vertex AI Pipelines

각 리전의 특정 프로젝트에 대해 다음 할당량 및 한도가 Vertex AI Pipelines에 적용됩니다.

Quota
파이프라인 태스크 동시 실행* 600
파이프라인 동시 실행* 300

* 이 한도를 넘는 파이프라인 실행/태스크 요청은 리소스를 사용할 수 있을 때까지 큐에 추가됩니다.

Vertex AI Pipelines에는 다음 한도가 적용됩니다. 할당량과 달리 한도 상향을 요청할 수 없습니다.

한도
작업당 파이프라인 태스크 수 10,000
파이프라인 태스크당 입력 및 출력 아티팩트 100
파이프라인 작업당 입력 및 출력 아티팩트 10,000
파이프라인 태스크당 출력 매개변수 및 아티팩트가 포함된 JSON 페이로드의 최대 크기 131,072바이트
파이프라인 태스크의 최대 실행 시간** 7일

* 이 한도를 초과하여 실행되는 파이프라인 태스크는 취소됩니다.

Colab Enterprise 할당량 및 한도

Colab Enterprise 할당량 및 한도는 별도로 나열되어 있습니다. Colab Enterprise 할당량 및 한도를 참조하세요.

할당량 상향 조정

Vertex AI의 할당량을 상향 조정하려면 Google Cloud 콘솔을 사용하여 할당량 상향을 요청하면 됩니다.

할당량 상향 조정 요청 제출에 대한 자세한 내용은 할당량 보기 및 관리의 다음 섹션을 참고하세요.

리전 및 모델별 할당량

Google Cloud 콘솔에서 할당량 보기 및 수정

Google Cloud 콘솔에서 할당량을 확인하고 수정하려면 다음 단계를 따르세요.
  1. 할당량 및 시스템 한도 페이지로 이동합니다.
  2. 할당량 및 시스템 한도로 이동

  3. 할당량을 조정하려면 필터에 속성 aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model을 복사하여 붙여넣습니다. Enter를 누릅니다.
  4. 행 끝에 있는 점 3개를 클릭하고 할당량 수정을 선택합니다.
  5. 창에 새 할당량 값을 입력하고 요청 제출을 클릭합니다.

리전별 및 모델별 분당 요청 수(RPM) 할당량 보기

기본적으로 Gemini 모델 2.0 이상에서는 동적 공유 할당량(DSQ)을 사용합니다.

다음 표에는 각 모델의 분당 요청 수가 나와 있습니다. 할당량은 달리 명시되지 않는 한 모든 리전에서 동일합니다.

기본 모델 분당 요청 수
base_model : gemini-2.0-flash-001 동적 공유 할당량(DSQ)을 참고하세요.
base_model : gemini-2.0-flash-lite-001 동적 공유 할당량(DSQ)을 참고하세요.
base_model : imagegeneration 100
base_model : imagetext 500
base_model : multimodalembedding 120
base_model : text-embedding 1500
base_model : gemini-embedding 100000
base_model : videotext 아이오와(us-central1): 120
기타 모든 지역: 사용할 수 없음
base_model : medlm-medium 아이오와(us-central1): 3
기타 모든 지역: 사용할 수 없음
base_model : medlm-large 아이오와(us-central1): 3
기타 모든 지역: 사용할 수 없음

할당량 늘리기

Vertex AI 기반 생성형 AI 할당량을 상향 조정하려면 Google Cloud 콘솔을 사용하여 할당량 상향을 요청하면 됩니다.

RAG Engine 할당량

RAG Engine을 사용하여 검색 증강 생성(RAG)을 수행하는 각 서비스에는 다음 할당량이 적용되며, 할당량은 분당 요청 수(RPM)로 측정됩니다.
서비스 Quota 측정항목
RAG Engine 데이터 관리 API 60 RPM VertexRagDataService requests per minute per region
RetrievalContexts API 600 RPM VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1,500 RPM Online prediction requests per base model per minute per region per base_model

지정할 수 있는 추가 필터는 base_model: textembedding-gecko입니다.
적용되는 요청 한도는 다음과 같습니다.
서비스 한도 측정항목
동시 ImportRagFiles 요청 3 RPM VertexRagService concurrent import requests per region
ImportRagFiles 요청당 최대 파일 수 10,000 VertexRagService import rag files requests per region

비율 제한 및 할당량에 관한 자세한 내용은 Vertex AI의 생성형 AI 비율 제한을 참조하세요.

일괄 요청

일괄 추론 작업에 대한 할당량과 한도는 모든 리전에서 동일합니다.

Gemini 모델의 동시 일괄 추론 작업 한도

Gemini 모델의 일괄 추론에는 사전 정의된 할당량 한도가 없습니다. 대신 일괄 서비스는 해당 모델의 실시간 가용성과 전체 고객 수요에 따라 동적으로 할당되는 대규모 공유 리소스 풀에 대한 액세스를 제공합니다. 활성 고객 수가 많아지고 모델의 용량이 포화 상태에 이르면 사용자의 일괄 요청은 용량이 확보될 때까지 대기열에 들어갈 수 있습니다.

Gemini 이외 모델의 동시 일괄 추론 작업 할당량

다음 표에서는 Gemini 모델에는 적용되지 않는, Gemini 이외 모델에 대한 동시 일괄 추론 작업 개수 할당량을 보여줍니다.
Quota
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs 4
제출된 작업 수가 배정된 할당량을 초과하면 작업이 큐에 추가되고 할당량 용량을 사용할 수 있게 되면 처리됩니다.

커스텀 학습 모델 할당량

특정 프로젝트 및 리전의 Vertex AI의 생성형 AI 조정 모델에 적용되는 할당량은 다음과 같습니다.
Quota
리전에 따라 제한된 이미지 학습 TPU V3 포드 코어
* 지원되는 리전 - europe-west4
64
리전에 따라 제한된 이미지 학습 Nvidia A100 80GB GPU
* 지원되는 리전 - us-central1
* 지원되는 리전 - us-east4

8
2
* 조정 시나리오에는 특정 리전에 가속기 예약이 있습니다. 조정에 대한 할당량이 지원되며 특정 리전에서 요청해야 합니다.

텍스트 임베딩 한도

각 요청에는 최대 250개의 입력 텍스트를 포함할 수 있으며, 각 입력 텍스트마다 1개의 임베딩이 생성됩니다. 요청당 최대 20,000개 토큰까지 허용됩니다. 각 입력 텍스트에서는 처음 2,048개 토큰만 임베딩 계산에 사용됩니다. gemini-embedding-001 모델의 할당량gemini-embedding 이름으로 표시됩니다.

기본 모델별 분당 콘텐츠 삽입 입력 토큰

이전의 임베딩 모델은 주로 RPM 할당량에 따라 제한되었지만 Gemini 임베딩 모델의 할당량은 프로젝트별로 분당 전송할 수 있는 토큰 수를 제한합니다.

Quota
분당 콘텐츠 삽입 입력 토큰 5,000,000

Gen AI Evaluation Service 서비스 할당량

Gen AI Evaluation Service는 모델 기반 측정항목에 gemini-2.0-flash를 기본 평가 모델로 사용합니다. 모델 기반 측정항목에 대한 단일 평가 요청으로 인해 Gen AI Evaluation Service에 대한 여러 개의 기본 요청이 발생할 수 있습니다. 각 모델의 할당량은 프로젝트별로 계산됩니다. 즉, 모델 추론 및 모델 기반 평가를 위해 gemini-2.0-flash로 전달되는 모든 요청이 할당량에 반영됩니다. Gen AI Evaluation Service 및 기본 평가 모델의 할당량은 다음 표에 나와 있습니다.
요청 할당량 기본 할당량
분당 Gen AI Evaluation Service 요청 수 리전별 프로젝트당 1,000개 요청
base_model: gemini-2.0-flash
분당 온라인 예측 요청 수
리전 및 모델별 할당량을 참조하세요.
동시 평가 실행 리전별 프로젝트당 동시 평가 20개 실행

Gen AI Evaluation Service를 사용하는 동안 할당량과 관련된 오류가 발생하면 할당량 증가 요청을 제출해야 할 수 있습니다. 자세한 사항은 할당량 보기 및 관리를 참조하세요.

한도
Gen AI Evaluation Service 요청 제한 시간 60초

새 프로젝트에서 Gen AI Evaluation Service를 처음 사용하는 경우 최대 2분까지 초기 설정이 지연될 수 있습니다. 첫 번째 요청이 실패하면 몇 분 정도 기다린 후 다시 시도하세요. 후속 평가 요청은 일반적으로 60초 이내에 완료됩니다.

모델 기반 측정항목의 최대 입력 및 출력 토큰은 평가 모델로 사용되는 모델에 따라 다릅니다. 모델 목록은 Google 모델을 참고하세요.

파이프라인 평가 할당량

평가 파이프라인 서비스를 사용하는 동안 할당량과 관련된 오류가 발생하면 할당량 증가 요청을 제출해야 할 수 있습니다. 자세한 사항은 할당량 보기 및 관리를 참조하세요. 평가 파이프라인 서비스는 Vertex AI Pipelines을 사용하여 PipelineJobs를 실행합니다. Vertex AI Pipelines의 관련 할당량을 알아보세요. 다음은 일반적인 할당량 권장사항입니다.
서비스 Quota 권장사항
Vertex AI API 리전별 동시 LLM 일괄 예측 작업 점별: 1 * num_concurrent_pipelines

쌍별: 2 * num_concurrent_pipelines
Vertex AI API 리전별 분당 평가 요청 수 1000 * num_concurrent_pipelines
또한 모델 기반 측정항목의 관련 할당량은 사용하는 평가 모델에 따라 다릅니다.
Tasks Quota 기본 모델 권장사항
summarization
question_answering
base_model별 리전별 기본 모델별 분당 온라인 예측 요청 text-bison 60 * num_concurrent_pipelines

Vertex AI Agent Engine 할당량

다음 할당량은 각 리전의 특정 프로젝트에 대한 Vertex AI Agent Engine에 적용됩니다.
설명 Quota 측정항목
Vertex AI Agent Engine 리소스 만들기, 삭제 또는 업데이트(분당) 10 aiplatform.googleapis.com/reasoning_engine_service_write_requests
Vertex AI Agent Engine 세션 만들기, 삭제, 업데이트(분당) 100 aiplatform.googleapis.com/session_write_requests
Vertex AI Agent Engine에 대한 Query 또는 StreamQuery(분당) 90 aiplatform.googleapis.com/reasoning_engine_service_query_requests
Vertex AI Agent Engine 세션에 이벤트 추가(분당) 300 aiplatform.googleapis.com/session_event_append_requests
최대 Vertex AI Agent Engine 리소스 수 100 aiplatform.googleapis.com/reasoning_engine_service_entities
Vertex AI Agent Engine 메모리 리소스 만들기, 삭제, 업데이트(분당) 100 aiplatform.googleapis.com/memory_bank_write_requests
Vertex AI Agent Engine Memory Bank에서 가져오기, 나열, 검색(분당) 300 aiplatform.googleapis.com/memory_bank_read_requests
샌드박스 환경(Code Execution) 실행 요청 수(분당) 1000 aiplatform.googleapis.com/sandbox_environment_execute_requests
샌드박스 환경(Code Execution) 항목 수(리전) 1000 aiplatform.googleapis.com/sandbox_environment_entities
A2A 에이전트 POST 요청(예: sendMessagecancelTask)(분당) 60 aiplatform.googleapis.com/a2a_agent_post_requests
A2A 에이전트 GET 요청(예: getTaskgetCard)(분당) 600 aiplatform.googleapis.com/a2a_agent_get_requests
BidiStreamQuery API를 사용하는 동시 라이브 양방향 연결(분당) 10 aiplatform.googleapis.com/reasoning_engine_service_concurrent_query_requests

오류 코드 429 문제 해결

429 오류를 해결하려면 오류 코드 429를 참조하세요.

다음 단계