A3 머신 시리즈에서 NVIDIA H100 GPU를 사용하여 컨피덴셜 VM 인스턴스를 만들 때 GPU 할당량과 관련된 다음 오류가 발생할 수 있습니다.
리전별 할당량 부족
이 오류는 요청이 특정 리전에서 사용 가능한 GPU 할당량을 초과할 때 발생합니다.
오류 메시지 예:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_PER_GPU_FAMILY exceeded. Limit: QUOTA_LIMIT in
region REGION
Google Cloud 콘솔에서 GPU 할당량 오류 메시지에 늘려야 하는 특정 할당량 유형 대신 GPUS_PER_GPU_FAMILY과 같은 일반 할당량 이름이 표시될 수 있습니다. GPU가 있는 컨피덴셜 VM 인스턴스의 경우 이 할당량 이름은 선점형 할당량을 나타냅니다.