Compute Engine 인스턴스 프로비저닝 모델

이 문서에서는 Compute Engine 인스턴스의 프로비저닝 모델을 설명합니다. 배포 옵션에 대해 자세히 알아보려면 워크로드에 맞는 Compute Engine 배포 전략 선택을 참고하세요.

프로비저닝 모델은 인스턴스의 가용성, 수명, 가격을 결정합니다. 이러한 모델을 이해하면 워크로드에 가장 적합한 옵션을 선택할 수 있습니다.

사용 가능한 프로비저닝 모델

컴퓨팅 인스턴스를 만들 때 다음 프로비저닝 모델 중 하나를 지정할 수 있습니다. 프로비저닝 모델을 지정하지 않으면 Compute Engine에서 기본적으로 표준 프로비저닝 모델을 사용합니다.

  • 표준

  • 스팟

  • 유연한 시작

  • 예약에 따름

다음 표를 통해 각 프로비저닝 모델의 사용 사례와 가격을 비교할 수 있습니다.

표준 스팟 유연한 시작 예약에 따름
요약
  • 리소스 가용성에 따라 인스턴스를 즉시 만들 수 있습니다.
  • 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.
  • 리소스 가용성에 따라 인스턴스를 즉시 만들 수 있습니다.
  • 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다. 하지만 Compute Engine이 언제든지 인스턴스를 중지하거나 삭제하여 용량을 확보하도록 허용할 수도 있습니다.
  • 영역 관리형 인스턴스 그룹(MIG)을 만든 후 MIG에 GPU가 연결되어 있는 인스턴스를 추가하도록 Compute Engine에 요청합니다. Compute Engine은 리소스 가용성을 기반으로 인스턴스 프로비저닝을 예약합니다.
  • 인스턴스를 삭제할 시점을 제어할 수 있습니다. 하지만 중지하거나, 정지하거나, 다시 만들 수는 없습니다. 인스턴스는 최대 7일 동안 실행됩니다. 그런 다음 Compute Engine에서 삭제합니다.
  • GPU가 연결된 인스턴스를 만들기 위해 미래 날짜에 용량을 예약하도록 요청할 수 있습니다. Google Cloud 에서 요청을 승인하면 Compute Engine에서 예약을 만듭니다. 예약 기간이 시작되면 예약과 일치하는 GPU 인스턴스를 만들어 예약을 사용할 수 있습니다.
  • 승인된 예약 기간 동안 필요에 따라 인스턴스를 중지, 다시 시작, 삭제하거나 다시 만들어 예약을 사용할 수 있습니다. 예약 기간이 끝나면 Compute Engine은 예약을 삭제하고 예약을 사용하는 인스턴스를 중지하거나 삭제합니다.
사용 사례

다음과 같이 안정성과 지속적인 작동이 필요한 워크로드에 적합합니다.

  • 웹 서버
  • 데이터베이스
  • 엔터프라이즈 애플리케이션
  • 개발 및 테스트

다음과 같이 중단을 허용할 수 있는 워크로드에 적합합니다.

  • 일괄 처리
  • 고성능 컴퓨팅(HPC)
  • 지속적 통합 및 지속적 배포(CI/CD)
  • 데이터 분석
  • 미디어 인코딩
  • 온라인 추론

다음과 같이 안정성이 필요하고 7일 이내로 실행해야 하는 워크로드에 적합합니다.

  • 소규모 모델 사전 학습
  • 모델 미세 조정
  • HPC 시뮬레이션
  • 일괄 추론

다음과 같이 안정성과 특정 실행 시간이 필요한 워크로드에 적합합니다.

  • 최대 90일 동안 지속되는 워크로드:

    • 모델 사전 학습 작업
    • 모델 미세 조정 작업
    • HPC 시뮬레이션 워크로드
    • 추론 워크로드의 단기적인 증가 예상
  • 90일 넘게 지속되는 워크로드:

    • 학습 워크로드
    • 추론 워크로드
가격 책정
  • 인스턴스에는 표준 가격이 적용됩니다. VM 인스턴스 가격 책정을 참조하세요.
  • 인스턴스를 만드는 방법에 따라 요금이 부과됩니다.

    • 인스턴스를 즉시 만드는 경우 사용한 만큼만 지불(PAYG)합니다.
    • 온디맨드 예약 또는 미래용 예약을 위해 자동 생성된 예약을 사용하여 인스턴스를 만드는 경우 예약이 존재하는 한 요금이 청구됩니다. 자세한 내용은 예약 결제를 참조하세요.
  • 대부분의 vCPU, 메모리, GPU에 대해 60~91% 할인이 적용됩니다. 또한 A4 또는 A3 머신 유형 및 GPU, 로컬 SSD 디스크, 외부 IP 주소, Tier_1 네트워킹 비용에 대해서는 할인폭이 더 적습니다. 자세한 내용은 스팟 VM 가격 책정을 참조하세요.
  • 사용한 만큼만 지불(PAYG)합니다.
  • 인스턴스에서 사용하는 머신 시리즈에 따라 다음과 같은 할인이 적용됩니다.

    • A4, A3, A2 머신 시리즈의 경우 vCPU, 메모리, GPU에 53% 할인이 적용됩니다.
    • H4D 머신 시리즈의 경우 vCPU 및 메모리에 대해 25% 할인이 적용됩니다.
    지원되는 다른 머신 시리즈는 할인 대상이 아닙니다. 자세한 내용은 동적 워크로드 스케줄러(DWS) 가격 책정을 참조하세요.
  • 사용한 만큼만 지불(PAYG)합니다.
  • 인스턴스를 만들 때 용량을 예약하는 방식에 따라 다음과 같이 요금이 청구됩니다.

  • 예약 기간에 대해 요금이 청구됩니다. 자세한 내용은 예약 결제를 참조하세요.
Quota 인스턴스를 만들면 표준 할당량이 사용됩니다. 인스턴스를 만들면 선점형 할당량이 사용됩니다. 프로젝트에 선점형 할당량이 없으면 표준 할당량이 사용됩니다. 스팟 VM에는 Google Cloud 무료 등급 크레딧이 적용되지 않습니다. MIG가 그룹에 인스턴스를 추가하면 선점형 할당량이 사용됩니다. 프로젝트에 선점형 할당량이 없으면 표준 할당량이 사용됩니다. '예약 기반' 프로비저닝 모델에는 할당량이 적용되지 않습니다.

인스턴스 가용성 및 수명

다음 표에는 각 프로비저닝 모델의 컴퓨팅 인스턴스 가용성 및 수명이 나와 있습니다.

표준 스팟 유연한 시작 예약에 따름
생성 기본 요건 생성 기본 요건이 없습니다. 생성 기본 요건이 없습니다. 생성 기본 요건이 없습니다.

인스턴스를 만들려면 다음 방법 중 하나를 사용하여 먼저 용량을 예약해야 합니다.

선택한 제공 날짜 및 시간에 Compute Engine에서 요청된 용량을 프로비저닝합니다. 그런 다음 인스턴스를 만들어 용량을 사용할 수 있습니다.

지원되는 머신 시리즈 A4X, A4 및 A3 Ultra를 제외한 모든 머신 시리즈를 사용할 수 있습니다. A4X, G4, X4 및 베어 메탈 인스턴스를 제외한 모든 머신 시리즈를 사용할 수 있습니다.

다음 머신 시리즈만 사용할 수 있습니다.

VM을 만들기 위해 용량을 예약하는 방식에 따라 다음 머신 시리즈만 사용할 수 있습니다.

인스턴스 가용성 요청한 리소스를 사용할 수 있는 한 언제든지 인스턴스를 만들 수 있습니다. 요청한 리소스를 사용할 수 있는 한 언제든지 인스턴스를 만들 수 있습니다.

다음과 같이 인스턴스를 만들 수 있습니다.

Compute Engine은 DWS를 사용하여 리소스 가용성을 기반으로 요청된 용량의 프로비저닝을 예약합니다. DWS는 GPU와 같이 수요가 많은 리소스를 확보하는 데 도움이 됩니다.

미래 날짜의 용량을 예약한 후에만 인스턴스를 만들 수 있습니다. Compute Engine은 요청된 날짜에 요청된 용량을 제공하며, 이 용량을 사용하여 인스턴스를 만들 수 있습니다. 캘린더 모드에서 미래용 예약을 사용하여 리소스를 예약하면 Compute Engine에서 DWS를 사용하여 요청된 용량을 프로비저닝합니다. DWS는 GPU와 같이 수요가 많은 리소스를 확보하는 데 도움이 됩니다.
용량 보장 생성 방법에 따라 용량 보장은 다음과 같이 인스턴스를 만드는 데 사용하는 방법에 따라 달라집니다.
  • 인스턴스를 즉시 만들면 Compute Engine에서 요청된 용량을 프로비저닝하기 위해 최선을 다합니다.
  • 온디맨드 예약 또는 미래용 예약을 위해 자동 생성된 예약을 사용하여 인스턴스를 만드는 경우 예약에 사용 가능한 예약 용량이 있으면 Compute Engine이 요청된 용량을 프로비저닝할 가능성이 매우 높습니다.
최선의 노력을 제공합니다. 스팟 VM을 만들면 Compute Engine에서 요청된 용량을 프로비저닝하기 위해 최선을 다합니다. 최선의 노력을 제공합니다. MIG 크기 조절 요청을 만들면 Compute Engine에서 요청된 용량의 프로비저닝을 예약하기 위해 최선을 다합니다. 매우 높음. Google Cloud 에서 예약 요청을 승인하면 Compute Engine이 선택한 제공 날짜와 시간에 예약된 용량을 프로비저닝할 가능성이 매우 높습니다. 예약 기간 동안 예약된 용량에 독점적으로 액세스할 수 있습니다.
인스턴스 수명 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다. 하지만 인스턴스에서 사용하는 머신 유형이 라이브 마이그레이션을 지원하지 않으면 Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.

다음 경우를 제외하고 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.

  • Compute Engine에서 용량을 확보하기 위해 인스턴스를 중지하거나 삭제합니다. 이 프로세스를 선점이라고 합니다.
  • 인스턴스에서 사용하는 머신 유형이 라이브 마이그레이션을 지원하지 않으면 Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.

인스턴스가 실행 기간이 끝나기 전에 다음 작업을 할 수 있습니다.

  • 인스턴스 중지: 독립형 인스턴스로 생성된 경우에만 언제든지 인스턴스를 중지할 수 있습니다.
  • 인스턴스 삭제: 언제든지 인스턴스를 삭제할 수 있습니다.

인스턴스가 실행 기간이 끝나면 Compute Engine에서 인스턴스를 삭제합니다.

다음 경우를 제외하고 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.

  • Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.
  • 요청된 용량을 프로비저닝하기 위해 자동으로 생성된 예약의 약정된 종료일이 도래했습니다. 이때 Compute Engine은 예약을 삭제하고 구성에 지정된 종료 작업에 따라 예약을 사용하는 모든 인스턴스를 중지하거나 삭제합니다.

다음 단계