일괄 생성된 VM의 인스턴스 유연성 정보

이 문서에서는 Compute Engine을 사용하여 VM을 일괄적으로 만들 때 인스턴스 유연성을 설명합니다.

리전에서 가상 머신 (VM)을 일괄적으로 만들 때 애플리케이션이 단일 머신 유형으로 제한되지 않는 경우 인스턴스 유연성을 구성하여 필요한 VM 수를 프로비저닝하는 성공률을 높일 수 있습니다. 인스턴스 유연성을 사용하면 워크로드에 적합한 머신 유형을 하나 이상 지정할 수 있습니다. 그런 다음 Compute Engine은 용량 및 할당량 가용성을 기반으로 이러한 머신 유형 중 하나를 사용하여 VM을 프로비저닝합니다.

인스턴스 유연성 사용

인스턴스 유연성을 구성하려면 리전 대량 삽입 요청에서 하나 이상의 인스턴스 선택을 정의하여 적합한 머신 유형을 나열합니다. 예를 들어 REST 요청에서 instanceFlexibilityPolicy 객체를 포함하며, 이 객체 내에서 하나 이상의 instanceSelections 객체를 정의합니다. 각 객체에는 머신 유형 목록이 포함됩니다.

Compute Engine은 요청을 수신하면 먼저 머신 유형과 영역 호환성을 검증하여 잘못된 항목을 제외합니다. 유효한 구성이 하나 이상 있으면 작업이 진행됩니다.

그런 다음 Compute Engine은 사용 가능한 하드웨어, 할당량, 예약을 기반으로 VM을 프로비저닝하려고 시도합니다. 인스턴스 선택의 순위를 구성하면 순위가 낮은 선택이 우선시됩니다. 각 순위 내에서 Compute Engine은 사용되지 않은 예약과 스팟 VM 안내를 고려하여 선점될 가능성이 낮은 머신 유형을 선택합니다.

목표 분산 형태가 정의된 경우 영역 선택

리전 bulkInsert 요청과 함께 인스턴스 유연성을 사용하는 경우 목표 분산 형태를 지정하여 리전의 영역에 VM이 분산되는 방식을 제어할 수 있습니다. Compute Engine은 다음과 같이 이 모양을 기반으로 VM 프로비저닝을 위한 영역을 선택합니다.

  • ANY_SINGLE_ZONE: Compute Engine은 선호도가 높은 머신 유형의 용량이 가장 많은 단일 영역을 선택합니다.
  • BALANCED: Compute Engine은 사용 가능한 리소스가 있는 영역에 VM을 최대한 균등하게 분산합니다. 각 영역 내에서 Compute Engine은 선호도가 높은 머신 유형을 우선시합니다.
  • ANY: Compute Engine이 사용 가능한 리소스가 있는 영역을 선택합니다. 순위가 구성된 경우 Compute Engine은 선호도가 높은 머신 유형으로 VM을 프로비저닝할 수 있는 영역에 우선순위를 부여합니다.

자세한 내용은 리전에서 VM 일괄 생성을 참고하세요.

최소 VM 프로비저닝 및 인스턴스 유연성

bulkInsert 요청에서 최소 필수 VM 수 (minCount) 값을 정의하면 API에서 최소한 그만큼의 VM을 만들려고 시도합니다. Compute Engine에서 필요한 최소 VM 수 (minCount)를 프로비저닝할 수 없으면 전체 작업이 실패하고 Compute Engine에서 VM을 만들지 않습니다. 인스턴스 유연성과 함께 minCount를 사용하면 Compute Engine은 다음과 같이 순위보다 획득 가능성을 기반으로 VM 프로비저닝에 우선순위를 부여합니다.

  • Compute Engine은 선호도가 낮은 머신을 사용하더라도 최대 count개의 VM을 프로비저닝하는 것을 우선시합니다. 예를 들어 요청에서 필수 VM(minCount=1)을 최소 1개, VM을 최대 10개 (count=10)로 지정하고 Compute Engine에 선호도가 높은 VM 1개 또는 선호도가 낮은 VM 6개를 프로비저닝할 수 있는 용량이 있는 경우 Compute Engine은 선호도가 낮은 VM 6개를 프로비저닝합니다.
  • Compute Engine이 서로 다른 인스턴스 선택을 사용하여 최대 count개의 동일한 VM을 프로비저닝할 수 있는 경우 선호도가 높은 선택이 우선시됩니다. 예를 들어 요청에서 필수 VM (minCount=1)을 최소 1개, VM(count=10)을 최대 10개 지정하고 Compute Engine에서 우선순위가 높은 인스턴스 선택 또는 우선순위가 낮은 인스턴스 선택을 사용하여 VM 6개를 프로비저닝할 수 있는 경우 Compute Engine은 우선순위가 높은 선택에서 VM 6개를 프로비저닝합니다.

자세한 내용은 bulkInsertminCount 속성을 참고하세요.

일괄 삽입 유효성 검사 및 오류 시나리오

Compute Engine은 머신 유형과 영역 호환성을 초기 검사하여 고려 대상에서 잘못된 항목을 제외합니다. 이 초기 검사 후 유효한 구성이 하나 이상 남아 있으면 Compute Engine에서 VM 생성을 진행합니다.

하지만 인스턴스 유연성 정책과 사용 가능한 용량을 기반으로 프로비저닝에 사용할 영역과 머신 유형을 Compute Engine에서 선택한 후에만 구성의 일부 유효성 검사가 발생할 수 있습니다. 이 후반 검증 단계에서 프로비저닝을 위해 선택한 특정 머신 유형과 영역 조합이 잘못된 것으로 확인되면 전체 대량 삽입 요청이 검증 오류와 함께 실패합니다. 이 오류는 instanceFlexibilityPolicy 내의 다른 구성이 처음에는 유효한 경우에도 발생할 수 있습니다.

제한사항

대량 VM 생성에 인스턴스 유연성을 사용하는 경우 다음 제한사항이 적용됩니다.

  • 인스턴스 유연성은 리전 bulkInsert 요청에만 지정할 수 있으며 영역 요청에는 사용할 수 없습니다.
  • 인스턴스 유연성은 미래용 예약, 유연한 시작 프로비저닝 모델, A3 Ultra, A4 및 이후 GPU를 비롯한 AI 하이퍼컴퓨터 기능을 지원하지 않습니다.
  • 인스턴스 유연성을 갖는 커스텀 머신 유형은 지정할 수 없습니다.
  • 최대 10개의 서로 다른 인스턴스 선택에서 최대 10개의 서로 다른 머신 유형을 지정할 수 있습니다.

다음 단계