MIG의 워크로드 정책 정보

이 문서에서는 관리형 인스턴스 그룹 (MIG)과 함께 워크로드 정책을 사용할 때 적용되는 요구사항과 제한사항을 설명합니다. 기본적으로 Compute Engine 인스턴스의 위치는 영역을 지정하는 방식으로만 관리할 수 있습니다. 워크로드 정책을 사용하면 영역 내에서 컴퓨팅 인스턴스의 물리적 배치와 토폴로지를 정의할 수 있습니다. 이 방법을 사용하면 컴퓨팅 인스턴스를 서로 더 가깝게 배치하여 컴퓨팅 인스턴스 간 네트워크 지연 시간을 최소화할 수 있습니다.

워크로드 정책은 A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (GPU 8개) 또는 H4D 인스턴스를 사용하는 MIG에만 적용할 수 있습니다. A4X Max 또는 A4X 인스턴스를 사용하는 경우 테스트 목적으로 단일 컴퓨팅 인스턴스를 만드는 경우가 아니면 워크로드 정책이 필요합니다. 지원되는 다른 머신 시리즈의 경우 워크로드 정책은 선택사항입니다.

다른 머신 시리즈를 사용하는 컴퓨팅 인스턴스의 배치를 제어하려면 배치 정책을 사용하세요.

워크로드 정책 이해

다음 섹션에서는 워크로드 정책 사용 사례와 워크로드 정책을 만들 때 지정하는 속성을 설명합니다.

컴퓨팅 인스턴스 배치 및 토폴로지 관리

워크로드 정책을 만들어 MIG에 적용하면 워크로드 정책을 통해 다음을 달성할 수 있습니다.

  • 서로 가까운 컴퓨팅 인스턴스 만들기: 용량이 있는 경우 Compute Engine은 서로 가까운 컴퓨팅 인스턴스를 만듭니다. 그렇지 않으면 Compute Engine에서 요청한 컴퓨팅 인스턴스의 일부 또는 전부를 생성하지 않습니다.

  • 컴퓨팅 인스턴스 토폴로지 파악: 처리량이 높은 (HIGH_THROUGHPUT) 유형의 워크로드 정책을 MIG에 적용하고 MIG가 컴퓨팅 인스턴스를 만든 후에는 컴퓨팅 인스턴스의 서로 간 위치를 볼 수 있습니다. 이 정보는 네트워크 지연 시간을 최소화하고 오류를 해결하는 데 도움이 됩니다. 자세한 내용은 Compute Engine 인스턴스 토폴로지 보기를 참고하세요.

여러 MIG에 동일한 워크로드 정책을 적용할 수 있습니다. 이렇게 하면 Compute Engine이 각 MIG에 배치 규칙을 독립적으로 적용합니다.

다음 섹션에서는 워크로드 정책을 만들 때 지정해야 하는 속성을 설명합니다.

워크로드 정책 속성 구성

워크로드 정책을 만들 때는 다음 속성을 지정해야 합니다.

  • 워크로드 유형 (type): 이 필드는 클러스터의 개략적인 목표를 정의합니다. HIGH_THROUGHPUT만 지정할 수 있습니다. 이는 Compute Engine에 통신 속도를 높이기 위해 컴퓨팅 인스턴스를 최대한 가까이 배치하도록 지시합니다.

  • MIG의 컴퓨팅 인스턴스에서 사용하는 머신 시리즈에 따라 다음 속성 중 하나를 선택적으로 지정할 수 있습니다.

    • 가속기 토폴로지 (acceleratorTopology): 이 속성은 특수 가속기 간 네트워크 구성을 사용하는 여러 A4X Max 또는 A4X 인스턴스에서 실행되는 분산 워크로드의 고성능을 달성하는 데 도움이 됩니다. 자세한 내용은 액셀러레이터 토폴로지 속성을 참고하세요.

    • 최대 토폴로지 거리 (maxTopologyDistance): 이 속성은 동일한 블록 또는 하위 블록과 같은 A4, A3 Ultra, A3 Mega, A3 High (8 GPU) 또는 H4D 인스턴스를 생성하기 위한 가장 엄격한 물리적 경계를 정의합니다. 리소스 가용성 오류로 인해 Compute Engine에서 이 엄격한 한도를 충족할 수 없는 경우 요청된 컴퓨팅 인스턴스의 일부 또는 전부가 생성되지 않습니다. 자세한 내용은 최대 토폴로지 거리 속성을 참고하세요.

가속기 토폴로지 속성

대규모 비차단 네트워크 성능을 달성하기 위해 Compute Engine은 A4X Max 및 A4X 인스턴스를 블록하위 블록의 물리적 계층 구조로 구성합니다.

A4X Max 또는 A4X 인스턴스로 MIG를 만들려면 가속기 토폴로지 (acceleratorTopology) 속성을 지정하는 워크로드 정책을 MIG에 적용해야 합니다. 이 속성은 컴퓨팅 인스턴스의 슬라이스의 실제 네트워크 구성을 정의합니다. 슬라이스는 분산 AI 또는 ML 워크로드에 최대 처리량을 제공하는 단일 대규모 가속기 역할을 합니다.

다음 표에서는 워크로드 정책에 지원되는 액셀러레이터 토폴로지 값과 지원되는 머신 시리즈를 보여줍니다.

가속기 토폴로지 값 설명 지원되는 머신 시리즈 최대 컴퓨팅 인스턴스 수
1x72 Compute Engine은 컴퓨팅 인스턴스를 18개의 컴퓨팅 인스턴스로 구성된 밀도 높은 할당 하위 블록으로 구성하며, 총 72개의 GPU가 있습니다. 각 하위 블록에는 자체 MIG가 필요하므로 MIG당 최대 18개의 컴퓨팅 인스턴스를 만들 수 있습니다. 전체 블록은 25개의 MIG로 구성되며 총 450개의 컴퓨팅 인스턴스가 있습니다. A4X Max 및 A4X 18

A4X Max 및 A4X 인스턴스에 대한 자세한 내용은 A4X Max 및 A4X 머신 시리즈를 참고하세요.

최대 토폴로지 거리 속성

MIG에 워크로드 정책을 만들어 적용하면 Compute Engine은 컴퓨팅 인스턴스를 서로 가까운 위치에 만들기 위해 최선을 다합니다. 영역에서 최대 압축이 필요한 경우 최대 토폴로지 거리 (maxTopologyDistance) 속성을 지정하는 것이 좋습니다. 최대 토폴로지 거리 값은 동일한 클러스터, 블록 또는 하위 블록에 A4, A3 Ultra, A3 Mega, A3 High (GPU 8개) 또는 H4D 인스턴스를 만들도록 지정합니다.

다음 표에서는 최대 토폴로지 거리 값과 지원되는 머신 시리즈를 보여줍니다.

최대 토폴로지 거리 값 설명 지원되는 머신 시리즈 최대 컴퓨팅 인스턴스 수
미지정(권장하지 않음) Compute Engine은 컴퓨팅 인스턴스를 최대한 서로 가까운 위치에 배치하기 위해 최선을 다하지만 영역 내 컴퓨팅 인스턴스 간 최대 거리는 보장하지 않습니다. A4, A3 Ultra, A3 Mega, A3 High (GPU 8개), H4D 1,500
CLUSTER Compute Engine은 클러스터 내의 인접한 블록에 컴퓨팅 인스턴스를 만듭니다. A4 및 H4D 1,500
BLOCK Compute Engine은 동일한 블록에 컴퓨팅 인스턴스를 만듭니다. A4, A3 Ultra, A3 Mega, A3 High (GPU 8개) 또는 H4D
  • A4 또는 H4D의 경우: 150
  • A3 Ultra, A3 Mega 또는 A3 High (GPU 8개): 256
SUBBLOCK Compute Engine은 동일한 하위 블록에 컴퓨팅 인스턴스를 만들어 네트워크 지연 시간을 최대한 최소화합니다. A4, A3 Ultra, H4D 22

가격 책정

워크로드 정책을 생성, 삭제, MIG에 적용하는 데 추가 비용이 발생하지 않습니다.

제한사항

MIG의 워크로드 정책에는 다음 제한사항이 적용됩니다.

  • MIG에 컴퓨팅 인스턴스가 없는 경우에만 기존 MIG에 워크로드 정책을 적용하거나 워크로드 정책을 변경할 수 있습니다.

  • 다음 머신 유형과 프로비저닝 모델의 조합을 사용하는 컴퓨팅 인스턴스가 있는 MIG에만 워크로드 정책을 적용할 수 있습니다.

    머신 계열 프로비저닝 모델
    A4, A3 Ultra, H4D 유연한 시작
    A4, A3 Ultra, A3 Mega, A3 High (GPU 8개), H4D 스팟
    A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (GPU 8개), H4D 예약에 따름
  • MIG가 다음 분산 대상 형태를 사용하는 경우에만 리전 MIG에 워크로드 정책을 적용할 수 있습니다.

    • 대상 크기가 있는 MIG의 경우: ANY 또는 ANY_SINGLE_ZONE

    • MIG 크기 조절 요청: ANY_SINGLE_ZONE

  • 워크로드 정책을 만든 후에는 업데이트할 수 없습니다.

  • MIG에서 워크로드 정책을 사용하는 경우 두 번째 인스턴스 템플릿을 구성할 수 없습니다.

  • 워크로드 정책은 배치 정책과 함께 사용할 수 없습니다.

다음 단계