압축 배치 정책 및 워크로드 정책 개요

이 문서에서는 압축 배치 정책과 워크로드 정책을 간략하게 설명하고 비교합니다. 두 정책 모두 네트워크 지연 시간을 최소화하도록 Compute Engine 인스턴스의 배치를 구성할 수 있습니다.

기본적으로 컴퓨팅 인스턴스의 위치는 영역을 지정하는 방식으로만 관리할 수 있습니다. 미래용 예약 또는 관리형 인스턴스 그룹 (MIG) 크기 조절 요청을 사용하여 A4X, A4, A3 Ultra, A3 Mega, A3 High (GPU 8개) 머신을 확보하면 수신되는 컴퓨팅 인스턴스가 밀집 공동 배치됩니다. 하지만 인스턴스 간 성능을 최적화하기 위해 특정 컴퓨팅 인스턴스를 더 가깝게 배치해야 할 수도 있습니다. 컴퓨팅 인스턴스를 더 가까이 배치하려면 컴퓨팅 인스턴스에 압축 배치 정책을 적용하거나 MIG에 워크로드 정책을 적용하면 됩니다.

컴퓨팅 인스턴스를 위한 압축 배치 정책

독립형 컴퓨팅 인스턴스 또는 일괄 생성된 컴퓨팅 인스턴스에 압축 배치 정책을 적용하면 Compute Engine은 컴퓨팅 인스턴스를 최대한 서로 가까운 위치에 만들기 위해 최선을 다합니다. 애플리케이션에 최소한의 네트워크 지연 시간이 필요한 경우 압축 배치 정책을 만들 때 maxDistance 필드 (프리뷰)를 지정합니다.

자세한 내용은 Compute Engine 문서의 압축 배치 정책 정보를 참고하세요.

MIG를 위한 워크로드 정책

워크로드 정책을 MIG에 적용하면 MIG의 컴퓨팅 인스턴스에 대한 배치 및 기본 인프라를 지정할 수 있습니다. A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (GPU 8개)와 함께 워크로드 정책을 사용하면 컴퓨팅 인스턴스 간 네트워크 지연 시간을 최소화하고 성능을 최적화할 수 있습니다.

MIG의 컴퓨팅 인스턴스에서 사용하는 머신 유형에 따라 다음 상황에서는 워크로드 정책이 필수이거나 선택사항입니다.

  • A4X Max 또는 A4X 인스턴스의 하위 블록을 배포하려면 워크로드 정책이 필요합니다.

  • A4, A3 Ultra, A3 Mega 또는 A3 High (GPU 8개) 인스턴스를 사용하는 경우 워크로드 정책은 선택사항입니다.

자세한 내용은 Compute Engine 문서의 MIG의 워크로드 정책 정보를 참고하세요.

압축 배치 정책과 워크로드 정책 비교

다음 표에는 컴팩트 배치 정책과 워크로드 정책의 차이점이 요약되어 있습니다.

압축 배치 정책 워크로드 정책
정책 사용량
  • 독립형 인스턴스
  • 일괄 API를 사용하여 배포된 인스턴스
관리형 인스턴스 그룹(MIG)
지원되는 머신 유형 A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2, G2
  • Flex-start: A4 및 A3 Ultra
  • 스팟 또는 예약: A4X, A4, A3 Ultra, A3 Mega, A3 High (GPU 8개)
그룹화 시맨틱스

Compute Engine은 동일한 압축 배치 정책을 사용하는 인스턴스를 서로 더 가깝게 배치합니다.

워크로드마다 다른 배치 정책을 사용하는 것이 좋습니다. 서로 다른 워크로드를 실행하는 인스턴스에서 배치 정책을 재사용하면 이러한 모든 인스턴스가 함께 배치됩니다. 이러한 공동 배치로 인해 특정 워크로드를 확장할 때 서로 가까운 인스턴스를 만들기가 어려울 수 있습니다.

Compute Engine은 워크로드 정책을 사용하는 MIG의 인스턴스를 더 가까운 위치에 배치합니다.

서로 다른 워크로드를 실행하는 여러 MIG에서 워크로드 정책을 재사용하면 인스턴스가 개별 MIG에 함께 배치됩니다. 재사용은 각 인스턴스 그룹이 서로 격리되어야 하는 대규모 학습 모델에 적합합니다.

컴퓨팅 인스턴스 공동 배치 구성

최적의 컴퓨팅 인스턴스 공동 배치를 위해 groupPlacementPolicy.collocation 필드를 COLLOCATED로 설정합니다.

최적의 컴퓨팅 인스턴스 공동 배치를 위해 workloadPolicy.type 필드를 HIGH_THROUGHPUT로 설정합니다.

추가 구성
  • 컴퓨팅 인스턴스를 엄격하게 배치하려면 maxDistance 필드를 지정합니다.
  • 파티셔닝을 지원하는 GPU 제품군(예: A4X)의 경우 gpuTopology 필드를 지정합니다.
  • 컴퓨팅 인스턴스를 엄격하게 배치하려면 maxTopologyDistance 필드를 지정합니다.
  • 파티셔닝을 지원하는 GPU 제품군(예: A4X)의 경우 acceleratorTopology 필드를 지정합니다.

최대 거리 값 비교

최대 거리 값이 낮으면 컴퓨팅 인스턴스가 더 가까운 위치에 배치되지만 일부 컴퓨팅 인스턴스가 생성되지 않을 확률도 높아집니다.

다음 표에서는 각 최대 거리 값에 지원되는 머신 시리즈와 컴퓨팅 인스턴스 수를 보여줍니다.

압축 배치 정책의 maxDistance 워크로드 정책의 maxTopologyDistance 설명 지원되는 머신 시리즈 최대 컴퓨팅 인스턴스 수
미지정(권장하지 않음) 미지정(권장하지 않음) Compute Engine은 컴퓨팅 인스턴스를 최대한 서로 가까운 위치에 배치하기 위해 최선을 다하지만 컴퓨팅 인스턴스 간 최대 거리는 없습니다. A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (GPU 8개) 1500
3 CLUSTER Compute Engine은 인접한 블록에 컴퓨팅 인스턴스를 만듭니다. A4 1,500
2 BLOCK Compute Engine이 동일한 블록에 컴퓨팅 인스턴스를 만듭니다. A4 및 A3 Ultra
  • A4 인스턴스: 150
  • A3 Ultra, A3 Mega, A3 High (GPU 8개) 인스턴스: 256
1 SUBBLOCK Compute Engine은 동일한 하위 블록에 컴퓨팅 인스턴스를 만듭니다. A4 및 A3 Ultra 22

다음 단계