이 페이지에서는 빠른 시작 노드를 사용해 Google Kubernetes Engine(GKE) 클러스터에서 워크로드를 더 빠르게 배포하고 확장하는 방법을 안내합니다. 워크로드가 호환되는 구성을 사용하는 경우 빠른 시작 노드는 Autopilot 모드의 GKE에서 최선의 방법으로 사용됩니다.
호환되는 머신 계열의 경우 빠른 시작 GKE 노드는 시작 시간이 크게 단축됩니다. 이러한 가속화된 시작 시간은 다음과 같은 이점을 제공합니다.
- 더 빠른 콜드 스타트
- 빠른 자동 확장
- 포드 예약의 롱테일 지연 시간 개선
- 인프라 비용 효율성 향상
빠른 시작 노드를 사용할 경우 GKE는 시작 시간을 단축하기 위해 하드웨어 리소스를 미리 초기화합니다. 이렇게 사전 초기화된 리소스는 최선의 방법으로 제공됩니다. 서지 요청은 일부만 처리될 수 있습니다. 빠른 시작 노드를 사용하지 않는 경우, 리소스는 주문형으로 초기화되며 노드는 일반적인 시작 시간으로 제공됩니다.
요구사항
빠른 시작 노드는 추가 구성이 필요하지 않습니다. 워크로드가 호환되는 구성을 사용하는 경우 GKE는 빠른 시작 노드를 자동으로 사용합니다. 빠른 시작 노드를 사용하려면 다음 요구사항을 모두 충족해야 합니다.
- Autopilot 클러스터를 사용하거나 Standard 클러스터에서 Autopilot 모드로 워크로드를 실행해야 합니다.
- 빠른 출시 채널을 사용해야 합니다.
다음과 같은 호환되는 컴퓨팅 리소스를 사용해야 하며, 호환 가능한 부팅 디스크 크기는 최대 500GiB입니다.
- NVIDIA L4 GPU(G2 머신 시리즈)
pd-balanced부팅 디스크 유형 사용빠른 시작 노드와 호환되지 않는 기능을 사용해서는 안 됩니다. 자세한 내용은 제한사항을 참조하세요.
제한사항
다음 기능들은 빠른 시작 GKE 노드와 호환되지 않습니다. 이 기능들을 사용할 경우 GKE는 일반적인 시작 시간으로 노드를 프로비저닝합니다.
- GKE 1.31 이전 버전의 G2 머신 시리즈
DEFAULTGPU 드라이버 버전을 사용하는 G2- GKE 1.33.2-gke.1015000 이전 버전의 보조 부팅 디스크
- 고객 관리 암호화 키(CMEK)
- 스팟 VM
- 로컬 SSD
- 배치 정책
- 다중 네트워크 지원
Autopilot GPU 워크로드
Autopilot 모드에서 호환되는 GPU를 요청하면, 동일한 요청을 GKE Standard 모드에서 수행하는 것보다 노드 시작 시간이 최대 4배, 포드 예약 시간이 최대 2배 빨라집니다. 이는 Autopilot GPU 워크로드가 빠른 시작 노드를 사용할 수 있기 때문입니다.
다음은 몇 가지 예시 사용 사례입니다. 하지만 요구사항 섹션의 조건을 충족하는 모든 포드는 빠른 시작 노드와 호환됩니다.
ComputeClass
다음 예시와 같이 ComputeClass에서 호환되는 가속기 유형과 개수를 요청합니다.
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
priorities:
- gpu:
type: ACCELERATOR_TYPE
count: ACCELERATOR_COUNT
nodePoolAutoCreation:
enabled: true
다음 예시와 같이 포드에서 이 ComputeClass를 선택하면 GKE는 빠른 시작 노드를 사용합니다.
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
# Select a ComputeClass that requests compatible GPUs
cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
containers:
- name: my-container
image: gcr.io/google_containers/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
다음 값을 바꿉니다.
ACCELERATOR_COMPUTE_CLASS_NAME: 가속기를 요청하는 ComputeClass의 이름입니다.ACCELERATOR_TYPE: 가속기 유형입니다.ACCELERATOR_COUNT: 포드에 필요한 가속기 수입니다. 이 값은 ComputeClass의spec.priorities.gpu.count필드 값보다 작거나 같아야 합니다.POD_NAME: 포드의 이름입니다.
ComputeClass에 관한 자세한 내용은 커스텀 컴퓨팅 클래스 정보를 참조하세요.
포드 사양
다음 예시와 같이 포드 사양에서 호환되는 가속기 유형과 개수를 선택합니다.
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
cloud.google.com/gke-accelerator: ACCELERATOR_NAME
containers:
- name: my-container
image: gcr.io/google_containers/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
다음 값을 바꿉니다.
POD_NAME: 포드의 이름입니다.ACCELERATOR_NAME: 포드에 필요한 가속기 이름입니다.ACCELERATOR_COUNT: 포드에 필요한 가속기 수입니다.
가격 책정
빠른 시작 노드는 GKE Autopilot에서 추가 비용 없이 제공됩니다. GKE Autopilot 가격 책정에 대한 자세한 내용은 Google Kubernetes Engine 가격 책정의 Autopilot 모드 섹션을 참조하세요.