이 페이지에서는 Google 가상 NIC(gVNIC)를 사용하여 Google Kubernetes Engine(GKE) 클러스터에서 GPU 노드의 네트워크 대역폭을 늘리는 방법을 보여줍니다.
Autopilot 클러스터에서 GKE 버전 1.30.2-gke.1023000 이상을 실행하는 노드에는 Google Virtual NIC(gVNIC)가 자동으로 설치됩니다. 이 페이지의 안내는 Standard 클러스터에만 적용됩니다.
CPU 노드의 대역폭을 늘리려면 Tier-1 대역폭을 사용 설정하는 것을 고려하세요.
시작하기 전에
시작하기 전에 다음 태스크를 수행했는지 확인합니다.
- Google Kubernetes Engine API를 사용 설정합니다. Google Kubernetes Engine API 사용 설정
- 이 태스크에 Google Cloud CLI를 사용하려면 gcloud CLI를 설치한 후 초기화합니다. 이전에 gcloud CLI를 설치한 경우
gcloud components update
명령어를 실행하여 최신 버전을 가져옵니다. 이전 gcloud CLI 버전에서는 이 문서의 명령어를 실행하지 못할 수 있습니다.
제한사항
- Compute Engine 제한사항이 적용됩니다.
요구사항
- GKE 노드는 Container-Optimized OS 노드 이미지를 사용해야 합니다.
gVNIC 사용 설정
gVNIC를 사용하는 노드 풀이 있는 클러스터를 만들거나 gVNIC가 사용 설정된 노드 풀을 만들거나 gVNIC를 사용하도록 노드 풀을 업데이트할 수 있습니다.
클러스터 만들기
gVNIC를 사용하는 노드 풀을 사용하여 클러스터를 만듭니다.
gcloud container clusters create CLUSTER_NAME \
--accelerator type=GPU_TYPE,count=AMOUNT \
--machine-type=MACHINE_TYPE \
--enable-gvnic
다음을 바꿉니다.
CLUSTER_NAME
: 새 클러스터의 이름입니다.GPU_TYPE
: 사용하는 GPU 가속기의 유형입니다. 예를 들면nvidia-tesla-t4
입니다.AMOUNT
: 노드 풀의 노드에 연결할 GPU 수입니다.MACHINE_TYPE
: 사용할 머신 유형. gVNIC는 메모리 최적화 머신 유형에서 지원되지 않습니다.
노드 풀 만들기
gVNIC를 사용하는 노드 풀을 만듭니다.
gcloud container node-pools create NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
다음을 바꿉니다.
NODEPOOL_NAME
: 새 노드 풀의 이름입니다.CLUSTER_NAME
: 기존 클러스터의 이름입니다.
노드 풀 업데이트
gVNIC를 사용하도록 노드 풀을 업데이트합니다.
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
다음을 바꿉니다.
NODEPOOL_NAME
: 업데이트하려는 노드 풀의 이름입니다.CLUSTER_NAME
: 기존 클러스터의 이름입니다.
이 변경사항을 적용하려면 노드를 다시 만들어야 하므로 실행 중인 워크로드가 중단될 수 있습니다. 이 특정 변경사항에 관한 자세한 내용은 유지보수 정책을 준수하지 않고 노드 업그레이드 전략을 사용하여 노드를 다시 만드는 수동 변경사항 표에서 해당 행을 찾으세요. 노드 업데이트에 대한 자세한 내용은 노드 업데이트 중단 계획을 참조하세요.
gVNIC 중지
--no-enable-gvnic
플래그를 사용하여 노드 풀을 업데이트합니다.
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--no-enable-gvnic
이 변경사항을 적용하려면 노드를 다시 만들어야 하므로 실행 중인 워크로드가 중단될 수 있습니다. 이 특정 변경사항에 관한 자세한 내용은 유지보수 정책을 준수하지 않고 노드 업그레이드 전략을 사용하여 노드를 다시 만드는 수동 변경사항 표에서 해당 행을 찾으세요. 노드 업데이트에 대한 자세한 내용은 노드 업데이트 중단 계획을 참조하세요.
문제 해결
gVNIC 문제를 해결하려면 Google Virtual NIC 문제 해결을 참조하세요.
다음 단계
- 네트워크 정책 로깅을 사용하여 클러스터의 네트워크 정책에 따라 pod 연결이 허용되거나 거부되는 시점을 기록합니다.