과소 프로비저닝 및 초과 프로비저닝된 워크로드 식별

이 문서에서는 통계 및 추천을 사용하여 Google Kubernetes Engine (GKE) 클러스터에서 실행되는 과소 프로비저닝 및 초과 프로비저닝 워크로드를 식별하는 방법을 설명합니다. 식별된 워크로드가 확장 또는 축소 권장사항의 이점을 누릴 수 있는지 확인한 후 권장되는 변경사항을 적용하여 비용을 절감하거나 워크로드의 안정성을 높일 수 있습니다. 가능한 경우 예상 월간 절감액 또는 비용이 추천에 포함됩니다. 자세한 내용은 비용 또는 절감액 추정치 이해하기를 참고하세요.

GKE는 Autopilot 및 Standard 클러스터에서 실행되는 워크로드에 관한 이러한 인사이트를 제공합니다. GKE는 전체 클러스터에 대해서도 유사한 추천을 제공합니다. 자세한 내용은 과소 프로비저닝 및 초과 프로비저닝된 GKE 클러스터 식별을 참고하세요.

GKE는 클러스터를 모니터링하고 Google Cloud에서 리소스 사용에 대한 통계와 추천을 생성하는 추천자를 제공하는 서비스인 Active Assist를 통해 사용량을 최적화하는 방법에 대한 안내를 제공합니다. 통계 및 추천을 관리하는 방법에 대한 자세한 내용은 통계 및 추천으로 GKE 사용 최적화를 참조하세요.

과소 프로비저닝된 워크로드 및 초과 프로비저닝된 워크로드에 대한 통계 및 추천 받기

GKE는 다음 섹션에 설명된 특정 동작을 관찰한 후 Google Cloud 콘솔의 다음 위치에 이러한 통계와 권장사항을 표시합니다.

워크로드 페이지의 추천 제목은 다음과 같습니다.

  • 초과 프로비저닝된 워크로드: '리소스 요청을 줄여 비용 절감'
  • 과소 프로비저닝 워크로드: '리소스 요청을 늘려 안정성 향상'

Google Cloud CLI 또는 Recommender API를 통해 모든 유형의 통계와 추천을 받을 수도 있습니다. 이러한 유형을 구체적으로 찾으려면 통계 및 추천 보기 안내를 따르고 WORKLOAD_UNDERPROVISIONEDWORKLOAD_OVERPROVISIONED 하위 유형을 사용하여 필터링하세요.

과소 프로비저닝 또는 초과 프로비저닝된 워크로드를 식별한 후에는 워크로드 크기 조정 시 고려사항을 참고하세요.

GKE에서 과소 프로비저닝된 워크로드 및 초과 프로비저닝된 워크로드를 식별하는 방법

다음 표에서는 GKE가 축소 또는 확장할 수 있는 과소 프로비저닝 및 초과 프로비저닝 워크로드를 식별하는 데 사용하는 신호와 각 신호의 기준점을 설명합니다. 또한 이 표에는 이 시나리오에서 취해야 하는 권장 조치가 표시되어 있습니다.

하위 유형 신호 관찰 기간 세부정보 권장사항
WORKLOAD_UNDERPROVISIONED CPU 또는 메모리 사용량이 높음 지난 15일 지난 15일 동안 CPU 또는 메모리 사용률이 10% 이상의 시간 동안 150% 를 초과하면 워크로드가 과소 프로비저닝된 것입니다. 워크로드를 확장하여 안정성 향상
WORKLOAD_OVERPROVISIONED CPU 또는 메모리 사용량이 낮음 지난 15일 지난 15일 동안 90% 이상의 시간 동안 CPU 또는 메모리 사용률이 50% 미만이면 워크로드가 초과 프로비저닝된 것입니다. 워크로드를 축소하여 비용 절감

GKE는 다음 가이드라인을 사용하여 통계 및 추천을 제공할 시기를 결정합니다.

  • 이 측정항목을 사용하면 간섭이 발생할 수 있으므로 GKE는 수평형 포드 자동 확장 처리 (HPA)의 타겟 측정항목에 대한 추천을 생성하지 않습니다.
  • 수직형 포드 자동 확장 (VPA)이 사용 설정된 경우 요청 값이 자동으로 관리되므로 GKE에서 추천을 생성할 필요가 없습니다.
  • GKE는 새 워크로드에 대한 추천을 생성하기 전에 최대 3일 동안 기다릴 수 있습니다.

비용 또는 절감액 추정치 이해하기

가능하면 GKE의 추천에는 워크로드의 크기를 적절하게 조정할 경우의 월간 비용 또는 절감액을 예측하는 추정치가 포함됩니다. 이 추정치는 지난 30일간의 워크로드 CPU 및 메모리 비용과 결합된 요청 값의 가중 평균을 기반으로 한 워크로드 비용에서 도출됩니다.

예상 비용 또는 절감액은 이전 지출을 기반으로 한 예상치이며 향후 비용 또는 절감액을 보장하지 않습니다.

이러한 추정치를 보려면 다음 사항을 확인하세요.

  • 지출 정보를 가져오는 데 필요한 billing.accounts.getSpendingInformation 권한이 있습니다. 자세한 내용은 Cloud Billing 액세스를 참고하세요.
  • 클러스터에 GKE 비용 할당이 사용 설정되어 있습니다. 자세한 내용은 GKE 비용 할당 사용 설정을 참고하세요.

네임스페이스 및 워크로드를 기반으로 한 더 세부적인 분석을 비롯하여 모든 GKE 클러스터의 비용에 관한 자세한 내용은 GKE 리소스 할당 및 클러스터 비용에 관한 주요 지출 통계 보기를 참고하세요.

GKE 클러스터 실행 비용에 대한 자세한 내용은 GKE 가격 책정을 참조하세요.

워크로드의 크기 조정 시 고려사항

워크로드를 확장하거나 축소하라는 권장사항을 따르기 전에 다음 사항을 고려하세요.

  • 워크로드의 리소스 사용률을 검토하여 성능을 확인하고 예상보다 CPU와 메모리를 더 많이 또는 더 적게 사용하는지 확인합니다. 자세한 내용은 리소스 요청 분석을 참고하세요.
  • 일괄 처리 워크로드는 비용 효율성을 위해 의도적으로 높은 사용률을 유지할 수 있습니다. 할당된 리소스가 일괄 작업에 충분한 경우 프로비저닝 부족으로 식별된 사용률이 높은 워크로드를 확장할 필요가 없습니다.
  • GKE는 Java Virtual Machine (JVM) 기반 워크로드의 실제 메모리 사용량에 대한 공개 상태가 제한적입니다. 이러한 유형의 워크로드에 권장사항을 적용하기 전에 신중하게 검토하세요.

워크로드의 크기 조정 추천 구현

다음 중 한 가지를 실행하여 워크로드의 리소스 사용률에 더 적합하도록 워크로드의 크기를 조정할 수 있습니다.

  • 워크로드에 수직형 포드 자동 확장을 사용 설정합니다. 자세한 내용은 자동으로 포드 리소스 요청 설정을 참고하세요.
  • 권장사항에 따라 요청 및 한도를 수동으로 변경합니다.

    • 과소 프로비저닝된 워크로드: 과소 프로비저닝된 워크로드의 크기를 적절하게 조정하라는 권장사항을 구현하려면 워크로드의 리소스 요청 및 한도를 늘리세요. 이 권장사항을 구현하면 애플리케이션에 적절한 양의 리소스가 있으므로 워크로드의 안정성을 유지할 수 있습니다.
    • 초과 프로비저닝된 워크로드: 초과 프로비저닝된 워크로드의 크기를 적절하게 조정하라는 권장사항을 구현하려면 워크로드의 리소스 요청 및 한도를 줄이세요. 워크로드 요구사항에 맞게 클러스터 CPU 및 메모리 할당을 조정합니다. 이 권장사항을 구현하면 워크로드를 실행하는 데 필요한 리소스만 사용할 수 있습니다.

다음 단계