과소 프로비저닝 및 초과 프로비저닝된 워크로드 식별

이 문서에서는 통계 및 추천을 사용하여 Google Kubernetes Engine (GKE) 클러스터에서 실행되는 과소 프로비저닝된 워크로드와 초과 프로비저닝된 워크로드를 식별하는 방법을 설명합니다. 식별된 워크로드에 수직 확장 또는 축소 추천이 도움이 되는지 확인한 후 추천된 변경사항을 적용하여 비용을 절감하거나 워크로드의 안정성을 높일 수 있습니다. 가능한 경우 추천에는 예상되는 월간 절감액 또는 비용이 포함됩니다. 자세한 내용은 비용 또는 절감액 추정치 이해하기를 참조하세요.

GKE는 Autopilot 클러스터와 Standard 클러스터 모두에서 실행되는 워크로드에 관한 이러한 통계를 제공합니다. GKE는 전체 클러스터에 대해서도 유사한 추천을 제공합니다. 자세한 내용은 과소 프로비저닝 및 초과 프로비저닝된 GKE 클러스터 식별을 참조하세요.

GKE는 클러스터를 모니터링하고 Active Assist( Google Cloud에서 리소스 사용에 대한 통계와 추천을 생성하는 추천자를 제공하는 서비스)를 통해 사용량을 최적화하는 방법에 대한 안내를 제공합니다. 통계 및 추천을 관리하는 방법에 대한 자세한 내용은 통계 및 추천으로 GKE 사용 최적화를 참조하세요.

과소 프로비저닝된 워크로드 및 초과 프로비저닝된 워크로드에 대한 통계 및 추천 받기

Google Cloud CLI 또는 Recommender API를 통해 이러한 통계와 추천을 받을 수 있습니다. 각 안내에 따라 통계 와 추천을 보고 WORKLOAD_UNDERPROVISIONEDWORKLOAD_OVERPROVISIONED 하위 유형을 사용하여 필터링합니다.

과소 프로비저닝된 워크로드 또는 초과 프로비저닝된 워크로드를 식별한 후에는 크기 조정 시 고려사항을 참고하세요. 워크로드

GKE에서 과소 프로비저닝된 워크로드 및 초과 프로비저닝된 워크로드를 식별하는 방법

다음 표에서는 GKE가 축소 또는 확장할 수 있는 과소 프로비저닝 및 초과 프로비저닝 워크로드를 식별하는 데 사용하는 신호와 각 신호의 기준점을 설명합니다. 또한 이 표에는 이 시나리오에서 취하는 것이 좋은 조치가 나와 있습니다.

하위 유형 신호 관찰 기간 세부정보 권장사항
WORKLOAD_UNDERPROVISIONED CPU 또는 메모리 사용량이 높음 지난 15일 지난 15일 동안 CPU 또는 메모리 사용률이 10% 이상 150% 를 초과하는 경우 워크로드가 과소 프로비저닝됩니다. 워크로드를 확장하여 안정성 높이기
WORKLOAD_OVERPROVISIONED CPU 또는 메모리 사용량이 낮음 지난 15일 지난 15일 동안 CPU 또는 메모리 사용률이 90% 이상 50% 미만인 경우 워크로드가 초과 프로비저닝됩니다. 워크로드를 축소하여 비용 절감

GKE는 다음 가이드라인을 사용하여 통계와 추천을 제공할 시점을 결정합니다.

  • 이 측정항목을 사용하면 간섭이 발생할 수 있으므로 GKE는 수평형 포드 자동 확장 처리 (HPA)의 타겟 측정항목에 대한 추천을 생성하지 않습니다.
  • 수직형 포드 자동 확장 처리 (VPA)가 사용 설정된 경우 요청 값이 자동으로 관리되며 GKE는 추천을 생성할 필요가 없습니다.
  • GKE는 새 워크로드에 대한 추천을 생성하기 전에 최대 3일 동안 기다릴 수 있습니다.

비용 또는 절감액 추정치 이해하기

가능한 경우 GKE의 추천에는 워크로드의 크기를 적절하게 조정할 경우 월간 비용 또는 절감액을 예측하는 추정치가 포함됩니다. 이 추정치는 지난 30일 동안 워크로드의 CPU 및 메모리 비용과 결합된 요청 값의 가중 평균을 기반으로 워크로드 비용에서 도출됩니다.

예상 비용 또는 절감액은 이전 지출을 기반으로 한 예상치이며 향후 비용 또는 절감액을 보장하지 않습니다.

이러한 추정치를 보려면 다음이 참인지 확인하세요.

  • 지출 정보를 가져오는 데 필요한 billing.accounts.getSpendingInformation 권한이 있습니다. 자세한 내용은 Cloud Billing 액세스를 참조하세요.
  • 클러스터에 GKE 비용 할당이 사용 설정되어 있습니다. 자세한 내용은 GKE 비용 할당 사용 설정을 참조하세요.

네임스페이스 및 워크로드를 기반으로 한 더 세부적인 분석을 비롯하여 모든 GKE 클러스터의 비용에 관한 자세한 내용은 GKE 리소스 할당 및 클러스터 비용에 관한 주요 지출 통계 보기를 참조하세요.

GKE 클러스터 실행 비용에 대한 자세한 내용은 GKE 가격 책정을 참조하세요.

워크로드 크기 조정 시 고려사항

워크로드를 확장 또는 축소하는 추천을 따르기 전에 다음을 고려하세요.

  • 워크로드의 리소스 사용률을 검토하여 워크로드의 성능과 예상보다 CPU 및 메모리를 더 많이 또는 더 적게 사용하는지 확인합니다. 자세한 내용은 리소스 요청 분석을 참조하세요.
  • 일괄 처리 워크로드는 비용 효율성을 위해 의도적으로 높은 사용률을 유지할 수 있습니다. 할당된 리소스가 일괄 작업에 충분한 경우 과소 프로비저닝된 것으로 식별된 사용률이 높은 워크로드를 수직 확장할 필요가 없습니다.
  • GKE는 Java Virtual Machine (JVM) 기반 워크로드의 실제 메모리 사용량에 대한 공개 상태가 제한적입니다. 이러한 유형의 워크로드에 대한 추천을 적용하기 전에 추가로 검토하세요.

워크로드 크기를 적절하게 조정하는 추천 구현

다음 중 하나를 수행하여 워크로드의 크기를 워크로드의 리소스 사용률에 더 적합하게 조정할 수 있습니다.

  • 워크로드에 수직형 포드 자동 확장 처리를 사용 설정합니다. 자세한 내용은 포드 리소스 요청 자동 설정을 참조하세요.
  • 추천에 따라 요청 및 한도를 수동으로 변경합니다.

    • 과소 프로비저닝된 워크로드: 과소 프로비저닝된 워크로드의 크기를 적절하게 조정하는 추천을 구현하려면 워크로드의 리소스 요청 및 한도를 늘립니다. 이 추천을 구현하면 워크로드에 애플리케이션에 적합한 양의 리소스가 있으므로 워크로드의 안정성을 유지하는 데 도움이 됩니다.
    • 초과 프로비저닝된 워크로드: 초과 프로비저닝된 워크로드의 크기를 적절하게 조정하는 추천을 구현하려면 워크로드의 리소스 요청 및 한도를 줄입니다. 워크로드 요구사항에 맞게 클러스터 CPU 및 메모리 할당을 조정합니다. 이 추천을 구현하면 워크로드를 실행하는 데 필요한 리소스만 사용할 수 있습니다.

다음 단계