GKE의 확장성 문제 해결

etcd 데이터베이스의 사용량이 많으면 클러스터가 불안정해지고 리소스가 부족해져 Google Kubernetes Engine (GKE) 클러스터가 효과적으로 확장되지 않을 수 있습니다.

이 문서를 사용하여 etcd 사용량이 한도에 도달한 클러스터를 식별하고 공간을 확보하기 위한 추천을 찾아 클러스터가 안정적으로 유지되도록 하는 방법을 알아보세요.

이 정보는 GKE 클러스터의 상태와 확장성을 유지관리하는 플랫폼 관리자 및 운영자에게 중요합니다. Google Cloud 콘텐츠에서 참조하는 일반적인 역할 및 예시 태스크에 대해 자세히 알아보려면 일반 GKE 사용자 역할 및 태스크를 참고하세요.

이 문서에서는 높은 etcd 사용량과 관련된 클러스터 안정성 문제 해결 방법을 설명합니다. 다른 확장성 문제가 발생한 경우 다음 문서 중 하나가 도움이 될 수 있습니다.

etcd 사용량이 한도에 도달한 클러스터 식별

GKE는 etcd 사용량이 한도에 도달하는 시나리오에 대한 인사이트와 추천을 제공합니다. 다음과 같은 방법으로 인사이트와 추천을 확인할 수 있습니다.

  • Google Cloud 콘솔을 사용합니다. Kubernetes 클러스터 페이지로 이동합니다. 특정 클러스터의 알림 열에서 공간을 확보하여 클러스터 불안정성의 위험을 줄이세요 추천을 확인합니다.
  • ETCD_DB_USAGE_APPROACHING_LIMIT 추천자 하위 유형을 지정하여 gcloud CLI 또는 Recommender API를 사용합니다.

    이 추천을 쿼리하려면 다음 명령어를 실행하세요.

    gcloud recommender recommendations list \
        --recommender=google.container.DiagnosisRecommender \
        --location=LOCATION \
        --project=PROJECT_ID \
        --format=yaml \
        --filter="recommenderSubtype:ETCD_DB_USAGE_APPROACHING_LIMIT"
    

이 추천을 구현하려면 etcd에서 불필요한 데이터를 삭제하여 여유 공간을 확보하세요. 이전 리소스를 삭제하거나 etcd에서 대규모 객체를 이동하는 방법이 있습니다. 자세한 내용은 대규모 GKE 클러스터 계획을 참조하세요.

객체 유형별 스토리지 사용량이 한도에 도달한 클러스터 식별

GKE는 유형별 etcd 객체의 총 크기가 한도에 도달하는 시나리오에 대한 인사이트와 추천을 제공합니다. 다음과 같은 방법으로 인사이트와 추천을 확인할 수 있습니다.

  • Google Cloud 콘솔을 사용합니다. Kubernetes 클러스터 페이지로 이동합니다. 특정 클러스터의 알림 열에서 리소스 유형의 크기 줄이기 추천을 확인합니다.
  • APISERVER_RESOURCE_TYPE_SIZE_EXCEEDS_LIMIT 추천자 하위 유형을 지정하여 gcloud CLI 또는 Recommender API를 사용합니다.

    이 추천을 쿼리하려면 다음 명령어를 실행하세요.

    gcloud recommender recommendations list \
        --recommender=google.container.DiagnosisRecommender \
        --location=LOCATION \
        --project=PROJECT_ID \
        --format=yaml \
        --filter="recommenderSubtype:APISERVER_RESOURCE_TYPE_SIZE_EXCEEDS_LIMIT"
    

    삭제할 객체를 결정하려면 kubectl을 사용하여 객체를 나열하면 됩니다. 예를 들어 ConfigMap이 스토리지 한도에 가까워지면 다음 명령어가 모든 네임스페이스의 모든 ConfigMap을 출력하여 삭제할 후보를 식별하는 데 도움이 됩니다.

    kubectl get configmaps --all-namespaces > new_file.txt
    

이 추천을 구현하고 공간을 확보하려면 스토리지에서 지정된 유형의 불필요한 객체를 삭제하세요. 이 과정에는 이전 리소스를 삭제하거나 스토리지에서 대규모 객체를 이동하는 방법이 있습니다. 자세한 내용은 대규모 GKE 클러스터 계획을 참조하세요.

다음 단계

  • 문서에서 문제 해결 방법을 찾을 수 없으면 지원 받기를 참조하여 다음 주제에 대한 조언을 포함한 추가 도움을 요청하세요.