Well-Architected 프레임워크의 안정성 부문에 있는 이 원칙은 사용자 경험을 평가한 다음 발견 사항을 안정성 목표 및 측정항목에 매핑하는 데 도움이 됩니다.Google Cloud
이 원칙은 안정성의 범위 지정 중점사항 과 관련이 있습니다.
원칙 개요
모니터링 가능성 도구는 많은 양의 데이터를 제공하지만 모든 데이터가 사용자에게 미치는 영향과 직접적인 관련이 있는 것은 아닙니다. 예를 들어 CPU 사용량이 높거나 서버 작업이 느리거나 작업이 비정상 종료될 수도 있습니다. 하지만 이러한 문제가 사용자 경험에 영향을 미치지 않는다면 중단으로 간주되지 않습니다.
사용자 경험을 측정하려면 내부 시스템 동작과 사용자 대상 문제를 구분해야 합니다. 사용자 요청의 성공률과 같은 측정항목에 집중하세요. 서비스의 안정성에 관한 잘못된 결론을 내릴 수 있는 CPU 사용량과 같은 서버 중심 측정항목에만 의존하지 마세요. 진정한 안정성은 사용자가 애플리케이션 또는 서비스를 일관되고 효과적으로 사용할 수 있음을 의미합니다.
권장사항
사용자 경험을 효과적으로 측정하려면 다음 섹션의 권장사항을 고려하세요.
사용자 경험 측정
서비스의 안정성을 제대로 파악하려면 사용자의 실제 경험을 반영하는 측정항목의 우선순위를 지정하세요. 예를 들어 사용자의 쿼리 성공률, 애플리케이션 지연 시간, 오류율을 측정합니다.
이상적으로는 사용자 기기 또는 브라우저에서 이 데이터를 직접 수집합니다. 이러한 직접 데이터 수집이 불가능한 경우 시스템에서 사용자로부터 측정 지점을 점진적으로 더 멀리 이동합니다. 예를 들어 부하 분산기 또는 프런트엔드 서비스를 측정 지점으로 사용할 수 있습니다. 이 접근 방식을 사용하면 이러한 문제가 사용자에게 큰 영향을 미치기 전에 문제를 식별하고 해결할 수 있습니다.
사용자 여정 분석
사용자가 시스템과 상호작용하는 방식을 이해하려면 Cloud Trace와 같은 추적 도구를 사용하면 됩니다. 애플리케이션을 통해 사용자의 여정을 추적하면 사용자 경험을 저하시킬 수 있는 병목 현상과 지연 시간 문제를 찾을 수 있습니다. Cloud Trace는 서비스 아키텍처의 각 홉 에 관한 세부 성능 데이터를 캡처합니다. 이 데이터를 사용하면 성능 문제를 더 효율적으로 식별하고 해결할 수 있으므로 더 안정적이고 만족스러운 사용자 경험을 제공할 수 있습니다.