안정성에 관한 현실적인 타겟 설정

Last reviewed 2024-12-30 UTC

Well-Architected Framework의 안정성 부문에서 이 원칙을 따르면 워크로드에 기술적으로 실현 가능한 안정성 목표를 정의할 수 있습니다.Google Cloud Google Cloud

이 원칙은 안정성의 범위 지정 중점사항 과 관련이 있습니다.

원칙 개요

사용자가 만족할 만큼 안정적인 시스템을 설계하세요. 직관에 반하는 것처럼 보일 수 있지만 안정성 100% 를 목표로 하는 것은 가장 효과적인 전략이 아닌 경우가 많습니다. 안정성을 높이면 재정적 투자와 혁신에 대한 잠재적 제한 측면에서 비용이 크게 증가할 수 있습니다. 사용자가 현재 서비스 수준에 이미 만족하고 있다면 만족도를 더 높이기 위한 노력은 투자수익률이 낮을 수 있습니다. 대신 다른 곳에 리소스를 더 잘 사용할 수 있습니다.

사용자가 만족하는 안정성 수준을 결정하고, 점진적인 개선 비용이 이점을 능가하는 지점을 결정해야 합니다. 이러한 sufficient reliability 수준을 결정하면 리소스를 전략적으로 할당하고 사용자에게 더 큰 가치를 제공하는 기능과 개선사항에 집중할 수 있습니다.

권장사항

현실적인 안정성 목표를 설정하려면 다음 하위 섹션의 권장사항을 고려하세요.

일부 장애를 허용하고 구성요소의 우선순위 지정

업타임 99.99% 와 같은 고가용성을 목표로 하되 업타임 100%를 목표로 설정하지 마세요. 일부 장애는 불가피하다는 점을 인정하세요.

업타임 100% 와 99.99% 목표 간의 차이는 장애 허용 범위입니다. 이 차이를 흔히 오류 예산 이라고 부릅니다. 오류 예산을 사용하면 위험을 감수하고 혁신할 수 있으며, 이는 모든 비즈니스가 경쟁력을 유지하는 데 기본입니다.

시스템에서 가장 중요한 구성요소의 안정성을 우선시하세요. 중요도가 낮은 구성요소는 장애 허용 범위가 더 클 수 있다는 점을 인정하세요.

안정성과 비용의 균형

시스템의 최적 안정성 수준을 결정하려면 철저한 비용 편익 분석을 실시하세요.

시스템 요구사항, 장애의 결과, 특정 애플리케이션에 대한 조직의 위험 허용 범위와 같은 요소를 고려하세요. 복구 시간 목표 (RTO) 및 복구 지점 목표 (RPO)와 같은 재해 복구 측정항목을 고려해야 합니다 . 예산 및 기타 제약 조건 내에서 허용되는 안정성 수준을 결정하세요.

필수 안정성 기능을 저해하지 않으면서 효율성을 개선하고 비용을 절감할 수 있는 방법을 찾아보세요.